FlowDirector— 西湖大学联合中南大学推出的视频编辑框架-人工智能-PHP中文网

FlowDirector— 西湖大学联合中南大学推出的视频编辑框架

花韻仙語

发布： 2025-06-18 16:44:11

原创

227人浏览过

flowdirector是由西湖大学agi lab团队与中南大学合作开发的一种无需训练（training-free）的视频编辑框架，旨在通过自然语言指令实现对视频内容的精准修改。该框架直接在数据空间中建模编辑流程，采用常微分方程（ode）驱动的平滑过渡路径，解决了传统基于潜空间逆映射方法所导致的时间不一致和结构失真问题。flowdirector引入了空间注意力流校正（safc）机制，以精确维持非编辑区域的时空一致性，并结合差分平均引导（dag）策略增强语义对齐能力。该框架在多个视频编辑基准测试中表现优异，显著提升了任务执行准确性、时间连续性和背景保护性能，为高效且连贯的视频编辑提供了创新性解决方案。

小微助手

微信推出的一款专注于提升桌面效率的助手型AI工具

249

查看详情

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜
FlowDirector的核心功能

语义级精准编辑：依据自然语言指令对视频内容进行深层次语义修改，例如将“熊”替换为“恐龙”。
保持时空一致性：确保编辑过程中视频的时间连续性和空间结构完整性，避免画面错位或风格混乱。
局部修改与整体保留：利用空间注意力机制，仅针对目标区域进行编辑，同时保留其他部分的原始动态与细节。
免训练高效处理：无需额外训练模型，直接使用预训练的文本到视频（T2V）模型进行编辑，提升效率并降低成本。
多任务支持能力：适用于对象替换、纹理变换、属性调整、对象增删等多种复杂视频编辑任务。

FlowDirector的技术机制

编辑流生成（Editing Flow Generation）：基于已训练的文本到视频（T2V）模型，计算源视频与目标视频之间的速度场差异，构建从原视频到目标视频的编辑路径。通过常微分方程（ODE）驱动的渐进式过渡方式，避免传统潜空间逆映射带来的结构变形问题。
空间注意力流校正（Spatially Attentive Flow Correction, SAFC）：引入注意力驱动的掩码机制，提取与当前编辑任务相关的注意力图，生成掩码以精准限定编辑范围。在整个ODE驱动的编辑流程中，将掩码应用于速度场，锁定无关区域，确保其内容不变。
差分平均引导（Differential Averaging Guidance, DAG）：受分类器自由引导（Classifier-Free Guidance, CFG）启发，通过对多个候选编辑流进行差分信号计算，增强语义对齐能力。基于此差分信号优化编辑轨迹，使结果更贴近目标语义，同时维持结构稳定。