微信公众号讲师中心

首页

文章

后端开发 web前端数据库开发工具 php框架常见问题科技 Java 系统教程电脑教程硬件教程手机教程软件教程游戏教程自媒体新闻

专题

后端开发 web前端数据库开发工具 php框架科技 Java 系统教程电脑教程硬件教程手机教程软件教程游戏教程新闻

AI工具

AI 聊天问答 Agent智能体 AI 文本写作 AI 绘画作图 AI 设计工具 AI 视频创作 AI 音频制作 AI 办公学习 AI 编程开发 Prompt指令

学习

大前端后端开发数据库移动端运维开发计算机基础

编程手册

大前端后端开发数据库移动端运维开发计算机基础

下载

js特效网站源码工具下载类库下载网站素材学习资源插件扩展手机/移动开发手机游戏

搜索

后端开发 web前端数据库开发工具 php框架常见问题科技 Java 系统教程电脑教程硬件教程手机教程软件教程游戏教程

首页 > 科技周边 > 人工智能 > 正文

千帧长视频时代到来！MIT全新扩散算法让任意模型突破时长极限

碧海醫心

发布： 2025-02-26 14:42:20

原创

579人浏览过

2025年，视频生成技术，特别是基于扩散模型的视频生成，持续发展创新，涌现出众多令人惊艳的文生视频和图生视频模型。然而，长视频生成一直是该领域的一大难题。麻省理工学院（mit）团队近期发表的论文《history-guided video diffusion》提出了一种名为diffusion forcing transformer (dfot) 的全新算法，无需改变现有模型架构，即可实现视频生成长度提升近50倍，达到近千帧。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

论文地址：https://www.php.cn/link/70cd9109e88def5e20c6887a8d9af139 项目主页：https://www.php.cn/link/9d0bbb435db57b64859584c8e160a485

生成的视频长度惊人，需截短并降低帧率才能展示。先睹为快：

现有视频扩散模型广泛采用无分类器引导（CFG）来提升采样质量，但通常仅利用首帧信息，忽略了后续帧的重要性。MIT团队的研究表明：历史信息是提升视频生成质量的关键！

该论文通过混合长短历史模型的预测结果，提出了一系列“历史引导”算法，显著提升了视频扩散模型的质量、生成长度、鲁棒性和可组合性。

在X平台上，论文共同一作陈博远分享的研究成果获得了极高的关注度。

谷歌研究科学家George Kopanas高度评价了这项工作，认为其成果令人印象深刻。

核心方法：

四维时代AI开放平台

四维时代AI开放平台

四维时代AI开放平台

四维时代AI开放平台

66

四维时代AI开放平台

论文首先训练了一个能够根据不同历史信息进行去噪预测的视频模型，包括不同长度的历史、历史的不同子集以及特定频率域的历史。然而，现有模型架构缺乏这种灵活性。 DFoT算法巧妙地将Diffusion Forcing中的噪声掩码概念引入视频生成架构，通过控制噪声掩码来实现对任意子序列的预测，无需修改模型架构。

DFoT训练完成后，可以灵活地进行采样。例如，通过控制噪声掩码，可以选择使用前几帧作为条件，或进行无条件生成，或使用特定长度的历史作为条件。

基于此，论文提出了一系列“历史引导”算法，进一步提升了模型性能。

实验结果：

DFoT在Kinetics 600数据集上超越了所有同架构的视频扩散算法，甚至与谷歌的闭源大模型结果不相上下。在RealEstate10K数据集上，DFoT实现了单图生成近千帧的突破性成果。

总结：

DFoT算法及其提出的“历史引导”策略显著提升了视频扩散模型的性能。该研究提供了完整的开源实现和Huggingface在线体验，方便研究者进一步探索。 Huggingface地址：https://www.php.cn/link/af8772553fadf9c4d0e4b49aec689da3

以上就是千帧长视频时代到来！MIT全新扩散算法让任意模型突破时长极限的详细内容，更多请关注php中文网其它相关文章！

相关标签：

谷歌变现 2025年 2025 架构 history 算法 transformer https 视频生成

大家都在看：

研究员：AI或取代绝大部分人类工作讯飞星火web端入口_人工智能平台官网直达链接腾讯朱雀大模型工具朱雀AI检测官网入口链接 deepseekOCR文字识别工具使用门户 deepseek-ocr免注册使用操作指南阶跃星辰推电脑端Agent，功能多体验好解锁工作新可能

最佳 Windows 性能的顶级免费优化软件

最佳 Windows 性能的顶级免费优化软件

每个人都需要一台速度更快、更稳定的 PC。随着时间的推移，垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是，许多工具可以让 Windows 保持平稳运行。

来源：php中文网

上一篇：小米双Ultra发布会明天召开至少五大旗舰新品同台发布下一篇：500万TPM+20msTPOT，火山引擎用「AI云原生」重构大模型部署范式

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

最新问题

即梦AI官方正版免费体验入口即梦AI网页版免安装使用即梦AI官方正版免费体验入口是https://jimeng.jianying.com/，用户可直接通过网页端登录使用，无需下载客户端，支持手机号注册并赠送免费积分，提供文生图、AI视频生成、数字人动作模仿等功能。

2025-11-10 00:31:18

857

即梦忘记密码了怎么办_即梦密码找回操作指南可通过“忘记密码”功能，使用绑定邮箱接收重置链接来重设密码；首次登录建议用邮箱注册并启用双重验证保障安全。

2025-11-09 23:55:35

383

deepseekOCR在线识别服务使用地址 deepseek-ocr免登录使用稳定通道 deepseekOCR在线识别服务使用地址为http://60.171.65.125:30402，该平台支持多格式图像输入、高精度文字识别，无需登录即可使用，具备批量处理、快速响应、界面直观等优势，基于先进视觉模型和自动语言检测技术，适合各类用户高效提取文本。

2025-11-09 23:51:02

992

OpenAI使用费用怎么计算_OpenAI使用费用计费方式与省钱技巧分享费用超预期主因是Token计费机制理解不足，OpenAI按输入和输出Token分别计费，需通过精简提示词、限制输出长度、使用缓存等措施控制成本。

2025-11-09 23:45:35

156

文心一言登录入口解析文心一言账号快速登录入口文心一言登录入口位于官网右上角，点击“登录”后可通过手机号验证码、邮箱或用户名密码快速登录，新用户可注册账号，支持多端同步及生物识别登录，登录后可使用内容创作、逻辑推理等功能。

2025-11-09 23:36:09

442

即梦的移动端和网页端功能有差异吗_即梦移动端与网页端功能对比即梦AI移动端与网页端功能存在差异：网页端支持完整的智能画布、高级参数设置及云端高性能处理，适合专业创作；移动端则简化了复杂操作，保留基础扩图与核心生成功能，便于快捷使用，但缺乏多图层控制、模型切换及离线能力，且受设备性能限制。

2025-11-09 23:35:02

368

即梦的会员值得购买吗_即梦会员价值分析即梦AI会员提供更快生成速度、高清2K与视频3.0Pro功能及无水印导出，长期使用降低单次成本，适合高频创作者，但需注意自动续费条款。

2025-11-09 23:33:02

630

OpenAI怎么连接第三方工具_OpenAI与第三方工具集成方法与实用案例通过API接口、函数调用、Zapier/Make平台或中间件服务，可实现OpenAI与第三方工具集成，支持实时数据获取、智能决策与流程自动化，提升模型实用性与系统安全性。

2025-11-09 23:17:02

857

即梦如何注销我的账户_即梦账户注销流程登录账户后进入设置页面，找到“注销账户”选项并验证身份，按提示完成注销流程即可成功注销即梦账户。

2025-11-09 22:48:03

762

即梦如何对生成的图片进行局部重绘_即梦图片局部重绘操作教程即梦可通过局部重绘功能精准修改图片区域。首先进入编辑模式，点击局部重绘工具并调节画笔大小，涂抹需修改区域，随后输入具体描述词如“蓝色连衣裙”，最后点击开始重绘，预览满意后保存结果。

2025-11-09 22:24:02

284

相关专题

更多>

热门推荐

开源免费商场系统

广告

热门教程

更多>

相关推荐

热门推荐

最新课程

Python+人工智能全栈工程师(Linux基础篇)

313772次学习
收藏
Node.js-前端工程化必学

28226次学习
收藏
Vue3.x 工具篇--十天技能课堂

11600次学习
收藏

最新下载

更多>

网站特效

网站源码

网站素材

前端模板

关于我们免责申明举报中心意见反馈讲师合作广告合作最新更新 English: php中文网：公益在线php培训，帮助PHP学习者快速成长！; 关注服务号技术交流群

PHP中文网订阅号: 每天精选资源文章推送

PHP中文网APP: 随时随地碎片化学习

Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号

PHP学习

技术支持

返回顶部