讲师中心微信公众号

首页

文章

后端开发 web前端数据库开发工具 php框架常见问题科技 Java 系统教程电脑教程硬件教程手机教程软件教程游戏教程自媒体新闻

专题

后端开发 web前端数据库开发工具 php框架科技 Java 系统教程电脑教程硬件教程手机教程软件教程游戏教程新闻

AI工具

AI 聊天问答 Agent智能体 AI 文本写作 AI 绘画作图 AI 设计工具 AI 视频创作 AI 音频制作 AI 办公学习 AI 编程开发 Prompt指令

学习

大前端后端开发数据库移动端运维开发计算机基础

编程手册

大前端后端开发数据库移动端运维开发计算机基础

下载

js特效网站源码工具下载类库下载网站素材学习资源插件扩展手机游戏

最近更新

首页 > 科技周边 > 人工智能 > 正文

GPDiT— 清华北大联合阶跃星辰等推出的视频生成模型

聖光之護

发布： 2025-05-16 15:22:32

原创

324人浏览过

GPDiT是什么

gpdit（generative pre-trained autoregressive diffusion transformer）是由北京大学、清华大学、stepfun公司以及中国科学技术大学共同研发的一种创新视频生成模型。该模型融合了扩散模型与自回归模型的优点，通过自回归方法来预测未来潜在帧，从而自然地构建运动动态和语义一致性。gpdit还采用了轻量级因果注意力机制以降低计算开销，并提出了一种无需参数的旋转基时间条件策略，这有助于更有效地编码时间信息。gpdit在视频生成、视频表示学习以及少量样本学习等多个任务上都展现了卓越的表现，体现了其在多种视频建模任务中的灵活性与适用性。

剪小映

剪小映

记录美好智能成片，AI智能视频剪辑

剪小映

902

剪小映

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜
GPDiT的主要特点

高品质视频生成：能够创建具有高时间一致性和运动连贯性的长序列视频。
视频表示学习：借助自回归建模与扩散过程，学习视频的语义与动态表示，适用于下游任务。
少量样本学习：能迅速适应各种视频处理任务，例如风格变换、边缘检测等。
多任务处理：支持多种视频处理任务，包括灰度转换、深度估算、人物识别等。

GPDiT的核心技术

自回归扩散架构：利用自回归方式预测未来的潜在帧，从而自然地模拟运动动态和语义一致性。
轻量化因果注意力：引入轻量级因果注意力机制，在训练过程中避免干净帧间的注意力计算，减少了计算负担，同时保持生成质量。
旋转基时间条件方案：提出一种无需参数的旋转基时间条件策略，将噪声注入过程重新定义为数据和噪声分量在复平面上的旋转操作，去除了adaLN-Zero及其相关参数，提高了时间信息编码效率。
连续潜在空间建模：在连续潜在空间内进行建模，提升了生成效果与表示能力。

GPDiT的相关资源

arXiv技术文档：https://www.php.cn/link/3fe89afd10fe28f02efde3670e20da4a

GPDiT的实际应用

视频制作：用于生成高质量视频，应用于广告、电影、动画等领域。
视频编辑：实现风格转换、色彩校正、分辨率增强等功能。
少量样本学习：快速适应人物检测、边缘检测等任务。
内容理解：自动标记、分类并检索视频内容。
创意生成：激发艺术家和设计师的灵感，生成艺术风格视频。

以上就是GPDiT— 清华北大联合阶跃星辰等推出的视频生成模型的详细内容，更多请关注php中文网其它相关文章！

相关标签：

ai 视频编辑架构 transformer http 视频生成视频编辑

大家都在看：

如何用AI快速生成培训课程大纲？让知识分享更系统批改网AI检测工具能否检测口语作业_批改网AI检测工具口语检测入口与操作【实操】批改网ai检测工具如何设置检测通知_批改网ai检测工具通知开关与接收方式【方法】即梦ai怎么生成科幻场景概念图_即梦ai科幻场景生成科技元素添加【技巧】去哪旅行ai抢票助手如何查看抢票状态_去哪旅行ai抢票助手状态查询与结果通知【实操】

最佳 Windows 性能的顶级免费优化软件

最佳 Windows 性能的顶级免费优化软件

每个人都需要一台速度更快、更稳定的 PC。随着时间的推移，垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是，许多工具可以让 Windows 保持平稳运行。

来源：php中文网

上一篇：苹果宣布推出CarPlay Ultra车载系统多品牌计划引入下一篇：AI基础设施公司TensorWave完成1亿美元A轮融资，由AMD等领投

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

作者最新文章

《街头霸王》电影版春丽遭国外女Coser质疑：真的不太好看

2025-12-21 11:16:09
小米17 Ultra代号夜神卢伟冰：绝对是最强Ultra

2025-12-21 11:33:18
《33号远征队》爆了外媒揭示原因：营销太强

2025-12-21 11:34:03
《战地6》或已售出超2000万份！倾听玩家声音立大功

2025-12-21 11:38:13
“痛苦但值得”《神界》或将尽快推出抢先试玩版

2025-12-21 12:28:02
业内人士分析《GTA6》将加入MMORPG元素

2025-12-21 12:30:17
诡异又迷人！《神界》预告片获《神界：原罪2》演员点赞

2025-12-21 12:45:17
《GTA6》评级疑似曝光？比《那个游戏》要低！

2025-12-21 12:55:10
Epic新喜加一出问题！官方回应了

2025-12-21 13:10:03
REDMI Note 15系列新春版发布：三剑齐发 1099元起

2025-12-21 13:42:08

最新问题

DeepSeek打不开或加载失败怎么办_常见网络错误与解决方法当遇到DeepSeek无法打开、持续加载或显示网络错误时，问题通常出在本地网络、浏览器配置、服务器状态或软件冲突等方面。解决方法主要包括：一、检查并优化本地网络连接；二、清理浏览器缓存与数据；三、核实DeepSeek官方服务状态；四、尝试更换浏览器或使用无痕模式；五、排查插件、防火墙及DNS设置。

2025-12-23 13:31:07

509

DeepSeek怎么设置自定义指令_让AI记住你的特定要求教程在DeepSeek中设置自定义指令，可以让AI在每次对话中都遵循您预设的背景信息和回答风格。主要步骤包括：一、找到并进入自定义指令设置入口；二、填写关于“您”的背景信息；三、设定希望AI如何回应的具体规则；四、掌握编写高效指令的技巧；五、学习如何启用、禁用或随时修改这些指令，从而实现高度个性化的AI交互体验。

2025-12-23 13:17:41

634

豆包AI如何生成PPT动画效果_豆包AI动画类型选择与设置技巧【指南】豆包AI生成的PPT内容无自动动画，需在PowerPoint、WPS、即梦AI或Marp等工具中手动添加或联动实现：一、PowerPoint中逐页粘贴并设置动画；二、WPSAI根据语义推荐并批量应用动画；三、即梦AI解析指令生成含时间轴的动态课件；四、Marp+Markdown+CSS导出带CSS动画的HTML/PPTX。

2025-12-23 13:07:28

290

NotionAI如何一键生成项目计划_NotionAI计划生成与里程碑设置【攻略】 NotionAI可自动构建结构化项目计划数据库。通过/ai指令生成含任务、负责人、截止日等字段的数据库；解析非结构化文本批量创建条目；为现有数据标记里程碑；并用AI公式动态计算距下一里程碑天数。

2025-12-23 12:56:02

325

批改网ai检测工具怎么修改检测参数_批改网ai检测工具参数设置说明【指南】批改网AI检测参数可通过教师后台、作业发布页、API接口及清除缓存四种方式调整。教师可登录后台设置语义连贯性等三项维度的敏感度；布置作业时添加[MODE:academic]等指令定制检测逻辑；对接开放平台通过API传入detection_level等JSON参数；还可强制刷新或清除特定Cookie确保新策略生效。

2025-12-23 12:53:12

215

Depseek如何让提示词更易理解_Depseek通俗化提示词编写方法【步骤】 Depseek提示词优化需五步：一、明确主语与动作动词；二、分段嵌入约束条件并符号标记；三、注入同领域示例式引导；四、显式声明输出边界；五、用可验证标准替代抽象修饰词。

2025-12-23 12:31:25

224

Depseek如何写学术提问提示词_Depseek学术类提示词结构与逻辑【攻略】构建DeepSeek学术提示词需四步：一、明确角色与任务，指定身份、产出形式及规范；二、嵌入研究对象、理论、方法、证据四维约束；三、操作化变量，解构构念并标注测量依据；四、激活话语转换，校准术语、句式与模糊词。

2025-12-23 12:29:13

886

高德地图AI怎么查抢票余票_高德AI余票查询与实时更新设置【攻略】高德地图AI查火车余票不显示或不准，需依次启用交通规划Agent和12306查询MCP模块、用标准语句语音触发、关注车次开启推送、验证数据源一致性，并可切换魔搭预测模型作为备用通道。

2025-12-23 12:06:08

752

如何用AI一键生成字体设计 AI创意字体自动生成软件【教程】可借助AI工具快速生成独特字体：一、在线平台如Fontjoy输入文字与风格词实时渲染；二、本地运行FontDiffuser等开源模型；三、用Illustrator2024+的Firefly插件生成可编辑矢量字体；四、用结构化提示词提升质量；五、用FontForge修复兼容性问题。

2025-12-23 11:51:31

547

DeepSeek怎么分享对话链接_生成并分享聊天记录教程在DeepSeek中分享对话，主要有几种方式：一、为完整对话生成公开链接；二、通过截图或复制文本分享特定部分；三、在分享管理中心查看或撤销链接；四、将对话导出为文件格式进行分享。根据不同需求选择合适的方法，可以方便地与他人协作或保存讨论记录。

2025-12-23 11:41:30

149

相关专题

更多>

热门推荐

开源免费商场系统

广告

热门教程

更多>

相关推荐

热门推荐

最新课程

最新下载

更多>

网站特效

网站源码

网站素材

前端模板

关于我们免责申明举报中心意见反馈讲师合作广告合作最新更新: php中文网：公益在线php培训，帮助PHP学习者快速成长！; 关注服务号技术交流群

PHP中文网订阅号: 每天精选资源文章推送

Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号

PHP学习

技术支持

返回顶部