VerseCrafter— 复旦联合腾讯开源的动态真实视频世界模型

霞舞

发布时间：2026-01-20 10:59:02

787人浏览过

来源于php中文网

原创

VerseCrafter 是什么

versecrafter 是由复旦大学联合腾讯 pcg arc lab 等单位共同研发的动态真实感视频世界模型，具备先进的 4d 几何建模与控制能力。该模型依托大规模真实世界视频数据集 versecontrol4d 进行训练，可高效建模复杂动态场景，并在时间与空间维度上保持高度一致性。用户可通过设定相机运动路径及目标物体的 3d 轨迹，精准驱动视频生成过程，输出几何结构准确、视觉质量优异的长时序视频，在视频生成、虚拟现实、游戏引擎等方向展现出显著应用潜力。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

VerseCrafter— 复旦联合腾讯开源的动态真实视频世界模型

Sora

Sora是OpenAI发布的一种文生视频AI大模型，可以根据文本指令创建现实和富有想象力的场景。

下载

VerseCrafter 的核心能力

4D 几何可控性：支持用户自定义相机运动轨迹与多个目标物体的 3D 高斯轨迹，实现对画面视角变化与物体动态行为的精细化调控。
多模式控制机制：提供相机独立控制、目标独立控制以及相机-目标协同控制三种方式，适配多样化创作与交互需求。
高保真视频合成：在保障画面自然真实的基础上，严格维持三维几何结构的一致性，有效抑制形变、穿模等常见失真问题。
跨视角内容统一：能够从多个不同视角同步生成语义连贯、几何对齐的视频序列，适用于多人协作、多终端协同等复杂交互场景。
强泛化数据基础：基于 VerseControl4D 数据集训练，覆盖丰富的真实动态与静态场景，显著增强模型对未知环境的适应能力。

VerseCrafter 的技术架构

冻结的 Wan2.1 主干网络：以高性能预训练视频扩散模型 Wan2.1 为基底，保留其强大的时空建模能力；在此基础上引入几何控制信号，不破坏原有生成性能。
GeoAdapter 模块：轻量级几何适配器，负责将 4D 控制指令（含相机路径与 3D 高斯轨迹）编码为多通道空间特征图，并嵌入至 Wan2.1 的各扩散层中，实现端到端可控生成。
4D 控制信号可视化渲染：将输入的相机轨迹与目标轨迹分别渲染为背景 RGB 图、深度图及 3D 高斯轨迹热力图，作为条件引导信号注入模型。
VerseControl4D 数据集构建：从海量真实视频中自动提取精确的相机位姿与目标运动轨迹，构建高质量几何监督信号，支撑模型在动静态混合场景下的鲁棒建模能力。

VerseCrafter 的官方资源

项目主页：https://www.php.cn/link/5282dceffe1d3da5d599abe98cf874de
GitHub 开源仓库：https://www.php.cn/link/fa59dcd8a934426f4894d1f6d87e698d
Hugging Face 模型平台：https://www.php.cn/link/d6cc51aa91643b5087506eb1eb0005bd
arXiv 技术论文：https://www.php.cn/link/54ca3e5a2cebd8681900aa488903e0ad

VerseCrafter 的典型应用场景

虚拟现实（VR）与增强现实（AR）：构建高沉浸感、可自由探索的三维虚拟空间，支持用户通过自然的视角移动与物体交互，大幅提升临场感与操作自由度。
游戏内容生产：快速生成具备物理合理性的动态背景与角色动作序列，优化镜头调度与实时渲染表现，缩短开发周期并降低美术资源成本。
创意视频制作：助力广告、影视、动画等领域创作者高效产出富有表现力的动态影像，满足个性化叙事与视觉实验需求。
教育仿真系统：搭建高拟真度的教学模拟环境，例如历史事件还原、分子运动演示或工程装配演练，强化理解深度与实践参与感。
互动媒体体验：支撑分支剧情类视频、视角可选式短片等新型内容形态，观众能实时操控摄像机或关键对象，主动影响情节发展与观看视角。

Stable Diffusion配置要求是什么 Stable Diffusion电脑配置推荐

Cursor AI 代码编辑器：GitHub 连接与版本控制指南

Stable Diffusion怎么本地部署 Stable Diffusion本地安装教程

Stable Diffusion ControlNet怎么用 ControlNet插件安装使用详解

Stable Diffusion ControlNet怎么用 ControlNet插件安装及骨架图使用【进阶】

相关标签:

git github 编码腾讯 pdf 虚拟现实架构对象事件 github http ar vr 视频生成

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：怎么用ai做数字人_AI虚拟形象创建与驱动实战指南下一篇：无界AI如何融水彩与厚涂插画_无界AI水彩厚涂融法【巧思】

作者最新文章

开挖直径超 12 米：国内首个城市深层排涝工程大直径双模盾构机下线

2026-01-20 10:58

VerseCrafter— 复旦联合腾讯开源的动态真实视频世界模型

2026-01-20 10:59

《马拉松》发售日泄露 2026年3月5日上线

2026-01-20 11:07

把Pro塞进Air里惊叹小薄机荣耀Magic8 Pro Air正式发布

2026-01-20 11:07

Spring Boot 应用压力测试的系统与网络调优指南

2026-01-20 11:07

荣耀史上最强旗舰！荣耀Magic8 RSR图赏

2026-01-20 11:12

视频号如何有效使用话题标签？视频号的话题有什么用？

2026-01-20 11:12

如何正确删除 Go 包的编译缓存文件（.a 文件）

2026-01-20 11:18

4299元起 vivo X300全新配色好运红发布大红机身超喜庆

2026-01-20 11:23

如何在 Node.js 中实现重定向后强制刷新页面

2026-01-20 11:23

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI大模型

开放平台

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI大模型

通义千问

阿里巴巴推出的全能AI助手

AI大模型

腾讯元宝

腾讯混元平台推出的AI助手

文档处理

Excel 表格

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI大模型

中文写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

中文写作

写作工具

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接

图画生成

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI大模型

中文写作

智谱清言 - 免费全能的AI助手

AI大模型

PDF 文档

相关专题

http500解决方法

http500解决方法有检查服务器日志、检查代码错误、检查服务器配置、检查文件和目录权限、检查资源不足、更新软件版本、重启服务器或寻求专业帮助等。本专题为大家提供相关的文章、下载、课程内容，供大家免费下载体验。

369

2023.11.09

http请求415错误怎么解决

解决方法：1、检查请求头中的Content-Type；2、检查请求体中的数据格式；3、使用适当的编码格式；4、使用适当的请求方法；5、检查服务器端的支持情况。更多http请求415错误怎么解决的相关内容，可以阅读下面的文章。

410

2023.11.14

HTTP 503错误解决方法

HTTP 503错误表示服务器暂时无法处理请求。想了解更多http错误代码的相关内容，可以阅读本专题下面的文章。

1940

2024.03.12

http与https有哪些区别

http与https的区别：1、协议安全性；2、连接方式；3、证书管理；4、连接状态；5、端口号；6、资源消耗；7、兼容性。本专题为大家提供相关的文章、下载、课程内容，供大家免费下载体验。

1996

2024.08.16

Java JVM 原理与性能调优实战

本专题系统讲解 Java 虚拟机（JVM）的核心工作原理与性能调优方法，包括 JVM 内存结构、对象创建与回收流程、垃圾回收器（Serial、CMS、G1、ZGC）对比分析、常见内存泄漏与性能瓶颈排查，以及 JVM 参数调优与监控工具（jstat、jmap、jvisualvm）的实战使用。通过真实案例，帮助学习者掌握 Java 应用在生产环境中的性能分析与优化能力。

2026.01.20