斯坦福大学推出的worldscore,是一个用于评估世界生成模型的统一基准。它将世界生成任务分解成一系列“下一个场景”生成任务,并采用清晰的基于相机轨迹的布局规范,从而实现对不同模型的公平比较。worldscore从可控性、质量和动态性三个维度评估生成世界的优劣。其精心设计的数据集包含3000个测试样本,涵盖了静态和动态、室内和室外、写实和风格化等多种类型的场景。
☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜
WorldScore核心功能
WorldScore的主要优势在于:
WorldScore基于一个庞大的、多样化的数据集,包含动态和静态配置的多媒体数据,适用于图像到视频和图像到3D模型的生成任务。
WorldScore在多个方面超越了现有的基准测试:
| 基准测试 | 示例数量 | 多场景 | 统一性 | 长序列 | 图像条件 | 多风格 | 相机控制 | 3D一致性 |
|---|---|---|---|---|---|---|---|---|
| TC-Bench | 150 | 否 | 否 | 否 | 是 | 否 | 否 | 否 |
| EvalCrafter | 700 | 否 | 否 | 否 | 否 | 否 | 否 | 否 |
| FETV | 619 | 否 | 否 | 否 | 否 | 否 | 否 | 否 |
| VBench | 800 | 否 | 否 | 否 | 否 | 否 | 否 | 否 |
| T2V-CompBench | 700 | 否 | 否 | 否 | 否 | 否 | 否 | 否 |
| Meng et al. | 160 | 否 | 否 | 否 | 否 | 否 | 否 | 否 |
| Wang et al. | 423 | 否 | 否 | 是 | 否 | 否 | 否 | 否 |
| ChronoMagic-Bench | 1649 | 否 | 否 | 否 | 否 | 否 | 否 | 否 |
| WorldModelBench | 350 | 否 | 否 | 否 | 是 | 否 | 否 | 否 |
| WorldScore | 3000 | 是 | 是 | 是 | 是 | 是 | 是 | 是 |
WorldScore的应用场景广泛,包括:
总而言之,WorldScore为世界生成模型的评估提供了一个全面、统一且强大的基准,推动了该领域的研究和发展。
以上就是WorldScore— 斯坦福大学推出的世界生成模型统一评估基准的详细内容,更多请关注php中文网其它相关文章!
每个人都需要一台速度更快、更稳定的 PC。随着时间的推移,垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是,许多工具可以让 Windows 保持平稳运行。
Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号