英伟达研究团队近日正式对外开源了全新基础模型——nitrogen。据官方介绍,nitrogen 是一款统一的“视觉到动作”模型,能够直接从原始游戏画面帧中理解内容并实时输出对应的手柄操作指令,实现端到端的游戏交互。

该模型以“玩游戏”为根本训练目标,覆盖范围极为广泛,涵盖《巫师3:狂猎》《赛博朋克2077》等在内的1000余款游戏,类型横跨RPG、竞速、大逃杀(吃鸡)、2D平台及3D开放世界等多种游戏形态。
NitroGen 的研发初衷并非单纯追求更高胜率或更优游戏表现的“AI玩家”,而是致力于探索一种更具泛化能力的具身智能训练路径——即在海量、多样化的虚拟仿真环境中,习得跨越不同物理规则与交互逻辑的通用运动控制策略。
研究人员观察到,原本为机器人控制任务设计的 GR00T N1.5 模型,在未经显著调整的前提下,便能在机制迥异的各类游戏中展现出极强的任务迁移能力,这为 NitroGen 的架构设计提供了关键启发。

NitroGen 的核心构成包含三大要素:
该数据集囊括800多款游戏,其中每款均提供不少于1小时的高质量行为轨迹;另有15款热门游戏的数据时长突破1000小时。值得一提的是,NitroGen 实现了全栈式开源:预训练权重、完整动作标注数据集、训练与推理代码、以及详尽的技术白皮书全部开放。
项目主页:https://www.php.cn/link/dd31058a4e2ad163eb0c08c07dea8dfb
源码地址:点击下载
以上就是英伟达开源 NitroGen,统一的视觉到行动模型的详细内容,更多请关注php中文网其它相关文章!
每个人都需要一台速度更快、更稳定的 PC。随着时间的推移,垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是,许多工具可以让 Windows 保持平稳运行。
Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号