google deepmind发布了新一代多模态智能体sima2,基于gemini2.5flash-lite模型构建,其任务完成成功率相较前代sima1提升近一倍。该智能体具备在未曾接触的新环境中执行复杂指令的能力,并拥有自我优化机制。目前版本以研究预览形式推出,核心目标是验证实现通用机器人与agi所需的关键能力——高层级的世界理解与推理。

SIMA2延续了使用数百小时游戏视频进行预训练的策略,但首次引入自生成数据闭环系统:当进入新场景时,系统会调用独立的Gemini模型批量生成潜在任务,再通过内部奖励模型对执行轨迹评分,筛选出高质量行为路径用于后续微调。这一机制无需人工标注即可持续提升性能。据研究团队介绍,在《No Man’s Sky》等测试环境中,SIMA2能通过解析环境中的文本、颜色和符号信息,准确执行如“前往红色房屋”或“砍伐树木”之类的指令,甚至可理解由emoji组合构成的抽象命令。

在演示中,DeepMind还将生成式世界模型Genie与SIMA2结合,实时生成高保真的户外环境。智能体能够精准识别长椅、树木、蝴蝶等物体并与其互动。高级研究科学家Jane Wang指出,这种“感知环境→推断意图→规划动作”的完整闭环,正是将虚拟智能体的能力迁移到真实机器人平台所必需的核心行为架构。
值得注意的是,SIMA2专注于高层决策逻辑,不涉及机械臂、轮式底盘等底层运动控制。与此同时,DeepMind正在开发另一条面向实体机器人的基础模型技术路线,两者如何协同尚无明确方案。团队未公布正式版本上线时间,仅表示希望通过当前预览版吸引外部研究者合作,共同探索从虚拟智能体到物理机器人迁移的可行路径。
源码地址:点击下载
以上就是DeepMind 发布 SIMA 2 预览版的详细内容,更多请关注php中文网其它相关文章!
每个人都需要一台速度更快、更稳定的 PC。随着时间的推移,垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是,许多工具可以让 Windows 保持平稳运行。
Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号