
麻省理工学院计算机科学与人工智能实验室(CSAIL)联合丰田研究院近日发布了一项创新的生成式 AI 技术——“可引导场景生成”(steerable scene generation),旨在增强机器人在复杂环境中的学习能力。该工具能够构建高度逼真的虚拟空间,如厨房、客厅和餐厅等室内场景,供研究人员测试机器人执行现实世界任务的表现。
这一平台基于超过4400万个3D房间数据进行训练,具备独特的“可引导性”,其核心技术是一种名为“蒙特卡洛树搜索”(Monte Carlo Tree Search, MCTS)的决策算法。通过MCTS,AI系统能够在生成场景时动态评估多种可能性,选择最优路径以达成特定目标,例如提升场景的真实感或增加物体密度。这种方法使模型在迭代过程中持续优化,逐步生成更加复杂且符合需求的环境结构。
MIT博士生、CSAIL研究员尼古拉斯・帕夫(Nicholas Pfaff)指出,这是首次将MCTS应用于场景生成领域,并将整个生成过程建模为一个“序列决策问题”。“我们不是一次性完成场景构建,而是逐步完善,每一步都朝着更理想的结果推进。”他表示,“相比传统的扩散模型,MCTS生成的场景在结构和语义层次上更为丰富。”
业内专家认为,这项研究有望解决机器人训练中长期存在的瓶颈——高质量、多样化训练数据的稀缺。亚马逊机器人应用科学家杰里米・比纳吉亚(Jeremy Binagia)评价道:“这种可引导的生成方式不仅提升了场景的物理合理性,还打开了创造更具挑战性和多样性的训练环境的大门。”
研究团队强调,该系统的最大优势在于能为工程师提供大量定制化、任务导向且贴近现实的虚拟场景。帕夫解释说:“我们的方法不仅能生成视觉上真实的环境,还能确保这些场景服务于具体的机器人任务需求,从而显著提升训练效率和泛化能力。”
目前,该项目仍处于概念验证阶段。未来,团队计划扩展支持的对象种类和环境类型,并探索使用生成式AI直接创建全新3D资产的能力,而非仅依赖预设模型库。通过不断提升虚拟环境的多样性与真实度,研究人员也希望吸引更广泛的用户群体参与,共同构建开放的数据生态,为机器人掌握更广泛的实际技能提供坚实基础。
以上就是麻省理工推出可调节的生成 AI 工具,助力机器人虚拟训练的详细内容,更多请关注php中文网其它相关文章!
 
                        
                        每个人都需要一台速度更快、更稳定的 PC。随着时间的推移,垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是,许多工具可以让 Windows 保持平稳运行。
 
                Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号