智元机器人 GO-1 通用具身基座大模型全面开源-IT新闻-PHP中文网

智元机器人 GO-1 通用具身基座大模型全面开源

碧海醫心

发布： 2025-09-23 13:12:02

原创

738人浏览过

智元机器人 go-1 （genie operator-1）通用具身基座大模型宣布全面开源。

“这标志着全球首个采用Vision-Language-Latent-Action (ViLLA)架构的通用具身智能模型向全球开发者免费开放，将极大降低具身智能的技术门槛，推动行业快速发展。”

根据介绍，GO-1采用的Vision-Language-Latent-Action (ViLLA)架构是具身智能领域的重大技术突破。与传统的Vision-Language-Action (VLA)架构相比，ViLLA通过引入隐式动作标记，成功弥合了图像-文本输入与机器人执行动作之间的语义鸿沟。这一创新使得机器人能够更好地理解人类意图，并将其转化为精确的动作执行。

ViLLA架构的核心在于其三层协同设计。VLM多模态理解层基于InternVL-2B构建，能够处理多视角视觉图片、力觉信号、语言输入等多模态信息，为整个系统提供强大的场景感知和指令理解能力。Latent Planner隐式规划器通过预测隐式动作标记，实现了对复杂操作任务的高层次规划和理解。Action Expert动作专家则基于扩散模型，能够生成高频率、高精度的连续动作序列，确保机器人能够执行精细的操控任务。

智元机器人 GO-1 通用具身基座大模型全面开源