智源发布 Emu3.5 多模态世界大模型-IT新闻-PHP中文网

智源发布 Emu3.5 多模态世界大模型

心靈之曲

发布： 2025-10-30 18:59:10

原创

500人浏览过

北京智源人工智能研究院近日正式推出其最新一代多模态世界模型——emu3.5，首次将自回归式的“下一状态预测”（next-state prediction, nsp）机制应用于多模态序列建模中，标志着智能系统在跨模态理解与生成方面迈出了关键一步。

智源发布 Emu3.5 多模态世界大模型

Emu3.5的核心创新在于构建了一个统一的NSP框架。该模型将文本、图像、动作指令等不同模态的信息视为一个连续的状态序列，通过预测“下一个状态”来驱动整个推理过程，实现端到端的智能决策。这一机制赋予模型不仅理解当前情境的能力，更具备预判后续变化并自主规划最优行为路径的潜力。

举例来说，当用户发出指令：“把这张照片中的咖啡杯移到桌子右边，并调亮整体色调”，Emu3.5能够准确识别图像中的对象及其空间关系，随后分步执行移动操作和色彩调整，确保每一阶段的输出都符合现实物理规律与视觉连贯性。

实际测试表明，Emu3.5在多个维度展现出卓越表现：

创想C2C多用户商城系统

创想C2C商城系统，系统功能仿照淘宝设计，采用模块标签技术和静态html生成技术基于Asp.Net/C#+SQL的开发的创想多用户商城系统，具有智能化、高扩展、稳定安全等特性，后台可自由添加频道，自由修改界面风格，商品无限级分类，支持在线支付整合，通过安装和使用创想C2C商城系统，就可以轻松建立起专业大型的网上交易平台。创想C2C多用户商城系统5.6.3.8版本升级功能1.网站地区设置功能的增