首页 > 新闻 > IT新闻 > 正文

Xiaomi MiMO 大模型负责人罗福莉:MiMo-V2-Flash 是 AGI 路线图中的第二步

心靈之曲
发布: 2025-12-17 16:45:07
原创
209人浏览过

今日上午,在小米2025人车家全生态合作伙伴大会上,xiaomi mimo大模型团队负责人罗福莉完成加盟小米后的首次公开亮相,并正式推出并开源全新moe架构大模型——mimo-v2-flash。

Xiaomi MiMO 大模型负责人罗福莉:MiMo-V2-Flash 是 AGI 路线图中的第二步

Xiaomi MiMO 大模型负责人罗福莉:MiMo-V2-Flash 是 AGI 路线图中的第二步

罗福莉随后在社交平台同步分享了关于MiMo-V2-Flash的核心技术细节:

MiMo-V2-Flash 已全面开放。这仅是我们通向通用人工智能(AGI)征程中的第二站,但其中若干关键工程决策,值得在此简要记录。

架构设计:

我们最终选定 Hybrid SWA(混合滑动窗口注意力)方案。该方案兼具简洁性与高效性,在内部长文本推理基准测试中,显著超越各类线性注意力(Linear Attention)改进版本。此外,固定 KV cache 的设计极大降低了与现有系统基础设施的集成门槛。
注:窗口长度设为128是经过充分验证的“最优值”(将窗口扩大至512反而导致性能下降);sink tokens 机制不可或缺,切勿省略。

MTP(多Token预测):

Magic AI Avatars
Magic AI Avatars

神奇的AI头像,获得200多个由AI制作的自定义头像。

Magic AI Avatars 47
查看详情 Magic AI Avatars

这一技术在当前高效强化学习(RL)实践中长期被低估。除首层外,MTP仅需极少量微调即可实现较高的 accept length。采用3层MTP结构后,我们在编程类任务中实测 accept length 稳定超过3,推理速度提升约2.5倍。
它有效缓解了小批量 On-Policy RL 场景下因长尾样本导致的 GPU 利用率低下问题。受限于本次发布节奏,MTP暂未嵌入完整 RL 训练流程,但其与 RL 框架天然契合。我们已将3层MTP模块完全开源,便于开发者即插即用。

基于MOPD的后训练策略:

我们引入 Thinking Machine 提出的 On-Policy Distillation(OPD)方法,用于融合多个RL训练所得模型,计算效率跃升明显——仅需传统SFT+RL联合训练流程不到1/50的算力消耗,即可复现教师模型的全部能力。
此路径已初具雏形:学生模型持续迭代进化,终将反哺成为更强大的新教师,从而构建起自我增强的正向循环。

致谢:
致敬我所带领的这支卓越团队。他们在数月之内,将一系列前沿构想从纸面推至稳定可用的工业级系统。


Xiaomi MiMO 大模型负责人罗福莉:MiMo-V2-Flash 是 AGI 路线图中的第二步

来源:https://www.php.cn/link/f0e6cbab5a5b7ea2821b2fe1c39d624a

源码地址:点击下载

以上就是Xiaomi MiMO 大模型负责人罗福莉:MiMo-V2-Flash 是 AGI 路线图中的第二步的详细内容,更多请关注php中文网其它相关文章!

最佳 Windows 性能的顶级免费优化软件
最佳 Windows 性能的顶级免费优化软件

每个人都需要一台速度更快、更稳定的 PC。随着时间的推移,垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是,许多工具可以让 Windows 保持平稳运行。

下载
来源:php中文网
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn
最新问题
开源免费商场系统广告
热门教程
更多>
最新下载
更多>
网站特效
网站源码
网站素材
前端模板
关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号