首页 > 新闻 > IT新闻 > 正文

OpenBMB 发布并开源 MiniCPM 4.1-8B

花韻仙語
发布: 2025-09-08 17:08:03
原创
191人浏览过

openbmb 发布并开源 minicpm 4.1-8b

OpenBMB 正式发布并开源 MiniCPM4.1-8B,这是业界首个开源的混合推理大语言模型。该模型通过多项系统性创新,实现了在端侧设备上的极致高效运行,并支持深度推理与常规模式之间的一键自由切换。

该模型在 8B 参数量级下,从模型架构、训练数据、训练算法到推理系统四大层面进行深度优化,全面提升了端侧部署的可行性与性能表现。

核心优势

  • 全球首个原生稀疏架构的深度推理模型,引入可训练的稀疏注意力机制 InfLLM v2,在代码生成、数学推导等复杂任务中,推理速度较同规模开源模型提升超 3 倍
  • 在涵盖知识理解、逻辑推理、编程能力、指令执行等 15 项评测基准中,综合得分位居 8B 级别模型首位
  • 创新性支持“双频换挡”机制:处理长文本时启用稀疏模式,短文本则切换至稠密模式,兼顾效率与精度
  • 极致端侧适配,在 128K 超长上下文场景下,所需缓存空间仅为 Qwen3-8B 的 25%,大幅降低硬件资源消耗

OpenBMB 发布并开源 MiniCPM 4.1-8B

OpenBMB 发布并开源 MiniCPM 4.1-8B

OpenBMB
OpenBMB

OpenBMB 让大模型飞入千家万户

OpenBMB 151
查看详情 OpenBMB

MiniCPM4.1-8B 搭载升级版 InfLLM v2 稀疏注意力技术,在处理 128K 长文本时,每个 token 仅需与不足 5% 的历史 token 进行注意力计算,显著减少计算冗余。原生支持 65,536 token 上下文长度,并可通过 LongRoPE 技术扩展至 131,072 token,满足复杂长文本处理需求。

OpenBMB 发布并开源 MiniCPM 4.1-8B

目前,MiniCPM4.1-8B 已全面开源,代码与模型权重已上线 GitHub、Hugging Face 及魔搭社区,供研究与应用使用。

?GitHub:https://www.php.cn/link/10164f723a34e25cd518da38b02af653
?Hugging Face:https://www.php.cn/link/3ffa944140b77ef7b5e7500eb4ca2fe5
?ModelScope:https://www.php.cn/link/95b428e98d2b66a8ab324313cfc45300

源码下载地址:点击获取

以上就是OpenBMB 发布并开源 MiniCPM 4.1-8B的详细内容,更多请关注php中文网其它相关文章!

最佳 Windows 性能的顶级免费优化软件
最佳 Windows 性能的顶级免费优化软件

每个人都需要一台速度更快、更稳定的 PC。随着时间的推移,垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是,许多工具可以让 Windows 保持平稳运行。

下载
来源:php中文网
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn
最新问题
开源免费商场系统广告
热门教程
更多>
最新下载
更多>
网站特效
网站源码
网站素材
前端模板
关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新 English
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送
PHP中文网APP
随时随地碎片化学习

Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号