0

0

​Meta AI 发布 MobileLLM-R1:轻量级边缘推理模型

DDD

DDD

发布时间:2025-09-16 16:28:01

|

827人浏览过

|

来源于php中文网

原创

​meta ai 发布 mobilellm-r1:轻量级边缘推理模型

近日,Meta AI 推出了名为 MobileLLM-R1 的轻量级边缘推理模型系列,现已在 Hugging Face 平台上线。该系列涵盖从140M到950M参数规模的多种模型,专为高效执行数学、编程及科学推理任务而设计,在低于10亿参数的体量下展现出卓越性能。

其中最大的型号为 MobileLLM-R1-950M,采用了多项架构优化:包含22层 Transformer 结构、24个注意力头以及6组分组 KV 头。其嵌入维度设为1536,隐藏层维度达到6144。

为提升效率,该模型引入了分组查询注意力(GQA)机制,有效降低计算与内存消耗;通过块级权重共享策略进一步压缩参数数量,同时避免显著增加延迟;并采用 SwiGLU 激活函数以增强小模型的表达能力。支持最长4K token 的上下文输入,后训练版本更可扩展至32K上下文长度。

在训练方面,MobileLLM-R1 展现出极高的数据利用效率。整个训练过程使用约4.2万亿 token,仅为 Qwen3-0.6B 所用36万亿 token 的11.7%,却实现了相当甚至更优的准确率表现。此外,模型经过数学、编码和推理相关数据集的监督微调,显著减少了训练所需的资源与成本。

讯飞智文
讯飞智文

一键生成PPT和Word,让学习生活更轻松。

下载

基准测试结果显示,MobileLLM-R1-950M 在多个关键任务中表现突出:在 MATH500 数据集上,其准确率约为 OLMo-1.24B 的5倍,是 SmolLM2-1.7B 的约2倍。在 GSM8K、AIME 和 LiveCodeBench 等复杂推理与编程任务中,其性能与 Qwen3-0.6B 相当或更优,而后者所依赖的训练 token 数量远超前者。

然而,该模型的应用也存在一定局限。由于专注特定领域,其在通用对话、常识理解及创造性生成等任务上的表现不及更大规模的通用模型。此外,MobileLLM-R1 采用 FAIR NC(非商业用途)许可证,限制了其在商业场景中的部署;且较长的上下文支持(32K)会带来更高的 KV 缓存占用和运行时内存需求。

相关专题

更多
登录token无效
登录token无效

登录token无效解决方法:1、检查token的有效期限,如果token已经过期,需要重新获取一个新的token;2、检查token的签名,如果签名不正确,需要重新获取一个新的token;3、检查密钥的正确性,如果密钥不正确,需要重新获取一个新的token;4、使用HTTPS协议传输token,建议使用HTTPS协议进行传输 ;5、使用双因素认证,双因素认证可以提高账户的安全性。

6072

2023.09.14

登录token无效怎么办
登录token无效怎么办

登录token无效的解决办法有检查Token是否过期、检查Token是否正确、检查Token是否被篡改、检查Token是否与用户匹配、清除缓存或Cookie、检查网络连接和服务器状态、重新登录或请求新的Token、联系技术支持或开发人员等。本专题为大家提供token相关的文章、下载、课程内容,供大家免费下载体验。

795

2023.09.14

token怎么获取
token怎么获取

获取token值的方法:1、小程序调用“wx.login()”获取 临时登录凭证code,并回传到开发者服务器;2、开发者服务器以code换取,用户唯一标识openid和会话密钥“session_key”。想了解更详细的内容,可以阅读本专题下面的文章。

1056

2023.12.21

token什么意思
token什么意思

token是一种用于表示用户权限、记录交易信息、支付虚拟货币的数字货币。可以用来在特定的网络上进行交易,用来购买或出售特定的虚拟货币,也可以用来支付特定的服务费用。想了解更多token什么意思的相关内容可以访问本专题下面的文章。

1196

2024.03.01

c++主流开发框架汇总
c++主流开发框架汇总

本专题整合了c++开发框架推荐,阅读专题下面的文章了解更多详细内容。

25

2026.01.09

c++框架学习教程汇总
c++框架学习教程汇总

本专题整合了c++框架学习教程汇总,阅读专题下面的文章了解更多详细内容。

24

2026.01.09

学python好用的网站推荐
学python好用的网站推荐

本专题整合了python学习教程汇总,阅读专题下面的文章了解更多详细内容。

72

2026.01.09

学python网站汇总
学python网站汇总

本专题整合了学python网站汇总,阅读专题下面的文章了解更多详细内容。

9

2026.01.09

python学习网站
python学习网站

本专题整合了python学习相关推荐汇总,阅读专题下面的文章了解更多详细内容。

9

2026.01.09

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
最新Python教程 从入门到精通
最新Python教程 从入门到精通

共4课时 | 0.6万人学习

Rust 教程
Rust 教程

共28课时 | 4.3万人学习

Git 教程
Git 教程

共21课时 | 2.6万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号