讲师中心微信公众号

首页

文章

后端开发 web前端数据库开发工具 php框架常见问题科技 Java 系统教程电脑教程硬件教程手机教程软件教程游戏教程自媒体新闻

专题

后端开发 web前端数据库开发工具 php框架科技 Java 系统教程电脑教程硬件教程手机教程软件教程游戏教程新闻

AI工具

AI 聊天问答 Agent智能体 AI 文本写作 AI 绘画作图 AI 设计工具 AI 视频创作 AI 音频制作 AI 办公学习 AI 编程开发 Prompt指令

学习

大前端后端开发数据库移动端运维开发计算机基础

编程手册

大前端后端开发数据库移动端运维开发计算机基础

下载

js特效网站源码工具下载类库下载网站素材学习资源插件扩展手机游戏

最近更新

0

0

Meta AI 发布 MobileLLM-R1：轻量级边缘推理模型

DDD

发布时间：2025-09-16 16:28:01

|

827人浏览过

|

来源于php中文网

原创

meta ai 发布 mobilellm-r1：轻量级边缘推理模型

近日，Meta AI 推出了名为 MobileLLM-R1 的轻量级边缘推理模型系列，现已在 Hugging Face 平台上线。该系列涵盖从140M到950M参数规模的多种模型，专为高效执行数学、编程及科学推理任务而设计，在低于10亿参数的体量下展现出卓越性能。

其中最大的型号为 MobileLLM-R1-950M，采用了多项架构优化：包含22层 Transformer 结构、24个注意力头以及6组分组 KV 头。其嵌入维度设为1536，隐藏层维度达到6144。

为提升效率，该模型引入了分组查询注意力（GQA）机制，有效降低计算与内存消耗；通过块级权重共享策略进一步压缩参数数量，同时避免显著增加延迟；并采用 SwiGLU 激活函数以增强小模型的表达能力。支持最长4K token 的上下文输入，后训练版本更可扩展至32K上下文长度。

在训练方面，MobileLLM-R1 展现出极高的数据利用效率。整个训练过程使用约4.2万亿 token，仅为 Qwen3-0.6B 所用36万亿 token 的11.7%，却实现了相当甚至更优的准确率表现。此外，模型经过数学、编码和推理相关数据集的监督微调，显著减少了训练所需的资源与成本。

讯飞智文

讯飞智文

一键生成PPT和Word，让学习生活更轻松。

下载

基准测试结果显示，MobileLLM-R1-950M 在多个关键任务中表现突出：在 MATH500 数据集上，其准确率约为 OLMo-1.24B 的5倍，是 SmolLM2-1.7B 的约2倍。在 GSM8K、AIME 和 LiveCodeBench 等复杂推理与编程任务中，其性能与 Qwen3-0.6B 相当或更优，而后者所依赖的训练 token 数量远超前者。

然而，该模型的应用也存在一定局限。由于专注特定领域，其在通用对话、常识理解及创造性生成等任务上的表现不及更大规模的通用模型。此外，MobileLLM-R1 采用 FAIR NC（非商业用途）许可证，限制了其在商业场景中的部署；且较长的上下文支持（32K）会带来更高的 KV 缓存占用和运行时内存需求。

相关文章

项目流：类似禅道的项目管理软件，支持微信登录

FFmpeg 感谢腾讯，手写 ARM 汇编补丁比 C 语言快 2 倍

Qwen3-VL-Embedding & Reranker 开源，专为多模态信息检索与跨模态理解设计

Visual Studio Code 1.108 发布

中国影史进口片票房冠军，《疯狂动物城 2》延长上映至 2 月 25 日

相关标签:

编码 ai qwen 架构 Token transformer

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：开源游戏引擎 Godot 4.5 发布下一篇：腾讯宣布全面适配主流国产芯片，整合不同芯片提供高性价比 AI 算力

作者最新文章

AI 销售助手演示：提升客户互动和业务增长

2026-01-08 11:10

Abacus AI：颠覆性AI工具，赋能生活和业务增长

2026-01-08 11:10

撰写强有力的研究计划书：终极指南

2026-01-08 11:11

Private LLM邮件营销模块使用指南：提升点击率的终极秘籍

2026-01-08 11:12

《远光84》游戏灵敏度设置方法

2026-01-08 11:13

AI自动化101：无需编码，轻松掌握AI新业务模式

2026-01-08 11:13

Gamma AI + ChatGPT：颠覆性AI图像生成技巧

2026-01-08 11:13

《江苏税务》办理电子退税申请方法

2026-01-08 11:14

AI 3D人像生成终极指南：Gemini与Google Labs Flow完美结合

2026-01-08 11:15

Spring Boot 反向代理后 URL 自动附加后端端口的解决方案

2026-01-08 11:15

热门AI工具

更多

DeepSeek

DeepSeek

幻方量化公司旗下的开源大模型平台

AI大模型

开放平台

豆包大模型

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI大模型

通义千问

通义千问

阿里巴巴推出的全能AI助手

AI大模型

腾讯元宝

腾讯元宝

腾讯混元平台推出的AI助手

文档处理

Excel 表格

文心一言

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI大模型

中文写作

讯飞写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

中文写作

写作工具

即梦AI

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接

图画生成

ChatGPT

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI大模型

中文写作

智谱清言 - 免费全能的AI助手

智谱清言 - 免费全能的AI助手

智谱清言 - 免费全能的AI助手

AI大模型

PDF 文档

相关专题

更多

登录token无效

登录token无效

登录token无效解决方法：1、检查token的有效期限，如果token已经过期，需要重新获取一个新的token；2、检查token的签名，如果签名不正确，需要重新获取一个新的token；3、检查密钥的正确性，如果密钥不正确，需要重新获取一个新的token；4、使用HTTPS协议传输token，建议使用HTTPS协议进行传输；5、使用双因素认证，双因素认证可以提高账户的安全性。

6072

2023.09.14

登录token无效怎么办

登录token无效怎么办

登录token无效的解决办法有检查Token是否过期、检查Token是否正确、检查Token是否被篡改、检查Token是否与用户匹配、清除缓存或Cookie、检查网络连接和服务器状态、重新登录或请求新的Token、联系技术支持或开发人员等。本专题为大家提供token相关的文章、下载、课程内容，供大家免费下载体验。

795

2023.09.14

token怎么获取

token怎么获取

获取token值的方法：1、小程序调用“wx.login()”获取临时登录凭证code，并回传到开发者服务器；2、开发者服务器以code换取，用户唯一标识openid和会话密钥“session_key”。想了解更详细的内容，可以阅读本专题下面的文章。

1056

2023.12.21

token什么意思

token什么意思

token是一种用于表示用户权限、记录交易信息、支付虚拟货币的数字货币。可以用来在特定的网络上进行交易，用来购买或出售特定的虚拟货币，也可以用来支付特定的服务费用。想了解更多token什么意思的相关内容可以访问本专题下面的文章。

1196

2024.03.01

c++主流开发框架汇总

c++主流开发框架汇总

本专题整合了c++开发框架推荐，阅读专题下面的文章了解更多详细内容。

25

2026.01.09

c++框架学习教程汇总

c++框架学习教程汇总

本专题整合了c++框架学习教程汇总，阅读专题下面的文章了解更多详细内容。

24

2026.01.09

学python好用的网站推荐

学python好用的网站推荐

本专题整合了python学习教程汇总，阅读专题下面的文章了解更多详细内容。

72

2026.01.09

学python网站汇总

学python网站汇总

本专题整合了学python网站汇总，阅读专题下面的文章了解更多详细内容。

9

2026.01.09

python学习网站

python学习网站

本专题整合了python学习相关推荐汇总，阅读专题下面的文章了解更多详细内容。

9

2026.01.09

热门下载

更多

网站特效

/

网站源码

/

网站素材

/

前端模板

相关下载

更多

php商城系统

淘源码商城PHP淘宝查信誉

PHP房产程序[BBWPS]

PHP简约自动发卡平台个人版

ERMEB域名PHP离线网络授权系统

Difeye-敏捷的轻量级PHP框架

大泉州汽车网PHP整站程序

精品课程

更多

相关推荐

/

热门推荐

/

最新课程

最新Python教程从入门到精通

最新Python教程从入门到精通

共4课时 | 0.6万人学习

Rust 教程

Rust 教程

共28课时 | 4.3万人学习

Git 教程

Git 教程

共21课时 | 2.6万人学习

最新文章

更多

比尔・盖茨呼吁社会警惕 AI 潜在风险：别让技术落入恶意行为者之手

DRAM 内存严重短缺，惠普正寻求中国供应商替代方案

英伟达黄仁勋：AI 芯片是一锤子买卖，但软件开发需终身维护

狂签 6 吉瓦！Meta 成全球最大核能买家，囤电备战 AI 算力

MIT前瞻分析2026年AI产业走向：热度下降初现企业数字化战略或将调整

MIT最新研究警告2026年AI趋势变化：增长放缓迹象明显企业AI支出面临重估

亚马逊改革员工绩效评估方式：需拿出具体成果，告别模糊自我评价

京东航空第 11 架波音 737 货机投用，西北首条货机航线常态化运营

陈立武称英特尔正大力进军 14A 领域，暗示已争取到外部客户

罗马仕遭供应商创益通起诉追讨货款，一审被判支付 1271 万元

关于我们免责申明举报中心意见反馈讲师合作广告合作最新更新: php中文网：公益在线php培训，帮助PHP学习者快速成长！; 关注服务号技术交流群

PHP中文网订阅号: 每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号

PHP学习

技术支持

返回顶部