蚂蚁集团百灵团队近日正式发布了ling 2.0系列的首个开源模型——ling-mini-2.0。该模型采用创新的moe架构,激活比例仅为1/32,总参数量达16b,但在处理每个token时仅激活1.4b参数(非embedding部分为789m),实现了高效计算与性能的平衡。
Ling-mini-2.0经过超过20万亿token数据的训练,并通过多阶段监督微调和强化学习技术,显著提升了复杂推理和指令遵循能力,整体表现可媲美7–8B级别的dense模型。
在多项权威评测中,该模型展现出卓越性能,在LiveCodeBench、CodeForces、AIME 2025、HMMT 2025、MMLU-Pro、Humanity's Last Exam等通用与专业推理基准上,均优于同规模的dense模型以及更大规模的MoE模型。

得益于其稀疏激活设计,Ling-mini-2.0在H20硬件上的部署效率极为出色:在2000 token以内的问答场景中,生成速度可达300+ token/s,相较8B dense模型提速超过2倍。

结合YaRN技术,模型上下文长度可外推至128K,在长序列处理任务中,相对加速比最高提升逾7倍,大幅增强其在实际应用中的灵活性与响应能力。
HuggingFace Space:https://www.php.cn/link/3a03f9afd886282d8d1de4e0af465056
HuggingFace:https://www.php.cn/link/8ac8abb13b9fe96f24fe2cab11a18fc2
ModelScope:https://www.php.cn/link/a92df7cbfdddcc938abc806992026a19
GitHub:https://www.php.cn/link/857cd81e6a7d216eeaf1946a803a7d5e
以上就是蚂蚁集团百灵团队正式开源 Ling-mini-2.0的详细内容,更多请关注php中文网其它相关文章!
每个人都需要一台速度更快、更稳定的 PC。随着时间的推移,垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是,许多工具可以让 Windows 保持平稳运行。
Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号