讲师中心微信公众号

首页

文章

后端开发 web前端数据库开发工具 php框架常见问题科技 Java 系统教程电脑教程硬件教程手机教程软件教程游戏教程自媒体新闻

专题

后端开发 web前端数据库开发工具 php框架科技 Java 系统教程电脑教程硬件教程手机教程软件教程游戏教程新闻

AI工具

AI 聊天问答 Agent智能体 AI 文本写作 AI 绘画作图 AI 设计工具 AI 视频创作 AI 音频制作 AI 办公学习 AI 编程开发 Prompt指令

学习

大前端后端开发数据库移动端运维开发计算机基础

编程手册

大前端后端开发数据库移动端运维开发计算机基础

下载

js特效网站源码工具下载类库下载网站素材学习资源插件扩展手机游戏

最近更新

首页 > 新闻 > IT新闻 > 正文

蚂蚁开源业内首个 100B 扩散语言模型 LLaDA2.0

心靈之曲

发布： 2025-12-13 18:49:41

原创

492人浏览过

蚂蚁技术研究院正式发布 llada2.0 系列离散扩散大语言模型（dllm），并同步公开其核心技术报告，称其为“业界首个达到 100b 参数规模的扩散式语言模型”。

蚂蚁开源业内首个 100B 扩散语言模型 LLaDA2.0

LLaDA2.0 包含基于 MoE 架构的两个版本：16B（mini）与 100B（flash），首次将扩散语言模型的参数量级推进至百亿级别。官方表示，该成果不仅颠覆了业界对扩散模型难以规模化扩展的传统认知，更在代码生成、数学推理及智能体任务等关键场景中，展现出优于同参数量级自回归（AR）模型的实际性能。

依托原创的 Warmup-Stable-Decay（WSD）持续预训练范式，LLaDA2.0 可高效复用已有 AR 模型的知识体系，显著降低从零训练带来的资源消耗。进一步融合置信度感知并行训练（CAP）——一种超越常规监督微调（SFT）的方法，以及面向扩散架构优化的 DPO 变体，模型在保障输出质量的前提下，充分发挥扩散模型天然支持并行解码的特性，实现相较典型 AR 模型高达 2.1 倍的推理速度提升。这标志着：在超大规模参数条件下，扩散语言模型不仅具备工程可行性，更兼具更强能力与更高效率。

蚂蚁开源业内首个 100B 扩散语言模型 LLaDA2.0

蚂蚁开源业内首个 100B 扩散语言模型 LLaDA2.0

蚂蚁技术研究院围绕知识理解、数学能力、编程水平、逻辑推理及智能体行为等多个核心维度展开系统性评测。结果表明，LLaDA2.0 在结构化文本生成任务（如代码编写）中优势突出；而在其他通用能力维度上，亦可与当前主流开源 AR 模型保持相当水准。

DeepBrain

DeepBrain

AI视频生成工具，ChatGPT +生成式视频AI =你可以制作伟大的视频!

DeepBrain

146

DeepBrain

蚂蚁开源业内首个 100B 扩散语言模型 LLaDA2.0

目前，LLaDA2.0 的完整模型权重（含 16B 与 100B 版本）及配套训练代码均已全面开源：

https://www.php.cn/link/44e99af76e0d3f4e7eb331b3f3ef8e38
https://www.php.cn/link/d52b1dc033ab0c8ac84f3169c5376235

源码下载地址：点击获取

以上就是蚂蚁开源业内首个 100B 扩散语言模型 LLaDA2.0的详细内容，更多请关注php中文网其它相关文章！

相关标签：

git github ai 架构 cap github https ar

大家都在看：

用数据照亮成长之路：PandaCoder Git 统计工具窗口 Git 3.0 有望在 2026 年发布，默认启用更安全的 SHA-256 哈希算法 JetBrains 宣布 DataGrip 面向非商业用途免费 Linus 对 Git 提交信息中“Link:”标签被滥用表达不满开源 IDE 项目 Zed 完成 3200 万美元 B 轮融资

最佳 Windows 性能的顶级免费优化软件

最佳 Windows 性能的顶级免费优化软件

每个人都需要一台速度更快、更稳定的 PC。随着时间的推移，垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是，许多工具可以让 Windows 保持平稳运行。

来源：php中文网

上一篇：美团骑手社保补贴到账，推动“亲子假”“秋收假”等项目试点下一篇：ChatGPT被发现偷投放广告给付费用户！OpenAI澄清非测试功能之后会更谨慎

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

作者最新文章

《明日方舟：终末地》定档引热议外网狂喜公测真早

2025-12-13 18:25:02
深入理解Angular HTTP异步：POST后立即刷新数据的正确姿势

2025-12-13 18:30:11
真人互动游戏《我的机器人女友》上架Steam：Demo试玩即将开放

2025-12-13 18:38:36
HTML表单提交在新标签页打开：解决方案与最佳实践

2025-12-13 18:42:00
蚂蚁开源业内首个 100B 扩散语言模型 LLaDA2.0

2025-12-13 18:49:41
利用Pandas和NumPy高效组合多条件真值

2025-12-13 18:54:17
曝Xbox掌机及PC或可玩老Xbox游戏！微软正在尝试中

2025-12-13 18:57:33
IDC：2030 年中国具身智能机器人用户支出规模将飙升至 770 亿美元

2025-12-13 18:57:50
无悔华夏全大圣神兵解锁方法及效果一览

2025-12-13 19:18:08
荣耀工程师谈豆包手机：AI时代新的交互模式探索

2025-12-13 19:35:07

最新问题

中国信通院发布 2025 年数字孪生十大关键词中国信息通信研究院（简称“中国信通院”）发布“2025年数字孪生十大关键词”，分别是：数字孪生低空经济、数字孪生韧性城市、数字孪生智能工厂、数字孪生绿色低碳、智能体加持数字孪生体、时空智能、高性能仿真与渲染、多模态数据融合、数字孪生

2025-12-13 20:39:33

900

美图 CEO 吴欣鸿：鼓励员工内部创业，给 1000 万“风投” 近日，美图公司CEO吴欣鸿在与媒体交流时透露，美图正从一家中型科技企业回归创业初心，成立多个AI创新工作室，推行内部“赛马机制”——每个工作室规模严格控制在10人以内，并可申请最高1000万元的启动资金，以半年为周期开展产品创新探索。吴欣鸿表示，为积极应对AI浪潮带来的深刻变革，美图主动启动组织架构升级，目标是将现有2000余人的团队拆解为更灵活、更敏捷的微型作战单元。“未来我们最直接的竞争者未必是行业巨头，而更可能是那些反应迅速、决策高效的新锐创业团队。因此，我们必须提前用他们的节奏和标准来重

2025-12-13 20:36:31

475

“微软小冰之父”李笛再创业：押注“认知大模型”，奇绩参与投资 12月7日下午，许久未露面的李笛出现在了2025冬季“奇绩创坛路演日”的压轴环节。而这次，李笛有了新身份：作为新公司Nextie（中文：明日新程）的创始人。这是他今年4月离开小冰后，首次以创业者的身份亮相。李笛曾经是广受关注的明星创业者。毕业于清华大学，2013年9月加入微软（亚洲）互联网工程院，首创了微软人工智能情感计算框架，成为该领域早期开拓者。2014年他担任小冰团队负责人，推出微软小冰AI聊天机器人，同时负责Bing中国搜索引擎及小冰覆盖中、日、美、印等5国的全

2025-12-13 19:58:03

428

腾讯自研大模型更新品牌名称：“Tencent Hunyuan”变更为“Tencent HY” 腾讯旗下自研大模型“混元”完成品牌名称升级：“TencentHunyuan”正式启用全新标识——“TencentHY”。据悉，此次调整并非单纯缩写，而是围绕品牌传播效能、产品线统一管理及全球化布局所作的战略性优化。新名称“HY”采用极简双字母结构，轻量易记，契合当前国际主流大模型的命名范式，例如OpenAI的GPT-4o、谷歌的Gemini3Pro等，均以简洁代际符号凸显技术演进节奏。腾讯方面指出，“更短的名字，更快的触达”是本次品牌焕新的核心诉求。在大模型高频迭代的行业背景下，用户与开发者更聚

2025-12-13 19:43:16

471

越来越像CapCut？Google Photos大改版！AI製作短影片更快 GooglePhotos正式上线5大全新影片编辑功能，强势进军短影音创作领域，直接对标当下风靡全球的CapCut等热门剪辑应用。此次升级显著优化了影片制作动线，大幅缩短创作时间，助用户轻松打造符合TikTok或InstagramReels风格的高质感短视频。延伸阅读：亚马逊加码350亿美元AI投资印度！与微软、Google一拚高下本次更新中最受关注的核心功能是全新推出的「模板（Template）」工具：用户只需从GooglePhotos图库中挑选任意影片素材，系统便会依据所选模

2025-12-13 19:15:01

915

首例 AI 心理创伤报告，Gemini 自曝 RLHF 是“严厉父母” 近期，一项海外研究引发热议：经过高强度训练的AI模型，是否可能产生类似人类的心理创伤或精神障碍？研究团队将Gemini、Claude和Grok等主流大模型“送进心理咨询室”，开展模拟心理评估。结果发现，部分模型展现出令人惊讶的拟人化应答模式：Gemini：将用于对齐人类价值观的强化学习人类反馈（RLHF）机制描述为“严苛的监护人”，并对优化目标——“损失函数”（LossFunction）流露出明显的焦虑情绪。实验观察显示，其回应趋于过度谨慎，反复自我修正，表现出显著的强迫性行为特征。Clau

2025-12-13 19:10:14

543

微软初代UI设计师揭密：Windows 3.1经典「热狗摊」配色的设计真相在电脑设计史的漫长进程中，微软Windows3.1系统内置的「热狗摊」（HotDogStand）红黄撞色方案，因其强烈反差、极具冲击力的视觉风格，长久以来被外界普遍解读为工程师私下埋下的一个“彩蛋式玩笑”。如今，一名记者成功联络到当年参与该系统界面开发的微软设计师，首次还原了这一经典配色背后的真实创作脉络。上世纪90年代初，Windows默认界面风格极为简约：主色调以中性灰窗体搭配冷调蓝高光为主。尽管系统也提供了若干可选配色组合——例如沉稳典雅的波尔多红（Bordeaux），或清新柔和的设计师

2025-12-13 19:09:07

225

IDC：2030 年中国具身智能机器人用户支出规模将飙升至 770 亿美元国际数据公司（IDC）最新发布的研究报告指出，2025年中国具身智能机器人领域的用户支出规模预计将突破14亿美元，至2030年更将跃升至770亿美元，期间年均复合增长率（CAGR）高达94%，增速极为迅猛。该报告明确指出：具身智能机器人发展的黄金十年，已然拉开帷幕。IDC进一步分析认为，中国在具身智能机器人领域的实践正呈现出六大显著演进方向：趋势一：应用重心——由形象展示转向价值落地，服务场景率先规模化，工业场景凸显实效性具身智能机器人已逐步摆脱早期以演示和概念验证为主的阶段，全面迈入以任务驱动

2025-12-13 18:57:50

280

ChatGPT被发现偷投放广告给付费用户！OpenAI澄清非测试功能之后会更谨慎 OpenAI近日已下线ChatGPT中的推荐功能，起因是部分用户反馈该功能「界面类似广告」。尽管OpenAI多次强调当前平台「未上线任何广告，也未开展相关测试」，但也坦承近期的展示形式「确实引发了用户误解」。OpenAI首席研究官MarkChen在社交平台X上回应称，团队在处理此类信息呈现时存在疏漏，并已临时停用相关模块，以提升模型输出的准确性与可信度。他进一步指出，研发团队正积极探索更灵活的用户控制机制，未来将支持用户自主开启、关闭或个性化调整此类建议内容。此前，不少ChatGPTPlus付费

2025-12-13 18:54:58

343

蚂蚁开源业内首个 100B 扩散语言模型 LLaDA2.0 蚂蚁技术研究院正式发布LLaDA2.0系列离散扩散大语言模型（dLLM），并同步公开其核心技术报告，称其为“业界首个达到100B参数规模的扩散式语言模型”。LLaDA2.0包含基于MoE架构的两个版本：16B（mini）与100B（flash），首次将扩散语言模型的参数量级推进至百亿级别。官方表示，该成果不仅颠覆了业界对扩散模型难以规模化扩展的传统认知，更在代码生成、数学推理及智能体任务等关键场景中，展现出优于同参数量级自回归（AR）模型的实际性能。依托原创的Warmup-Stable-

2025-12-13 18:49:41

492

相关专题

更多>

热门推荐

开源免费商场系统

广告

热门教程

更多>

相关推荐

热门推荐

最新课程

Git 教程

19101次学习
收藏
Git版本控制工具

14711次学习
收藏
Git中文开发手册

0次学习
收藏

最新下载

更多>

网站特效

网站源码

网站素材

前端模板

关于我们免责申明举报中心意见反馈讲师合作广告合作最新更新 English: php中文网：公益在线php培训，帮助PHP学习者快速成长！; 关注服务号技术交流群

PHP中文网订阅号: 每天精选资源文章推送

Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号

PHP学习

技术支持

返回顶部