微信公众号讲师中心

首页

文章

后端开发 web前端数据库开发工具 php框架常见问题科技 Java 系统教程电脑教程硬件教程手机教程软件教程游戏教程自媒体新闻

专题

后端开发 web前端数据库开发工具 php框架科技 Java 系统教程电脑教程硬件教程手机教程软件教程游戏教程新闻

AI工具

AI 聊天问答 Agent智能体 AI 文本写作 AI 绘画作图 AI 设计工具 AI 视频创作 AI 音频制作 AI 办公学习 AI 编程开发 Prompt指令

学习

大前端后端开发数据库移动端运维开发计算机基础

编程手册

大前端后端开发数据库移动端运维开发计算机基础

下载

js特效网站源码工具下载类库下载网站素材学习资源插件扩展手机/移动开发手机游戏

搜索

后端开发 web前端数据库开发工具 php框架常见问题科技 Java 系统教程电脑教程硬件教程手机教程软件教程游戏教程

首页 > 新闻 > IT新闻 > 正文

Thinking Machines Lab 发文，揭示 LLM 推理过程不确定性的真相

心靈之曲

发布： 2025-09-11 13:10:01

原创

780人浏览过

thinking machines lab 发文，揭示 llm 推理过程不确定性的真相

由前 OpenAI 首席技术官 Mira Murati 创立的 Thinking Machines Lab 近日发布了其首篇技术博客：《在 LLM 推理中战胜不确定性》（"Defeating Nondeterminism in LLM Inference"）。

Thinking Machines Lab 发文，揭示 LLM 推理过程不确定性的真相

尽管将大语言模型的温度设置为 0，并使用完全相同的输入、模型和硬件，输出结果仍可能出现差异。这篇博客深入探讨了这一现象背后的原因，并提出了解决方案——如何实现 100% 可重复的大模型推理输出。

文章指出，造成这种不确定性的因素主要有两个：

1. 浮点数加法不具备结合律特性（floating-point non-associativity）

即 (a + b) + c 与 a + (b + c) 在浮点运算中可能产生不同结果。由于并行计算时求和顺序不一致，会引入微小数值偏差。不过，作者认为这并非问题的主要根源。

2. 并行计算策略的动态变化（Dynamic Parallelization Strategies）

通义万相

通义万相

通义万相，一个不断进化的AI艺术创作大模型

通义万相

596

通义万相

这是导致输出不一致的核心原因。当 batch size、序列长度或 KV-cache 的状态发生变化时，GPU 内核可能会选择不同的并行执行路径，进而改变计算顺序，最终影响输出结果。

为解决此问题，作者提出必须确保所有关键计算内核（kernel）具备 batch-invariant 特性——无论输入批次大小或序列如何分割，计算过程和结果都应保持完全一致。

针对三大核心组件，团队提出了相应的改进方法：

RMSNorm：重构归一化计算流程，保证跨设备和批处理的一致性
矩阵乘法（Matrix Multiplication）：采用确定性算法路径，避免因分块策略不同带来的误差
注意力机制（Attention）：设计统一的并行化模式，消除 softmax 与 KV-cache 操作中的非确定性

Thinking Machines Lab 发文，揭示 LLM 推理过程不确定性的真相

实验部分，研究团队选用 Qwen3-235B-A22B-Instruct-2507 模型进行测试。在应用上述优化后，连续运行 1000 次相同请求，模型每次输出均完全一致，实现了真正意义上的确定性推理。

以上就是Thinking Machines Lab 发文，揭示 LLM 推理过程不确定性的真相的详细内容，更多请关注php中文网其它相关文章！

相关标签：

mac ai openai 大模型 qwen batch 算法重构

大家都在看：

WPS AI智能加持，Mac版WPS添新功能翻新 Astropad新应用Slate：将iPad变身数位板，为Mac用户带来革新体验重要提醒：微软将于明年8月31日停止对Visual Studio IDE提供支持，Mac用户请注意 EA宣布全面取代Origin，打造Mac上的主要游戏平台亚马逊宣布Mac经典版Kindle应用停止支持，新版即将登场

最佳 Windows 性能的顶级免费优化软件

最佳 Windows 性能的顶级免费优化软件

每个人都需要一台速度更快、更稳定的 PC。随着时间的推移，垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是，许多工具可以让 Windows 保持平稳运行。

来源：php中文网

上一篇：华为中国行2025·山西新质生产力大会“以数智化之笔书写长治答卷” 下一篇：月之暗面开源 Checkpoint Engine，专为 LLM 推理引擎设计的中间件

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

最新问题

电量怪兽来了！华为Mate 70 Air规格、续航全都要再战轻薄机型市场继摩托罗拉Edge70发布后，智能手机市场再度迎来一位强有力的新成员——华为Mate70Air，正式向主打轻薄设计的iPhoneAir系列发起挑战。虽然其机身比iPhoneAir厚出1毫米，并重约30%，但Mate70Air在纤薄轮廓中成功整合了四摄系统与双倍电池容量，展现出惊人平衡。规格全面超越同级产品对比先前推出的MotorolaEdge70（配备三颗后置镜头、挖孔前镜头及萤幕指纹识别），华为Mate70Air显著升级，不仅搭载四颗后置镜头，更配备了

2025-11-08 17:47:24

359

手机整晚充电会不会爆？专家曝真正伤电池元兇不是「过充」现代手机不怕过充真正威胁是「高温」过去常听人说「别整晚充电，会把电池充坏」，但随着技术演进，这种担忧已不再适用。无论是iPhone还是Android手机，如今都配备了智能充电管理系统，能在电量充满后自动停止或调整供电，避免所谓的「过充」问题。换句话说，长时间连接电源并不会引发电池灾难。尽管如此，长期让电池维持在100%满电状态仍非理想做法。锂离子电池在高电压和高温环境下最容易老化，持续处于满电会让内部材料承受更大压力。目前多数机型采用「涓流充电」或阶段性补电机制，在电量稍有下降时才继续补充，

2025-11-08 17:45:01

414

内存硬盘价格暴涨：铭凡宣布旗下迷你主机涨价，准系统除外感谢网友菜鸟N号的线索投递！11月8日消息，铭凡昨晚发布《MINISFORUM铭凡产品价格调整说明》，附原文如下：今天和大家坦诚沟通一个我们共同面临的行业挑战——全球市场原材料及核心元器件价格的持续上涨，让产品制造成本压力持续攀升。经过多番努力与内部消化后，在“维持低价但牺牲品质”和“适度调价但保障体验”之间，我们坚定选择了后者，这是品牌对产品品质的基本责任，更是对每一位用户信任的敬畏。经过多轮测算，我们最终做出慎重决定：未来将对部分产品售价进行适度调整，为尽可能减少影响，本次调整将不涉及

2025-11-08 17:10:10

181

荷兰将归还安世半导体控制权，关键汽车芯片恢复供应感谢网友Roronoa_、马邦德、刺客提供的线索！11月8日消息，据《华尔街日报》今日报道，荷兰政府正计划搁置此前针对芯片企业安世半导体（Nexperia）发布的管制措施，因国际贸易摩擦而中断的关键汽车芯片供应有望重启。报道称，德国汽车零部件供应商奥莫维奥（Aumovio）于周五透露，由中荷合资成立的安世半导体所生产的芯片及相关模组已恢复从中国出货，并正在发往其位于匈牙利的物流中心。目前，除了奥莫维奥之外，德国另一家重量级汽车零部件制造商博世（Bosch）也已确认收到相关许可，表明这场波及全球的

2025-11-08 17:07:21

396

华为将发布新款手表，售价6499元起华为于11月8日宣布，新款非凡探索手表WATCH Ultimate 2即将在本月发布。这款备受瞩目的新品将带来颠覆性创新，其起售价定为6499元，精准定位高端户外探险市场。

2025-11-08 16:59:11

751

传Google加码OpenAI竞争对手Anthropic 估值或超3500亿美元据消息指出，Google正与生成式AI新创Anthropic展开初步协商，评估进一步注资的可能性。若相关传闻属实，此举或将推动Anthropic估值飙升至3,500亿美元以上。本轮投资可能采多种模式进行，包括扩大云端运算合作、可转换债券，或参与预计于2026年初启动的下一轮定价融资。今年10月，Anthropic已宣布将大幅扩展其在GoogleCloud上的TPU部署，双方签署长期战略合作协议，计划在2026年底前上线逾100万个TPU，合作金额达数十亿美元等级，显著强化Google云端AI算力

2025-11-08 16:54:13

313

国航 C919 大飞机载旗首飞香港，接受民航界最高礼遇水门迎接感谢网友补药吖、西窗旧事的线索投递！11月7日消息，据“中国国航”公众号今天更新，2025年11月7日上午11点36分，中国国际航空股份有限公司（国航）CA101航班平稳降落在香港国际机场，标志着国产大飞机C919首次身披五星红旗执行北京到香港航线，飞机降落后缓缓穿过水门，接受民航界最高礼遇。查询FlightAware航班数据库发现，国航CA101航班在今天上午8点15分驶出北京首都国际机场T3航站楼E11停机位，在上午11点48分到达香

2025-11-08 16:17:23

374

苹果传iPhone Air有望升级「双主镜头」！影像能力将大幅升级全球科技界对于苹果（Apple）极致轻薄机型iPhoneAir的未来发展，持续维持高度关注。最新消息指出，苹果正评估为预计在2026年推出的iPhoneAir（外界推测为iPhone18Air）新增第二颗后置镜头，这将打破该系列自最初传言以来，仅配备单镜头的设计惯例。打破单镜头传统评估双48MP配置知名爆料人士DigitalChatStation在中国社交媒体微博上发文表示，苹果目前正在对2026年版本的iPhoneAir进行评估。虽然这在产品开发过程中属于正常环节，

2025-11-08 16:17:01

288

蒋尚义：摩尔定律放缓催动半导体变局，芯粒化解 AI 芯片成本危机 11月7日讯，鸿海科技集团董事、前台积电联席COO蒋尚义昨日现身2025年远见高峰会，就人工智能与半导体产业的未来趋势分享了独到见解。蒋尚义指出，AI将接棒网络、PC和智能手机，成为推动半导体发展的下一轮核心动力。他强调，与以往不同的是，AI时代的到来将催生对多样化芯片的庞大需求：从智能汽车、机器人到智慧家居、智慧城市，成千上万的应用场景都将嵌入AI功能。过去仅靠少数几种芯片即可覆盖主流应用，而AI所带来的芯片可能性极为广阔。在制程技术方面，受限于物理瓶颈，摩尔定律所带来的性能

2025-11-08 15:37:09

351

Meta被指靠假广告赚巨额营收每日逾150亿诈骗广告《路透社》取得的Meta内部文件显示，这家社群媒体巨头在2024年高达约10%的营收来源与诈骗性及违禁商品广告相关，内部数据指出，Meta旗下平台（包含Facebook与Instagram）每日平均展示超过150亿则疑似诈骗广告。根据文件内容，Meta对高风险广告主採取分级处理机制，而非全面封禁。公司透过分析广告行为模式、投放金额与用户互动数据，决定广告主风险等级。部分帐号因违规纪录或高风险标籤，需支付更高投放费率，被视为平台在风险与收益间的一种平衡策略。延伸阅读：摆脱Open

2025-11-08 14:08:01

548

相关专题

更多>

热门推荐

开源免费商场系统

广告

热门教程

更多>

相关推荐

热门推荐

最新课程

Mac PHP开发工具与环境搭建

17665次学习
收藏
好课诞生记

57002次学习
收藏
JAVA教程手册

393035次学习
收藏

最新下载

更多>

网站特效

网站源码

网站素材

前端模板

关于我们免责申明举报中心意见反馈讲师合作广告合作最新更新 English: php中文网：公益在线php培训，帮助PHP学习者快速成长！; 关注服务号技术交流群

PHP中文网订阅号: 每天精选资源文章推送

PHP中文网APP: 随时随地碎片化学习

Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号

PHP学习

技术支持

返回顶部