讲师中心微信公众号

首页

文章

后端开发 web前端数据库开发工具 php框架常见问题科技 Java 系统教程电脑教程硬件教程手机教程软件教程游戏教程自媒体新闻

专题

后端开发 web前端数据库开发工具 php框架科技 Java 系统教程电脑教程硬件教程手机教程软件教程游戏教程新闻

AI工具

AI 聊天问答 Agent智能体 AI 文本写作 AI 绘画作图 AI 设计工具 AI 视频创作 AI 音频制作 AI 办公学习 AI 编程开发 Prompt指令

学习

大前端后端开发数据库移动端运维开发计算机基础

编程手册

大前端后端开发数据库移动端运维开发计算机基础

下载

js特效网站源码工具下载类库下载网站素材学习资源插件扩展手机游戏

最近更新

首页 > 硬件教程 > 硬件测评 > 正文

一篇被证明“理论有误”的论文，拿下了 ICML2025 时间检验奖

心靈之曲

发布： 2025-07-23 13:16:02

原创

306人浏览过

深度学习领域的一篇标志性论文，终于迎来了它的“封神”时刻！

在刚刚举行的 ICML 2025 大会上，2015 年发表的 Batch Normalization（批次归一化，简称 BatchNorm）论文荣获时间检验奖。

一篇被证明“理论有误”的论文，拿下了 ICML2025 时间检验奖

这篇如今被引用超过 6 万次的开创性研究，是深度学习发展历程中的一个关键节点，极大地促进了深层神经网络的训练与广泛应用。

可以说，它是促使深度学习从实验室走向实际应用的重要技术之一。

一篇被证明“理论有误”的论文，拿下了 ICML2025 时间检验奖

一个简单而强大的想法，让训练速度显著提升

2015 年时，深度学习界正面临一个棘手问题：如何稳定地训练深层神经网络？

研究人员发现，随着网络层数的增加，训练过程变得极其不稳定。必须小心控制学习率，否则梯度很容易消失或爆炸。

更糟糕的是，模型对参数初始化极为敏感，稍微改变初始化方式就可能导致完全无法训练。

一篇被证明“理论有误”的论文，拿下了 ICML2025 时间检验奖

谷歌研究员 Sergey Ioffe 和 Christian Szegedy 抓住了问题的核心：在训练过程中，网络内部的数据分布不断变化。

一篇被证明“理论有误”的论文，拿下了 ICML2025 时间检验奖

△左：Sergey Ioffe，右：Christian Szegedy

他们将这一现象命名为“内部协变量偏移”（Internal Covariate Shift），指的是在训练中，每一层的参数更新都会导致后续层输入数据分布的变化，迫使网络不断适应新的分布，从而带来训练困难。

他们的解决思路非常巧妙：既然标准化输入数据有助于模型训练，那么是否也可以对隐藏层做类似操作？

BatchNorm 的做法是对每个小批次数据计算均值和方差，并据此进行标准化处理，使数据服从均值为 0、方差为 1 的分布。

但其中还有一个巧妙设计——引入两个可学习参数 γ（缩放因子）和 β（平移因子），允许网络自主调整输出分布，从而保持模型表达能力不受限制。

一篇被证明“理论有误”的论文，拿下了 ICML2025 时间检验奖

原论文的实验结果令人惊艳，在当时最先进的图像分类模型上，使用 BN 后仅需原来 1/14 的训练步数即可达到相同精度。

并在 ImageNet 分类任务中取得当时最佳成绩，超越了人类评估者的准确率。

一篇被证明“理论有误”的论文，拿下了 ICML2025 时间检验奖

成为深度学习基石，却被质疑理论基础

BatchNorm 初版提交于 2015 年初，其影响力远超作者预期，不仅提升了训练效率，还带来了意想不到的好处。

一篇被证明“理论有误”的论文，拿下了 ICML2025 时间检验奖

例如，它具有一定的正则化效果。由于每个小批次的统计量存在微小差异，这种噪声效应类似于 Dropout，有助于提升模型泛化能力，甚至在某些情况下可以替代 Dropout。

在 BatchNorm 出现之前，训练几十层以上的网络极为困难。

2015 年底，何恺明等人提出的 ResNet 结合残差连接与 BatchNorm，使得训练上百乃至上千层的超深网络成为可能。

此后几乎所有主流卷积神经网络（如 ResNet、DenseNet、Inception）及其他类型的模型都广泛采用了 BatchNorm。

一篇被证明“理论有误”的论文，拿下了 ICML2025 时间检验奖

然而，戏剧性的转折出现在 2018 年。

MIT 的研究团队挑战了 BatchNorm 的核心理论。

他们在标准 BN 层后加入随机噪声，人为制造“内部协变量偏移”。按原理论，这应该会削弱 BN 的效果。

但实验结果显示，即使存在剧烈分布偏移，BN 模型的训练速度仍远胜于未使用 BN 的模型。

HoloPix AI

HoloPix AI

HoloPix AI

87

HoloPix AI

一篇被证明“理论有误”的论文，拿下了 ICML2025 时间检验奖

该研究指出，BatchNorm 实际上改善了优化空间的平滑性，使梯度更加稳定可控，从而加快训练速度。

一篇被证明“理论有误”的论文，拿下了 ICML2025 时间检验奖

到了 2022 年，又有研究从几何角度提供了新见解。

一篇被证明“理论有误”的论文，拿下了 ICML2025 时间检验奖

这项研究表明，BN 其实是一种无监督学习机制，能够让网络在训练初期就主动适应数据结构，相当于一种“智能初始化”。

此外，由小批次统计量波动带来的噪声还能扩大分类边界，从而提升模型泛化性能。

一篇被证明“理论有误”的论文，拿下了 ICML2025 时间检验奖

两位作者现状如何？

十年过去，这篇改变历史的论文的两位作者 Sergey Ioffe 和 Christian Szegedy 现在都在哪里？

两人曾在谷歌工作十余年，直到 2023 年 Christian Szegedy 加入马斯克团队，成为 xAI 联合创始人。

一篇被证明“理论有误”的论文，拿下了 ICML2025 时间检验奖

2024 年初，Sergey Ioffe 也加入 xAI，参与 Grok 4 的开发工作。

不过后来 Christian Szegedy 离开 xAI，转投 AI 编程初创公司 Morph Labs 担任首席科学家。

这家公司目标宏大——致力于实现“可验证的超级智能”。这位深度学习先驱，正在为 AI 的下一个十年布局。

一篇被证明“理论有误”的论文，拿下了 ICML2025 时间检验奖

BatchNorm 原始论文：

https://www.php.cn/link/4efa2dce0e842cbc488548530dd8bf01

参考链接：

[ 1 ] https://www.php.cn/link/35296a4054db6816185054cbdc02e041

[ 2 ] https://www.php.cn/link/fa1d8223da871d94d79d2f175e0f5f1d

一键三连「点赞」「转发」「小心心」

欢迎在评论区留下你的观点！

— 完 —

专属 AI 产品从业者的实名社群，只聊最落地的 AI 产品真问题。扫码添加小助手，发送「姓名 + 公司 + 职位」申请入群～

进群后你将获得：

最新最专业的 AI 产品信息及分析

不定期发放热门产品内测码

内部专属内容与专业讨论

点亮星标

科技前沿每日更新

以上就是一篇被证明“理论有误”的论文，拿下了 ICML2025 时间检验奖的详细内容，更多请关注php中文网其它相关文章！

相关标签：

ai 谷歌深度学习神经网络 2025 batch 数据结构 internal https

大家都在看：

联想拯救者Y9000P 2024款评测：冷静的性能猛兽，游戏本的全能标杆联想拯救者Y9000P 2025款体验：性能释放与笔记本的完美平衡，年度真香游戏本高级索尼A7R VI相机深度使用报告：画质机皇再临，与视频性能全方位检验高通骁龙X Elite笔记本首测评：挑战M芯片霸权，Windows on ARM的翻身之作谷歌Pixel 9 Pro上手体验：原生安卓AI大脑与计算摄影的新高度

最佳 Windows 性能的顶级免费优化软件

最佳 Windows 性能的顶级免费优化软件

每个人都需要一台速度更快、更稳定的 PC。随着时间的推移，垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是，许多工具可以让 Windows 保持平稳运行。

来源：php中文网

上一篇：雷神ZERO 2023冰刃白双烤测试 55W+175W性能释放下一篇：iPhone 17 Pro 采用京东方屏幕，国行专供！

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

作者最新文章

被双平台封杀！恐怖游戏《Horses》销量已超1.8万份

2025-12-18 13:09:02
这就是NS2的实力？《2077》实测：掌机画面直追主机

2025-12-18 13:09:13
Nelm 与 Helm 4 的比较：现有差异与未来规划

2025-12-18 13:15:07
Epic就圣诞连送滑跪道歉：深知与Steam的差距仍会努力

2025-12-18 13:22:01
SE《正当防卫3》D加密正式移除！游戏发售已十年

2025-12-18 13:25:11
小米、徕卡宣布合作升级：引入战略共创模式！首作小米17 Ultra下周见

2025-12-18 13:30:01
《上古卷轴5》Mod爆改成日式美女游戏太犯规了

2025-12-18 13:35:00
谷歌将“氛围编程”工具 Opal 集成至 Gemini 网页端

2025-12-18 13:39:19
老牌劲旅的惺惺相惜！ B社支持《GTA6》延期

2025-12-18 13:45:17
《极限竞速：Motorsport》内容停更专注《极限竞速：地平线6》

2025-12-18 13:58:02

最新问题

PCIe 5.0 SSD价格持续下探：大容量固态硬盘普及时代即将到来？ PCIe5.0SSD价格松动源于NAND产能恢复、6nm主控量产及电商大促让利；当前可借双12补贴、6nm主控型号、国产高稳方案及企业采购通道实现最优购入。

2025-12-18 23:04:02

414

三星 Galaxy S25 Ultra 前瞻体验：骁龙8 Gen 4加持下的影像新纪元若三星GalaxyS25Ultra影像功能异常，需依次执行四步：一、强制重启并清除相机数据，完成ISP校准；二、通过SamsungMembers更新CameraAIEngine至v2.3.7+，启用NeuralHDRFusion与AdaptiveTelephotoStacking；三、重开AirView并用SPen在视频模式下触控校准，设为WQHD+分辨率；四、拨号输入*#0*#进入传感器测试，重置陀螺仪与OIS融合参数。

2025-12-18 22:53:12

276

高通骁龙 X Elite 笔记本首测：ARM架构Windows本的性能革命高通骁龙XElite不是过渡产品，而是Windows阵营首次在能效、AI和续航上系统性反超x86轻薄本的实战组合，依托自研OryonCPU、45TOPSHexagonNPU和AdrenoGPU重构性能逻辑。

2025-12-18 22:52:52

258

联想拯救者Y9000P 2024款游戏本详评：性能释放与散热的完美平衡联想拯救者Y9000P2024款是性能与体验均衡的游戏本，搭载24核i9-14900HX与满血RTX4060，双烤整机功耗203–205W，散热采用霜刃Pro5.0系统，屏幕为2.5K240Hz高色域电竞屏，接口丰富实用。

2025-12-18 22:24:08

946

首批搭载骁龙X Elite的笔记本评测解禁：续航表现亮眼，X86应用模拟效率成焦点首批骁龙XElite笔记本续航超15小时，但x86应用在ARM平台的效率与兼容性是关键问题，需通过启用ARM64原生应用、调优Prism模拟器、开启DirectML加速、禁用冗余x64服务及部署ARM64EC运行时五步优化。

2025-12-18 22:23:37

484

ROG掌机Ally X深度体验：续航补强后，它能否挑战Steam Deck的王座 ROGAllyX凭借80Wh电池、Z2Extreme能效优化和Windows11定制版，将续航提升至重度2小时22分、轻度4小时40分，较SteamDeckOLED多出近1.5小时；支持双USB-C拓展，适配移动办公与外接显示场景，但屏幕仍为IPS，高负载下续航有限且软件适配存短板。

2025-12-18 22:23:10

796

IQOO 13 系列全面体验：电竞旗舰的性能巅峰与百瓦快充再提速 iQOO13系列是当前安卓电竞旗舰性能标杆：骁龙8至尊版+Q2芯片实现稳帧低热，《原神》《星穹铁道》长时高画质不掉帧；2KQ10珠峰屏兼顾亮度、顺滑与护眼；6150mAh+120W快充边玩边充不烫手；IP68、超声波指纹等细节全面不妥协。

2025-12-18 22:21:20

661

影驰RTX 4070 Ti SUPER金属大师OC评测：2K高刷光追游戏的甜点新王影驰RTX4070TiSUPER金属大师OC是2K高刷+光追场景下稳帧低噪的甜点级选择，实测《黑神话：悟空》112帧、《赛博朋克2077》96帧，285WTDP配寒光星δ散热，满载温度≤68℃，静音智能停转，需ATX3.0电源支持。

2025-12-18 22:16:02

115

AMD Zen 5 处理器首批跑分流出：IPC增幅超预期，多核性能或将反超英特尔 Zen5架构性能提升源于前端增宽、执行单元扩容及缓存重构；通过CinebenchR23多核对比、CPU-Z同频单核测试、PassMark交叉验证、L1/ALU参数分析及AVX-512专项负载五步法可系统验证。

2025-12-18 22:02:02

416

技嘉推出新一代OLED游戏显示器：刷新率与防烧屏技术双双升级应启用OLEDCareAI防烧屏功能、匹配显卡与显示器刷新率档位，并执行像素刷新与暗场均衡校准。具体包括开启OLEDCare及AI模式、设屏保延迟为10分钟；在系统设置中选择对应型号最高刷新率，关闭G-Sync/FreeSync全局开关；断开信号源后长按菜单键触发像素重置，再运行黑平衡深度校准。

2025-12-18 20:19:02

759

相关专题

更多>

热门推荐

开源免费商场系统

广告

热门教程

更多>

相关推荐

热门推荐

最新课程

最新下载

更多>

网站特效

网站源码

网站素材

前端模板

关于我们免责申明举报中心意见反馈讲师合作广告合作最新更新: php中文网：公益在线php培训，帮助PHP学习者快速成长！; 关注服务号技术交流群

PHP中文网订阅号: 每天精选资源文章推送

Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号

PHP学习

技术支持

返回顶部