离职的杨立昆(lecun),转身便向 meta 抛出一记重击:饱受诟病的 llama 4,确实存在“刷榜”操作!
结果的确被轻微调整过。 为追求更优指标,团队在不同基准测试中切换使用了多个模型版本。

常言道:莫招惹离职人。不只杨立昆,田渊栋也在其个人年度复盘中悄然揭开一角内情。
明明是被临时抽调来为 Llama 4 紧急救场的,出发前我预设了四种可能路径,结果扎克伯格直接甩给我第五种……
(扶额苦笑.jpg)

Anyway,关于离职后的动向,两位业界泰斗竟不约而同地选择了同一答案:创业!

Llama 4 刷榜风波引爆的离职连锁反应
DeepSeek 的强势崛起,确实给小扎带来了不小压力。
早前就有传闻指出,DeepSeek 的惊艳亮相,令尚未发布的 Llama 4 还未登场便已落后身位,迫使扎克伯格大幅加码 AI 领域投入。
这一说法也得到了杨立昆本人的侧面印证。
小扎确实焦虑了——对内高强度施压,要求 GenAI 部门提速研发与落地节奏,并紧急召回原 FAIR 团队核心成员田渊栋驰援。
但随之而来的,是内部协作机制的迅速瓦解:杨立昆团队希望探索前沿方向,而管理层更倾向快速复用已有、可商用的技术路径。
真正的引爆点,正是 Llama 4 的全面失利。

不仅关键指标落败,更因榜单数据操纵引发舆论哗然,导致小扎彻底丧失对整支团队的信任,将其集体边缘化。
Meta 随即启动大规模组织重构:一面以天价薪酬从硅谷各处争抢顶尖人才,一面大刀阔斧裁撤原有骨干。
田渊栋及其团队,成为首批被波及的对象。一月仓促入局 Llama 4 救火,十月 Llama 4.5 训完即遭“卸磨杀驴”。这波操作,田渊栋真得喊一声冤……
迫于上层压力,全组不得不中断手头所有项目,紧急接手 Llama 4 的烂摊子——距发布仅剩两个月,还要包揽全部脏活累活。
为此,田渊栋当时还专门绘制了一张 2×2 回报矩阵,系统评估了此事可能导向的四种结局:

但老板指令已下,不容推脱。田渊栋索性抱着“尽力而为、问心无愧”的心态投入其中。
结果辛辛苦苦干了几个月,小扎一个预案都没采纳,直接抛出 Plan E:不对负责人追责,转头将田渊栋与整个小组全员清退。

难怪他在事后复盘时感慨:
这也让我对社会运行的复杂性,有了更切肤的认知。
好在田渊栋心态豁达,坦言自己已在 Meta 待了十余年,近几年更是常怀“公司快把我开了吧”的念头,因此这次变故反倒成了意外之喜,甚至为他后续的小说创作积攒了不少鲜活素材(doge)。

(咳咳)回归正题,这几个月对田渊栋而言也并非毫无收获——他在强化学习训练的核心难题上,取得若干新进展。
首先是大模型推理方向:继 2024 年底团队公开的连续隐空间推理框架(coconut)引发广泛关注后,团队又通过理论研究《Reasoning by Superposition》进一步厘清了该范式的优势本质。
同时,也从多角度推进推理效率优化:Token Assorted 利用隐空间离散 token 压缩计算开销;DeepConf 基于置信度动态提前终止推理;ThreadWeaver 构建并行思维链加速推理流程;以及在不同规模模型中,借助 RL 方法习得自主推理能力。
在模型可解释性方面,研究聚焦于 Grokking(顿悟)这一典型涌现现象,从“记忆→泛化”的突变过程切入,试图回答三个根本问题:模型究竟学到了什么?它与输入数据之间存在何种映射关系?其泛化边界又在哪里?——简言之,就是努力撬开那口黑箱。
一句话总结:对于这场被迫“背锅”的经历,田渊栋对老东家仍留有体面——纵使你不够厚道,我也选择翻篇。

相较之下,紧随其后离职的杨立昆则毫不留情,直指 Meta 内部对大语言模型的过度迷恋,尤其点名批评新引进的“超级智能实验室”成员。
他特别提及亚历山大王:年轻、经验尚浅。
虽学习能力强,却缺乏扎实的研究素养——既不懂如何开展系统性科研,也不知如何与资深研究员协同共事。
在杨立昆眼中,这位年仅 27 岁的年轻人,简直像个“little baby”。
但他强调,大语言模型远非万能解药。杨立昆直言:
LLM 是一条死胡同。
若想通向人类水平的智能,必须构建对物理世界运行规律的理解能力——即他长期深耕的“世界模型”。而 Meta,早已对此失去耐心。
研究理念的根本分歧,最终促使杨立昆决意离开,开启人生全新阶段——创业。
离开 Meta 后做什么?创业
杨立昆创立的新公司名为 Advanced Machine Intelligence(AMI),专注方向仍是其毕生所求的“世界模型”,且坚持100% 开源路线。
不过据他本人透露,他将出任新公司的执行主席,而非 CEO。
我本质上是一名科学家:我能激发团队热情,也能预判技术趋势,但我不擅长组织管理,而且……确实年纪不小了。
杨立昆将在 AMI 拥有与 Meta 时期同等的研究自主权;而实际运营与领导职责,则交由法国医疗 AI 初创公司 Nabla 的联合创始人兼 CEO Alex LeBrun 全权负责。

他们当前的核心目标,是推进 V-JEPA 架构的研发——通过视频与空间数据的学习,让 AI 理解物理世界的因果逻辑,从而具备规划能力、长程推理能力与持续记忆能力,即杨立昆口中所定义的“高级机器智能”。
杨立昆预计,该技术的初版将在 12 个月内面世,并在未来数年内迎来实质性突破。尽管距离超级智能仍有遥远距离,但它确实在通往 AGI 的征途上,点亮了一盏微光。

作为杨立昆昔日得力干将,田渊栋亦婉拒了多家头部科技企业的高薪邀约,正式官宣开启创业征程!
具体方向暂未披露,但他明确表示:
趁着自己还算年轻,去担任一家全新初创公司的联合创始人。
无论前路如何,先沉下心来,踏实干一阵再说。
参考链接:
- [1] https://www.php.cn/link/0bb3498deb34e18fa94d2c9d6a443c07
- [2] https://www.php.cn/link/ef29d115ef661659677e4dc28fb1a57b
本文来自微信公众号:量子位(ID:QbitAI),作者:鹭羽,原标题《LeCun 曝 Meta 作弊刷榜,田渊栋:我没想到这个结局》










