

根据 Hugging Face 页面信息,深度求索 DeepSeek 团队正式推出新一代大语言模型 DeepSeekMath-V2,专注于实现可自验证的数学定理证明能力,在数学推理的可靠性方面取得关键突破。
该模型创新性地构建了一个高精度、高保真度的验证器,并将其作为奖励机制来引导证明生成器进行自我修正,从而形成“生成—验证—优化”的闭环训练流程。为应对生成与验证双重能力同步进阶的技术难题,研究团队提出通过扩展验证计算资源,自动标注难以验证的样本数据,持续提升验证器的判断能力。

在多项国际顶级数学竞赛中表现亮眼:


在 IMO 2025、CMO 2024 和 Putnam 2024 等权威赛事中,DeepSeekMath-V2 展现出卓越的数学推理能力,斩获接近满分的优异成绩。团队指出,这一成果证实了“自验证”推理范式的可行性,为未来构建可信、可靠的数学智能系统开辟了新路径。本模型基于 DeepSeek-V3.2-Exp-Base 打造,现已依据 Apache 2.0 开源协议公开发布。
论文标题:DeepSeekMath-V2: Towards Self-Verifiable Mathematical Reasoning 模型地址:https://www.php.cn/link/77472e4d3e1b601a50cfb29be6539a3f 论文地址:https://www.php.cn/link/6ca757657eb93d1f04d87b4de35f4a7e
源码地址:点击下载
以上就是DeepSeekMath-V2 开源发布,世界首个奥数金牌 AI的详细内容,更多请关注php中文网其它相关文章!
Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号