AI编程已杀疯,机器学习论文代码自动生成,100%开源,支持DeepSeek!

爱谁谁
发布: 2025-07-02 13:04:01
原创
723人浏览过
AI编程已杀疯,机器学习论文代码自动生成,100%开源,支持DeepSeek!图片

大家好,我是 ai 学习的老章

之前推荐过 N 多读论文神器,比如可以用大模型下载论文、总结论文,效率飞起的 ArXiv MCP 服务器、整篇译并保留样式的看论文神器,一键译,体验很爽、还有最近刚刚分享的斯坦福学生搞出的论文神器太逆天!秒搜热门论文,3分钟搞定论文总结、译,效率飙升100倍!的 AlphaXiv

今天再推荐一个更强大的,可以复现机器学习论文代码的工具——Paper2Code

开源代码不支持 DeepSeek ,稍作修改就可以使用 DeepSeek API 了

AI编程已杀疯,机器学习论文代码自动生成,100%开源,支持DeepSeek!https://arxiv.org/pdf/2504.17192

https://arxiv.org/pdf/2504.17192

一句话总结,PaperCoder 旨在通过利用大型语言模型(LLM)在多代理系统中直接从机器学习研究论文中生成完整的、可执行的代码库。

AI编程已杀疯,机器学习论文代码自动生成,100%开源,支持DeepSeek!PaperCoder 框架的三阶段方法,展示了它如何通过规划、分析和编码阶段将研究论文转换为代码库

PaperCoder 框架的三阶段方法,展示了它如何通过规划、分析和编码阶段将研究论文转换为代码库

顶级机器学习会议的分析表明,只有一小部分被接受的论文提供了相应的代码:

AI编程已杀疯,机器学习论文代码自动生成,100%开源,支持DeepSeek!在 ICLR 2024 上接受的论文中只有 21.2%,在 NeurIPS 2024 上接受的论文中只有 10.9%,在 ICML 2024 上接受的论文中只有 31.6% 提供了公开发布的代码

在 ICLR 2024 上接受的论文中只有 21.2%,在 NeurIPS 2024 上接受的论文中只有 10.9%,在 ICML 2024 上接受的论文中只有 31.6% 提供了公开发布的代码

PaperCoder 通过将研究库生成形式化为软件开发问题来解决可重复性挑战。

该框架可以表示为 M(R) = C,其中:

R 是包含方法和算法的研究论文C 是生成的代码库M 是执行转换的基于 LLM 的模型

该系统采用三阶段方法,该方法反映了人类的软件开发过程:

规划阶段:创建高级路线图,包括架构设计(类图和序列图)、文件依赖关系识别和配置文件生成。分析阶段:对每个文件和函数进行细粒度的解释,分析输入、输出、交互和算法约束。生成阶段:根据规划期间确定的执行顺序合成整个代码库。

每个阶段都使用专门的 LLM 代理来实现,这些代理协同工作以完成任务,这使得 PaperCoder 成为一个复杂的多代理系统。

AI编程已杀疯,机器学习论文代码自动生成,100%开源,支持DeepSeek!图片

效果怎么样呢?

PaperCoder 的性能优于软件开发工作基线,如 ChatDev 和 MetaGPT,表明其专门设计的有效性。

作者与专家(包括原始论文作者)进行了评估,以评估生成代码的质量。结果显示:

PaperCoder 生成的存储库中有 77% 被人类评估者评为最佳85% 的人类评审员报告说生成的存储库很有帮助
AI编程已杀疯,机器学习论文代码自动生成,100%开源,支持DeepSeek!图片

如何使用呢?

AI编程已杀疯,机器学习论文代码自动生成,100%开源,支持DeepSeek!图片

安装

代码语言:javascript代码运行次数:0运行复制
pip install openaiexport OPENAI_API_KEY="<OPENAI_API_KEY>"git clone https://github.com/going-doer/Paper2Codecd Paper2Codegit clone https://github.com/allenai/s2orc-doc2json.gitcd scriptsbash run.sh
登录后复制

输出结果如下

代码语言:javascript代码运行次数:0运行复制
outputs├── Transformer│   ├── analyzing_artifacts│   ├── coding_artifacts│   └── planning_artifacts└── Transformer_repo  # Final output repository
登录后复制

系统的工作流程是:

将 PDF 论文转换为 JSON 格式 0_pdf_process.py:4-17分析论文内容并生成实现计划 1_planning.py:26-36进行逻辑分析 2_analyzing.py:49-54生成代码实现 3_coding.py:43-50
AI编程已杀疯,机器学习论文代码自动生成,100%开源,支持DeepSeek!图片

不过这个项目是默认 OpenAI 的 api,本地运行也只支持 vllm 拉起的模型

我看了一下,其实该起来也非常简单

比如把 OpenAI 切换为 DeepSeek,需要修改的脚本不多

修改 API 客户端初始化和调用:

codes/1_planning.py - 规划生成组件 1_planning.py:1-16codes/2_analyzing.py - 逻辑分析组件 2_analyzing.py:1-20codes/3_coding.py - 代码生成组件 3_coding.py:1-19

代码语言:javascript代码运行次数:0运行复制
client = OpenAI(api_key = os.environ["OPENAI_API_KEY"])
登录后复制

修改为下面即可

代码语言:javascript代码运行次数:0运行复制
client = OpenAI(api_key = os.environ["OPENAI_API_KEY"],base_url="https://api.siliconflow.cn/v1")
登录后复制

如果你用的是 DeepSeek 官方 API,base_url 改为 https://api.deepseek.com_/v1

其他类似

然后修改scripts/run.sh中的环境变量设置: run.sh:1-3

代码语言:javascript代码运行次数:0运行复制
export OPENAI_API_KEY="sk-XXXXXX"GPT_VERSION="deepseek-ai/DeepSeek-R1"
登录后复制

然后就全部 ok

最后推荐一个我正在学习的Cusor快速入门与实战

以上就是AI编程已杀疯,机器学习论文代码自动生成,100%开源,支持DeepSeek!的详细内容,更多请关注php中文网其它相关文章!

豆包AI编程
豆包AI编程

智能代码生成与优化,高效提升开发速度与质量!

下载
来源:php中文网
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn
最新问题
开源免费商场系统广告
热门教程
更多>
最新下载
更多>
网站特效
网站源码
网站素材
前端模板
关于我们 免责申明 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送
PHP中文网APP
随时随地碎片化学习
PHP中文网抖音号
发现有趣的

Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号