DeepSWE— Together.ai联合Agentica开源的AI Agent框架

聖光之護
发布: 2025-07-04 18:34:01
原创
596人浏览过

DeepSWE介绍

deepswe是由together.ai与agentica联合推出的ai agent框架,基于qwen3-32b模型并通过强化学习训练构建。该框架在swe-bench-verified基准测试中表现优异,启用测试时扩展(tts)后准确率达到59.0%,未使用tts时pass@1准确率为42.2%,位居开源agent框架首位。该项目全面开源了模型训练数据、代码及评估日志,有助于开发者学习和优化agent技术,推动强化学习在软件工程领域的应用发展。

DeepSWE— Together.ai联合Agentica开源的AI Agent框架DeepSWE的核心功能

  • 代码理解与修改:能够解析并编辑现有代码,解决特定的软件问题或实现新功能。
  • 复杂问题处理:通过与环境的交互,解决如GitHub上的缺陷修复、新增功能实现以及调试等复杂的软件工程任务。
  • 自动化测试与验证:运行shell命令进行代码构建和测试,确保所提出的解决方案有效,并防止修改破坏原有功能。
  • 多阶段推理能力:在执行任务过程中具备多步骤推理和决策能力,逐步优化方案直至任务完成。

DeepSWE的技术机制

  • 纯强化学习训练:完全采用强化学习(RL)从零开始训练,不依赖于监督微调(SFT)或更强的专有教师模型蒸馏。
  • rLLM系统支持:利用rLLM框架进行后期训练,提供高效的数据管理与训练流程,支持大规模RL训练。
  • 稀疏奖励机制:仅当生成的代码补丁通过所有测试时才给予正向奖励,否则无奖励,促使模型追求高质量输出。
  • 测试时扩展策略(TTS):在测试阶段生成多个解决路径,并选择成功解决问题的路径,显著提升准确率。结合执行验证器与非执行验证器的优势,大幅提升性能表现。
  • Kubernetes集成:为应对训练过程中的扩展挑战,集成了Kubernetes支持,实现容器的弹性调度与自动缩放,保障训练的高效与稳定。

DeepSWE的项目链接

DeepSWE的应用领域

  • 代码理解与重构:DeepSWE可自动分析并修改代码,快速定位漏洞、优化性能瓶颈及重构代码结构,从而显著提升代码质量。
  • 软件问题解决:能够高效处理GitHub上的各类问题、实现新功能并将复杂任务拆解为可执行的子任务,快速攻克各种软件难题。
  • 自动化测试与验证:DeepSWE可自动生成测试用例,执行代码构建与自动化测试,进行回归测试以确保软件稳定性,降低人工测试工作量。
  • 多阶段推理与方案优化:通过多步骤推理解决复杂问题,并不断迭代优化解决方案,在实践中积累经验,更好地应对未来挑战。
  • 开发辅助与团队协作:DeepSWE能为开发者提供实时代码建议与补全提示,协助项目管理和任务分配,促进团队合作与交流,提升整体开发效率。

以上就是DeepSWE— Together.ai联合Agentica开源的AI Agent框架的详细内容,更多请关注php中文网其它相关文章!

豆包AI编程
豆包AI编程

智能代码生成与优化,高效提升开发速度与质量!

下载
来源:php中文网
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn
最新问题
开源免费商场系统广告
热门教程
更多>
最新下载
更多>
网站特效
网站源码
网站素材
前端模板
关于我们 免责申明 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送
PHP中文网APP
随时随地碎片化学习
PHP中文网抖音号
发现有趣的

Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号