快手 kwaipilot 团队近日推出了 kat-dev-72b-exp。
这是 KAT-Coder 系列模型在强化学习方向上的实验性升级版本,在权威软件开发评测基准 SWE-Bench Verified 上实现了 74.6% 的成绩,刷新了开源大模型在该领域的性能纪录。

据悉,该模型依托快手自主研发的工业级强化学习框架 SeamlessFlow,通过全新的数据平面设计,实现了训练流程与 Agent 的彻底解耦,有效支撑多智能体协作及在线强化学习等高复杂度场景。
为应对复杂 Agent 架构带来的技术难题,团队创造性地引入 Trie Packing 技术,并对底层训练引擎进行深度重构,显著提升了模型在共享前缀行为序列上的训练效率。结合难度感知的策略优化机制,模型在探索与利用之间达成良好平衡。同时,借助基于海量开源代码库构建的大规模、端到端可验证的软件工程任务集,KAT-Dev-72B-Exp 在实际编程能力上展现出卓越表现。
免费体验 KAT-Coder:https://www.php.cn/link/127449db06658be5e1bc1cd51bde8b78
KAT-Dev-72B-Exp 开源项目地址:https://www.php.cn/link/58e473658c4b6757ec8379817d35e6fa
以上就是快手 Kwaipilot 团队开源 KAT-Dev-72B-Exp的详细内容,更多请关注php中文网其它相关文章!
 
                 
                                
                                 收藏
收藏
                                                                             
                                
                                 收藏
收藏
                                                                             
                                
                                 收藏
收藏
                                                                            Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号