清华大学自然语言处理实验室、中国人民大学、面壁智能与 openbmb 开源社区共同推出并开源 agentcpm-report——一款面向本地部署、支持私有化运行、具备当前最优(sota)性能的深度调研型智能体。
AgentCPM-Report 核心优势
- 高效轻量,小模型大作为:依托平均约 40 轮的深度信息检索与近 100 轮的链式推理演进,实现对目标主题的全面挖掘与结构化重构,使终端侧轻量模型亦可稳定输出逻辑缜密、见解独到的万字级深度报告,在调研类任务中以仅 8B 参数规模达到与主流闭源系统的性能比肩水平。
- 完全离线,安全可控:专为高敏感数据场景定制,支持纯本地、无联网的敏捷部署,从根本上规避云端传输与存储带来的数据泄露风险。基于 UltraRAG 架构,可高效接入并深度理解用户本地私有知识库,在“数据不出域”的前提下,将核心资产安全转化为高价值的专业分析报告。

据项目团队介绍,AgentCPM-Report 能在 8B 参数量级上比肩顶级闭源系统,关键在于以下两项原创性技术突破:
突破一:“写作即推理”范式,让模型思考更拟人化
传统方法常要求模型一次性生成完整大纲或全文,极易引发逻辑断裂,尤其对中小规模模型而言挑战极大。AgentCPM-Report 首创“边写边想、动态迭代”的精炼框架,有效破解该瓶颈:
- 双态循环机制:系统在“初稿撰写”与“内容深化”两种状态间持续切换。类比人类专家工作流——完成一段初稿后,立即启动复盘:“是否遗漏关键视角?重点应如何倾斜?”,随即回溯拓展章节、追加检索、嵌入新论据。
- 分步渐进优化:将万字长文这一宏观任务,逐层拆解为多个可落地的微观子任务。模型每轮仅需聚焦解决当前局部问题,从而在有限参数约束下,稳定生成兼具严密逻辑与丰富细节的高质量长篇内容。
突破二:“多阶段智能体训练”,实现能力全栈升级
01 四大核心能力模块化构建
将端到端报告生成流程解耦为四大基础能力单元,并开展定向强化训练:
? 智能检索能力:以“召回准确率”为核心优化目标,保障所获取信息高度契合主题,为后续写作提供坚实语义支撑;
? 流畅表达能力:构建涵盖内容深度、逻辑连贯性、语言规范性等多维度的质量评估体系,全面提升文本表现力;
?️ 结构规划能力:对自动生成的大纲实施结构化校验,确保整体脉络清晰、层级合理、重点突出;
? 决策判断能力:引入“轨迹剪枝”策略,精准构造高质量训练样本,攻克智能体在复杂推演中“何时收束、何时深化”的关键决策难题。
02 三阶递进式训练路径:由基础到卓越
- 监督微调阶段:依托大量优质人工撰写的标杆范文,引导模型掌握专业报告的基本范式与行文风格;
- 原子能力强化阶段:针对检索、写作、规划、决策四大能力分别设计专项训练任务,实现单点突破;
- 全链路优化阶段:采用以最终报告质量为唯一奖励信号的端到端强化学习,打通各环节协同瓶颈,实现能力闭环融合。
AgentCPM-Report 开源地址
- GitHub:https://www.php.cn/link/85d451951b74d5024a7b396ec5f250b6*
- HuggingFace:https://www.php.cn/link/d596114d5e75e82bacec0041e467dfd7
- ModelScope:https://www.php.cn/link/c173f294fe9d99e7cd451455413a94e3
- GitCode:https://www.php.cn/link/c9d83f1c395e67e3945f46b2e550b185
- 魔乐社区:https://www.php.cn/link/5779285408aab2cf0ae3355162da7cf6










