阶跃星辰正式开源了参数量达320亿(32b)的深度研究专用大模型:step-deepresearch。该模型在深度研究任务上的表现已比肩openai o3-mini与gemini 2.0 flash等顶尖商业模型,而单次调用成本却降至其十分之一以内。

https://www.php.cn/link/ae5ef52da81b8f483ac166475587ad87
模型简介
Step-DeepResearch是一款兼顾高性能与高性价比的端到端深度研究智能体模型,专为开放式科研场景下的自主信息挖掘与专业级报告生成而打造。
- 原子化能力融合:将复杂研究流程拆解为可学习、可评估的原子能力模块(涵盖任务规划、多源信息检索、多轮反思与交叉验证、结构化报告生成),并在模型内部实现深度融合,确保单次前向推理中即可完成闭环式思考与实时纠错。
- 渐进式智能体训练范式:构建从智能体中期训练、监督微调(SFT)到强化学习(RL)的全链路优化路径,将建模目标由传统语言建模的“预测下一个词元”转向“决策下一个原子动作”,显著提升模型在动态、不确定研究环境中的适应性与泛化力。
- 小模型大能力:尽管参数规模仅为32B,Step-DeepResearch在Scale AI Research Rubrics基准测试中斩获61.4分,与OpenAI Deep Research及Gemini Deep Research等闭源旗舰模型持平;在ADR-Bench专家人工评测中,其Elo得分超越DeepSeek-v3.2、GLM-4.6等更大参数模型,整体表现直追顶级商业方案。
- 极致成本优势:在维持专家级研究质量的前提下,大幅压缩部署与推理开销,成为当前业界单位性能成本最低的深度研究智能体解决方案。
- 便捷接入方式:支持通过StepFun开放平台API调用,新用户首月免费体验。

(左)研究效能-成本权衡图谱:Step-DeepResearch以61.42的高分逼近性能天花板,同时推理成本(RMB)显著低于同类方案,稳居高效能前沿。(右)ADR-Bench专家评分对比:在所有评估维度中,Step-DeepResearch均取得领先Elo分数,实力媲美一线闭源模型。
架构设计
Step-DeepResearch采用基于ReAct范式的单智能体架构,依托“推理→行动→反思”的迭代循环机制,驱动自主、可控、可追溯的深度研究过程。
依托自研轻量化工具集,模型原生支持本地化部署与执行,内置四大核心工具:batch_web_surfer(批量网页搜索与内容提取)、file(文件读写与编辑)、todo(研究任务状态追踪与管理)、shell(系统级命令交互),全面覆盖科研全流程需求。

Step-DeepResearch系统架构示意:智能体在ReAct循环中协同调用专用工具(如batch_web_surfer、todo、shell),完成研究规划、步骤执行与结果反思,最终输出高质量研究报告。
开源地址:https://www.php.cn/link/ae5ef52da81b8f483ac166475587ad87
源码地址:点击下载










