kimi-researcher 是由月之暗面推出的 kimi 所研发的全新一代 agent 模型,基于端到端自主强化学习(end-to-end agentic rl)技术训练而成,专为执行高深度的研究任务而设计。该模型具备自主规划任务流程的能力,能够通过问题澄清、深入推理、主动搜索以及调用工具等多个环节,最终输出高质量的研究成果。
其核心能力包括:主动提问以明确问题边界、平均进行 23 步推理以实现深度分析、利用 74 个关键词和 206 个网址筛选出高质量信息、调用工具处理原始数据并得出结论。此外,Kimi-Researcher 还能生成超过万字的研究报告,引用约 26 个权威信源,并支持生成可交互的动态可视化报告,便于用户快速掌握关键信息。
Kimi-Researcher的主要功能
-
问题澄清:通过主动提问帮助用户更清晰地定义问题。
-
深度推理:每个任务平均进行 23 步逻辑推理,自主梳理并解决复杂需求。
-
智能搜索:平均生成 74 个关键词,从海量信息中筛选出质量最高的前 3.2% 内容。
-
工具调用:自动调用浏览器、代码等工具处理数据并形成分析结果。
-
研究报告生成:输出万字以上报告,引用约 26 个高质量资料,所有来源均可追溯。
-
可视化报告:提供结构化排版与思维导图,便于快速理解重点内容。
-
异步处理机制:采用异步方式提升输出质量和信息覆盖范围。
Kimi-Researcher的技术原理
-
端到端强化学习:采用端到端的自主强化学习方式,模型在训练过程中自行试错,将整个任务视为整体进行优化,无需依赖预设提示或固定流程。
-
无结构化设计:作为零结构 Agent,没有复杂的提示词或流程设定,推理模式完全由训练过程自然演化而来。
-
结果导向学习机制:只有在任务真正完成并取得正确结果时,模型才会获得奖励信号,驱动其持续优化行为策略。
-
轻量记忆机制:不设固定记忆模块,而是由模型自主决定哪些信息值得保留及如何调用。
-
面向 Agent 的训练架构:配备支持异步执行和灵活接口的训练基础设施,结合“分步回滚”机制提升长序列任务的学习效率。
-
多模态与长链推理:通过文本与视觉数据联合训练增强多模态处理能力,并借助长思维链训练提升逻辑推理水平。
Kimi-Researcher的项目地址
如何使用Kimi-Researcher
-
访问入口:前往 Kimi 官方网站或在微信小程序中搜索“Kimi 智能助手”。
-
申请内测权限:点击申请测试资格,并提交你希望 Kimi-Researcher 研究的问题。
-
主要功能
-
深度研究模式:Kimi-Researcher 将自主制定执行计划,涵盖问题澄清、深度推理、主动搜索及工具调用,最终输出研究报告。(每月限 20 次,同时支持 1 条任务并发)
-
动态可视化报告:生成结构化排版的可视化报告,便于快速掌握核心结论。
-
联网检索:支持实时联网获取最新信息,并整合总结相关内容。
-
输入问题:在对话框中输入你的具体问题或指令,Kimi-Researcher 将据此展开研究。
-
上传文件:支持 PDF、Word、Excel、PPT、TXT 等多种格式文件上传,最多可上传 50 份文件,每份不超过 100MB。
-
指定操作:明确告知所需操作类型,如提取重点、翻译、总结等。
-
使用技巧
-
继续执行功能:在处理长文档时,点击“继续”按钮保持模型思路连贯。
-
常用语设置:配置快捷指令快速启动特定任务。
-
角色模拟:让 Kimi-Researcher 模拟特定角色(如专家、面试官等),辅助完成专业任务。
-
验证建议:对于 Kimi-Researcher 提供的分析结果,建议结合自身知识进行核验,确保准确性。
Kimi-Researcher的基准测试表现
-
“人类最后一次考试”(Humanity’s Last Exam, HLE)
-
Pass@1 准确率:26.9%
-
Pass@4 准确率:40.17%
- 表现优于 Claude 4 Opus(10.7%)、Gemini 2.5 Pro(21.6%),略高于 OpenAI Deep Research(26.6%),与 Gemini-Pro 的 Deep Research Agent 并列第一(26.9%)。
-
红杉中国 xbench 基准测试:在 DeepSearch 任务中,Kimi-Researcher 平均通过率达到 69%,领先于榜单上其他模型。
Kimi-Researcher的应用场景
-
科研辅助:用户可查询最新研究成果,Kimi 会搜索并提供相关文献、数据与分析报告。
-
市场趋势洞察:分析市场动向、消费者行为及竞争对手策略,输出详尽的市场研究报告。
-
教学材料编写:教师可借助 Kimi-Researcher 编写教案,生成完整的课程结构。
-
法律政务应用:自动识别合同风险条款并提出修改建议;自动整理证据链并与法律条文匹配,生成附带法律依据的案情摘要报告。
以上就是Kimi-Researcher— Kimi推出的深度研究Agent模型的详细内容,更多请关注php中文网其它相关文章!