InftyThink— 浙大联合北大推出的无限深度推理范式-人工智能-PHP中文网

InftyThink— 浙大联合北大推出的无限深度推理范式

心靈之曲

发布： 2025-06-11 16:12:11

原创

209人浏览过

InftyThink是什么

inftythink是一种创新的大模型推理方式，突破了传统模型在长推理任务中的限制。它采用分段迭代的方法，将复杂的推理过程拆解为多个短片段，并在每个片段后生成中间总结，实现分块思考。这种“锯齿形”内存机制，即周期性地清除旧信息、保留新总结，有效降低了计算复杂度，使模型能够处理理论上无限长度的推理链。

Fliki

高效帮用户创建视频，具有文本转语音功能

151

查看详情

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜
InftyThink的技术原理

迭代推理与阶段性总结：InftyThink将传统的单一连续推理流程划分为多个短推理阶段，在每一阶段结束后生成一个精炼的总结，作为下一阶段推理的上下文输入。这种方式模拟了人类逐步归纳的认知过程，使得模型可以在保持连贯性的同时进行深度推理，克服了传统方法在上下文长度和计算复杂度上的瓶颈。
固定计算开销与上下文窗口：InftyThink采用了一种“锯齿式”内存管理方式，在每轮短推理之后清空之前的上下文，仅保留总结内容，从而显著降低推理时的计算负担。相比传统方法，InftyThink在推理深度与效率之间取得了更好的平衡。
与原始架构解耦、训练兼容性强：InftyThink并不依赖于模型结构的改动，而是通过重构训练数据为多轮推理格式来实现其推理范式。它可以无缝集成到现有的预训练、微调及强化学习流程中，具备良好的工程落地能力。
开发数据重构技术：InftyThink研发了一种将现有长文本推理数据集转换为迭代格式的方法。例如，将OpenR1-Math数据集转化为33.3万条训练样本，便于在该范式下进行模型训练。