MaskSearch— 阿里通义推出的检索增强预训练框架

碧海醫心
发布: 2025-06-11 10:32:17
原创
489人浏览过

MaskSearch是什么

masksearch是由阿里巴巴通义实验室开发的一种全新通用预训练框架,旨在增强大型语言模型(llm)的智能搜索能力。该框架通过引入检索增强掩码预测(ramp)任务,在输入文本中对关键信息进行掩码处理,并利用外部知识库调用搜索工具来预测被掩盖的内容,这些内容包括命名实体、日期、数字以及本体知识等关键要素,从而提升任务复杂度,促使模型更精细地处理信息。在生成监督微调(sft)数据过程中,采用多智能体系统,包括规划者、重写者、观察者等角色,共同生成思维链数据,提高数据质量。其训练策略融合了sft与强化学习(rl),并通过动态采样策略优化(dapo)算法构建混合奖励机制,结合课程学习方法,根据掩码数量划分样本难度,使模型循序渐进地掌握技能。

MaskSearch— 阿里通义推出的检索增强预训练框架MaskSearch的主要功能

  • 增强问答能力:显著提升LLM在开放域多跳问答场景下的表现,尤其在领域内和跨领域任务中,强化模型对复杂问题的理解与回应能力。
  • 广泛适用性:借助RAMP任务和多智能体生成的思维链数据,模型能更好地应对多样化的问答任务,提升在各类应用场景中的适应性。
  • 支持多种训练方式:兼容SFT与RL两种训练方法,可根据具体任务需求灵活选择合适的训练策略。
  • 大规模数据扩展:通过构建超大规模预训练数据集(如包含1000万个样本),有效提升模型训练效果和可扩展潜力。

MaskSearch的技术原理

  • 检索增强掩码预测(RAMP)任务:MaskSearch的核心技术是RAMP任务,灵感来源于BERT的掩码机制,通过对输入文本中的关键信息进行掩码处理,再借助外部知识库调用搜索工具来预测被掩盖的部分。除常见的命名实体、日期和数字外,还涵盖本体知识、专业术语及数值等内容,提高了任务复杂性,推动模型在检索与推理过程中实现精细化的信息处理。
  • 多智能体协同生成思维链(CoT)数据:为了获得高质量的监督微调(SFT)数据,MaskSearch设计了一个由多个智能体组成的协作系统,包括规划者、重写者、观察者等角色,协同完成思维链的生成。最终由一个LLM负责验证答案,仅保留正确的推理路径。为高效扩展数据集并保持其质量,使用已有数据训练出教师模型,直接生成推理轨迹,并通过迭代不断优化教师模型,逐步提升数据质量。
  • 强化学习(RL)机制:在强化学习模块中,MaskSearch应用了动态采样策略优化(DAPO)算法,构建了一个包含格式奖励与回答奖励的混合奖励体系。格式奖励用于评估模型输出是否符合规定格式,而回答奖励则衡量生成答案与标准答案之间的匹配程度。最终采用基于模型的奖励函数,使用Qwen2.5-72B-Instruct作为评价器,为生成结果与参考答案的一致性打分。
  • 课程学习策略:MaskSearch引入了课程学习机制,依据掩码数量将训练样本按难度分级,让模型从简单到复杂逐步学习,不断提升自身能力。

MaskSearch的项目地址

MaskSearch的应用场景

  • 智能客服系统:在智能客服领域,MaskSearch可帮助系统更精准地理解用户问题,快速检索相关信息,提升响应效率与客户满意度。
  • 教育辅助工具:在教育行业中,MaskSearch可用于打造智能辅导平台,协助学生理解和解决复杂学术难题。它能够根据学生提问,检索相关知识点和解答方案,提供个性化的学习指导。
  • 企业内部搜索系统:企业级搜索系统通常需要处理大量内部资料和复杂的查询请求。MaskSearch可增强这类系统的检索能力,使其更准确地把握用户意图,从庞杂的数据中快速提取有价值的信息,提升决策效率。
  • 机器学习调试与优化:MaskSearch还可应用于机器学习模型的调优过程。例如,在调试图像分类模型时,可通过掩码属性查询图像数据库,识别模型学习过程中的虚假关联,分析模型显著性与人类注意力之间的差异。

以上就是MaskSearch— 阿里通义推出的检索增强预训练框架的详细内容,更多请关注php中文网其它相关文章!

最佳 Windows 性能的顶级免费优化软件
最佳 Windows 性能的顶级免费优化软件

每个人都需要一台速度更快、更稳定的 PC。随着时间的推移,垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是,许多工具可以让 Windows 保持平稳运行。

下载
来源:php中文网
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn
最新问题
开源免费商场系统广告
热门教程
更多>
最新下载
更多>
网站特效
网站源码
网站素材
前端模板
关于我们 免责申明 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送
PHP中文网APP
随时随地碎片化学习
PHP中文网抖音号
发现有趣的

Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号