人工智能中的RAG技术在测试领域的探索 - 人工智能

博主信息

博文 530

粉丝 0

访问量 122733

专题推荐

更多>

RAG是什么？

RAG，全称Retrieval Augmented Generation，翻译过来就是检索增强生成，随着大模型技术的应用，我们听到这个词的频率越来越高，可以说是当下最火的一种应用方案。

简单来说，就是增强大模型的知识领域，从而生成更准确和信息丰富的文本。

相信大家或多或少的都接触过GPT或者类似的诸如文心一言、通义千问等等LLM(大语言模型，下文将以此简称)的使用，能力强大，但是依然有明显的无法满足部分实际业务的场景：

知识局限：LLM的知识来源仅限于它的训练数据，而这些训练数据都是基于网络上已公开的数据且不具有实时性，当我们的知识库是属于某个非公开的专业领域时(例如我司各个业务线的产品需求设计，技术设计等)，LLM就不再具备。

模型幻觉：当我们使用LLM时，偶尔也会发现它的回答完全不对，但是仍然在输出，也就是一本正经的胡说八道，这个时候很可能就是出现了LLM的幻觉问题；也就是问题涉及某一专业领域，但是LLM本身不具备，但是LLM的输出原理是基于数学概率的，有的时候仔细观察会发现LLM回答时候会一个字一个字的往外吐，也就是基于上下文在计算接下来回答最有可能是什么，是哪个字，所以即便不具备此领域知识，仍然可以计算得到LLM本身认为概率最大的回答。

因此为了解决上述问题，我们就需要引入RAG技术

从RAG的名称(检索增强生成)也可以很清晰的知道，其核心组成就是检索+生成；可以检索到我们想知道的相关信息，然后依靠LLM生成我们想知道的答案。而想要更快速准确的检索到相关信息，我们就还需要索引。

索引的主要工作，就是将我们的本地私有知识库进行向量化存储，利用向量数据库的高效存储和检索能力，召回目标知识，供LLM分析使用。

索引的过程一般大体上有如下几步：

1、本地数据加载：数据可能有多种形式，Json、txt、Markdown、PDF等

2、数据切片：本地的数据可能一份很大，对于检索的准确度和LLM对token的限制都有影响，所以我们需要将数据分割成若干个小块；

过程中切片的大小，重叠的多少，以及以何种方式断句分割都对后续的检索效果有一定的影响。因为文本只有语义关联的，一个句子如果还没有说完，中间直接截断，那么就会造成上下文语义不清晰的情况。

3、向量存储：这一步，利用使用VectorStore和Embeddings模型来完成将切片数据进行存储和索引，以供后续的检索使用

1、检索：通过检索器对切片分割的数据进行检索，其中可能涉及多种检索方式的融合，例如相似性，可按照相似度排分进行召回top-k个结果

2、生成：LLM使用包含问题和检索到的数据的Prompt生成答案

应用：

1、问答系统

现代问答系统需要处理各种各样的问题，从简单的事实查询到复杂的推理问题。传统生成模型在处理这些问题时，可能会因为缺乏足够的上下文信息而产生不准确的回答。RAG通过检索相关文档，为生成模型提供了丰富的背景知识，从而生成更准确和详细的回答。

示例：

医疗问答系统：医生或患者可以通过问答系统获取医疗建议和信息。RAG可以通过检索医学文献和研究报告，提供科学依据和详细解释。
法律问答系统：律师或普通用户可以查询法律问题，RAG可以通过检索法律文本和案例，提供专业的法律解答。
需求问答系统：公司目前业务线繁多，迭代快，功能杂，靠人工记住所有的需求细节不现实，而获取需求的直接方式往往不是查看需求文档，可能是咨询测试工程师，这期间的时间与精力的消耗是在不经意间的。而通过RAG，可以让相关的产品、研发、销售，甚至测试工程师自己优先像AI提问，降低中间沟通成本。

2、内容生成

在内容生成应用中，如新闻写作、报告生成和产品描述，RAG可以通过检索相关资料，生成内容丰富且信息准确的文本。这不仅提高了生成内容的质量，还节省了大量的人工编辑时间。

示例：

新闻写作：记者可以使用RAG生成新闻稿，通过检索相关背景资料和历史事件，生成详细且具有新闻价值的报道。
产品描述：电商平台可以使用RAG生成产品描述，通过检索产品评论和用户反馈，生成详细且吸引人的产品介绍。
用例生成：用例的编写具备一定程度上的标准格式，例如固定的用例描述、前置条件、测试步骤、预期结果等，测试工程师可以使用RAG补充自己的业务需求描述以及用例生成维度(冒烟用例、边界值、异常值等)，生成覆盖尽可能全面的测试用例