
ChatGPT
RAG并非随着ChatGPT的流行才诞生,它早在2020年就已经提出。最初,这是一种端到端的方法,融合了预训练的检索器和生成器,主要依靠模型微调提升性能。大部分关于RAG的研究集中在2020年后,尤其是2022年12月ChatGPT发布后,这一事件成为关键转折点。此后,RAG更多地借助大语言模型(LLM)的推理能力,通过结合外部知识实现更优的生成效果,并衍生出多种技术和方法。不过,你无需记住每个缩写的含义(其实我也不全知道)。
文章依据RAG技术分为三类,体现不同技术复杂度,复杂度越高,实现难度越大,但效果可能更好,适用场景更广。这三类为:

AI
这一步需确保数据质量并优化索引,使检索器能精准获取相关内容,文中提出了五种方法。检索器可优化之处主要包括:检索后处理可优化的环节包括:换个角度,从可增强的阶段、数据类型与流程出发,思考如何取得更优的结果。文中出现却未在思维导图中呈现的方法还有以下几种:文章介绍了评估RAG有效性的两种主要方法:独立评估与端到端评估。独立评估 focuses on 分别考察检索模块和生成模块的表现,即模型在阅读和整合信息方面的能力。而端到端评估则针对RAG模型对特定输入生成的最终回复进行检验,重点关注生成答案与查询的关联性和一致性。此外,文中还简要说明了RAGAS和ARES这两种评估框架的基本情况。
简单与复杂的RAG差异显著,因此衍生出诸多巧妙方法。但从AI应用的角度出发,未来RAG或将走向Agent化,检索器只是Agent的工具之一。此外,RAG应用应发展为端到端可训练迭代的系统,过多的人工干预可能会被更强大的模型能力所取代,从而实现更高效、自动化的解决方案。更多精彩内容,敬请关注我们的公众号:Meshinfo。
Copyright © 2025 IZhiDa.com All Rights Reserved.
知答 版权所有 粤ICP备2023042255号