什么是 RAG(检索增强生成)?
RAG(Retrieval-Augmented Generation,检索增强生成)是一种让大模型在回答前先去"查资料"的技术——先检索,再生成,答案更靠谱。
用一个类比理解
普通大模型像一个只靠记忆答题的学生:知识截止到训练结束那天,过期的事不知道,记不住的事会瞎编。RAG 相当于给这个学生一个可以随时翻阅的"小抄本"——回答前先翻一下,有根据再开口。这个小抄本可以是你公司的内部文档、最新的新闻、你自己的笔记。
它解决了什么问题?
大模型有两个硬伤:一是知识有截止日期(训练完就不更新了),二是遇到自己不知道的事情容易"幻觉"——一本正经地编答案。RAG 通过把外部知识库"接"进来,让模型基于真实资料回答,这两个问题都能大幅改善。
生活中的例子
- 你上传一份 PDF 合同,让 AI 帮你找某个条款——AI 先检索合同内容,再回答
- 企业搭建内部知识库问答机器人,员工问规章制度,AI 先找公司文件再作答
- 联网 AI 搜索(如 Kimi、秘塔)本质上也是 RAG:先搜网页,再总结
常见误解
- "RAG 就是让 AI 联网"——联网是 RAG 的一种形式,但 RAG 更多指的是接入私有/本地知识库,不一定要联公网。
- "有了 RAG 就不会出错"——如果检索到的资料本身有误,或者没检索到相关内容,AI 依然可能出错。