AI 入门指北AI · 说人话

什么是 RAG（检索增强生成）？

RAG（Retrieval-Augmented Generation，检索增强生成）是一种让大模型在回答前先去"查资料"的技术——先检索，再生成，答案更靠谱。

用一个类比理解

普通大模型像一个只靠记忆答题的学生：知识截止到训练结束那天，过期的事不知道，记不住的事会瞎编。RAG 相当于给这个学生一个可以随时翻阅的"小抄本"——回答前先翻一下，有根据再开口。这个小抄本可以是你公司的内部文档、最新的新闻、你自己的笔记。

它解决了什么问题？

大模型有两个硬伤：一是知识有截止日期（训练完就不更新了），二是遇到自己不知道的事情容易"幻觉"——一本正经地编答案。RAG 通过把外部知识库"接"进来，让模型基于真实资料回答，这两个问题都能大幅改善。

生活中的例子

你上传一份 PDF 合同，让 AI 帮你找某个条款——AI 先检索合同内容，再回答
企业搭建内部知识库问答机器人，员工问规章制度，AI 先找公司文件再作答
联网 AI 搜索（如 Kimi、秘塔）本质上也是 RAG：先搜网页，再总结

常见误解

"RAG 就是让 AI 联网"——联网是 RAG 的一种形式，但 RAG 更多指的是接入私有/本地知识库，不一定要联公网。
"有了 RAG 就不会出错"——如果检索到的资料本身有误，或者没检索到相关内容，AI 依然可能出错。

相关名词

什么是 AI 幻觉？ · 什么是向量数据库？ · 什么是大模型？

继续看看

什么是模型微调？什么是 MCP（模型上下文协议）？什么是大模型？什么是 AIGC？什么是 token？什么是机器学习？