AI 入门指北

什么是 RAG(检索增强生成)?

RAG(Retrieval-Augmented Generation,检索增强生成)是一种让大模型在回答前先去"查资料"的技术——先检索,再生成,答案更靠谱。

用一个类比理解

普通大模型像一个只靠记忆答题的学生:知识截止到训练结束那天,过期的事不知道,记不住的事会瞎编。RAG 相当于给这个学生一个可以随时翻阅的"小抄本"——回答前先翻一下,有根据再开口。这个小抄本可以是你公司的内部文档、最新的新闻、你自己的笔记。

它解决了什么问题?

大模型有两个硬伤:一是知识有截止日期(训练完就不更新了),二是遇到自己不知道的事情容易"幻觉"——一本正经地编答案。RAG 通过把外部知识库"接"进来,让模型基于真实资料回答,这两个问题都能大幅改善。

生活中的例子

  • 你上传一份 PDF 合同,让 AI 帮你找某个条款——AI 先检索合同内容,再回答
  • 企业搭建内部知识库问答机器人,员工问规章制度,AI 先找公司文件再作答
  • 联网 AI 搜索(如 Kimi、秘塔)本质上也是 RAG:先搜网页,再总结

常见误解

  • "RAG 就是让 AI 联网"——联网是 RAG 的一种形式,但 RAG 更多指的是接入私有/本地知识库,不一定要联公网。
  • "有了 RAG 就不会出错"——如果检索到的资料本身有误,或者没检索到相关内容,AI 依然可能出错。

相关名词

什么是 AI 幻觉? · 什么是向量数据库? · 什么是大模型?