AI 入门指北AI · 说人话

什么是大模型？

大模型（Large Language Model，LLM）是一种用海量文字资料训练出来的人工智能程序，它能理解你说的话，并像人一样回答你。

用一个类比理解

想象一个人读完了互联网上几乎所有的书、文章和网页，然后你问他任何问题，他都能根据读过的内容组织出一段回答。大模型就是这样一个"读过天下文章的超级实习生"——知识面极广，但偶尔也会一本正经地说错话。

它为什么突然火了？

2022 年底 ChatGPT 发布后，普通人第一次可以用聊天的方式使用 AI：写邮件、改简历、做计划、写代码，门槛低到只要会打字就行。这背后的技术突破就是大模型。

常见的大模型有哪些？

国外：ChatGPT（OpenAI）、Claude（Anthropic）、Gemini（Google）
国内：豆包（字节跳动）、Kimi（月之暗面）、文心一言（百度）、通义千问（阿里）、DeepSeek

常见误解

"大模型什么都知道"——不对。它会"幻觉"，也就是编造看似合理的错误信息，重要内容一定要核实。
"大模型在思考"——更准确地说，它是在根据概率预测"下一个词该是什么"，只是效果常常像在思考。

相关名词

什么是 token？ · 什么是 AI 幻觉？ · 什么是提示词？

继续看看

什么是 RAG（检索增强生成）？什么是模型微调？什么是 MCP（模型上下文协议）？什么是 AIGC？什么是 token？什么是机器学习？