AI 入门指北

什么是大模型?

大模型(Large Language Model,LLM)是一种用海量文字资料训练出来的人工智能程序,它能理解你说的话,并像人一样回答你。

用一个类比理解

想象一个人读完了互联网上几乎所有的书、文章和网页,然后你问他任何问题,他都能根据读过的内容组织出一段回答。大模型就是这样一个"读过天下文章的超级实习生"——知识面极广,但偶尔也会一本正经地说错话。

它为什么突然火了?

2022 年底 ChatGPT 发布后,普通人第一次可以用聊天的方式使用 AI:写邮件、改简历、做计划、写代码,门槛低到只要会打字就行。这背后的技术突破就是大模型。

常见的大模型有哪些?

  • 国外:ChatGPT(OpenAI)、Claude(Anthropic)、Gemini(Google)
  • 国内:豆包(字节跳动)、Kimi(月之暗面)、文心一言(百度)、通义千问(阿里)、DeepSeek

常见误解

  • "大模型什么都知道"——不对。它会"幻觉",也就是编造看似合理的错误信息,重要内容一定要核实。
  • "大模型在思考"——更准确地说,它是在根据概率预测"下一个词该是什么",只是效果常常像在思考。

相关名词

什么是 token? · 什么是 AI 幻觉? · 什么是提示词?