什么是大模型?
大模型(Large Language Model,LLM)是一种用海量文字资料训练出来的人工智能程序,它能理解你说的话,并像人一样回答你。
用一个类比理解
想象一个人读完了互联网上几乎所有的书、文章和网页,然后你问他任何问题,他都能根据读过的内容组织出一段回答。大模型就是这样一个"读过天下文章的超级实习生"——知识面极广,但偶尔也会一本正经地说错话。
它为什么突然火了?
2022 年底 ChatGPT 发布后,普通人第一次可以用聊天的方式使用 AI:写邮件、改简历、做计划、写代码,门槛低到只要会打字就行。这背后的技术突破就是大模型。
常见的大模型有哪些?
- 国外:ChatGPT(OpenAI)、Claude(Anthropic)、Gemini(Google)
- 国内:豆包(字节跳动)、Kimi(月之暗面)、文心一言(百度)、通义千问(阿里)、DeepSeek
常见误解
- "大模型什么都知道"——不对。它会"幻觉",也就是编造看似合理的错误信息,重要内容一定要核实。
- "大模型在思考"——更准确地说,它是在根据概率预测"下一个词该是什么",只是效果常常像在思考。