AI 入门指北

什么是开源模型?

开源模型是指权重文件公开、任何人都可以下载到自己电脑或服务器上运行的大模型——与之相对的是只能通过官方接口使用的闭源模型(如 GPT 系列)。

用一个类比理解

闭源模型像"餐厅":菜做得好,但你只能去店里吃,按次付费,菜谱保密。开源模型像"公开菜谱":你可以拿回家自己做,想怎么改就怎么改,但你得自己有厨房(计算设备)和手艺(技术能力)。

为什么大家关心它?

  1. 便宜:自己部署后没有按次付费,适合大用量场景
  2. 数据安全:敏感数据不用发给外部公司,金融、医疗、政务很看重
  3. 可定制:可以用自己的数据微调出"行业专属模型"

代表模型

  • 国内:DeepSeek 系列、Qwen(通义千问开源版)、GLM
  • 国外:Llama(Meta)、Mistral、Gemma(Google)

近两年国产开源模型进步极快,DeepSeek 等已经做到接近闭源旗舰的水平,这也是中国 AI 在全球最有存在感的领域之一。

常见误解

  • "开源 = 免费随便商用"——要看具体许可证,多数允许商用但有条件。
  • "开源模型一定比闭源差"——差距在迅速缩小,部分场景已经持平。

相关名词

什么是大模型? · 什么是模型微调?