AI 入门指北AI · 说人话

什么是开源模型？

开源模型是指权重文件公开、任何人都可以下载到自己电脑或服务器上运行的大模型——与之相对的是只能通过官方接口使用的闭源模型（如 GPT 系列）。

用一个类比理解

闭源模型像"餐厅"：菜做得好，但你只能去店里吃，按次付费，菜谱保密。开源模型像"公开菜谱"：你可以拿回家自己做，想怎么改就怎么改，但你得自己有厨房（计算设备）和手艺（技术能力）。

为什么大家关心它？

便宜：自己部署后没有按次付费，适合大用量场景
数据安全：敏感数据不用发给外部公司，金融、医疗、政务很看重
可定制：可以用自己的数据微调出"行业专属模型"

代表模型

国内：DeepSeek 系列、Qwen（通义千问开源版）、GLM
国外：Llama（Meta）、Mistral、Gemma（Google）

近两年国产开源模型进步极快，DeepSeek 等已经做到接近闭源旗舰的水平，这也是中国 AI 在全球最有存在感的领域之一。

常见误解

"开源 = 免费随便商用"——要看具体许可证，多数允许商用但有条件。
"开源模型一定比闭源差"——差距在迅速缩小，部分场景已经持平。

相关名词

什么是大模型？ · 什么是模型微调？

继续看看

什么是 RAG（检索增强生成）？什么是模型微调？什么是 MCP（模型上下文协议）？什么是大模型？什么是 AIGC？什么是 token？