AI 入门指北AI · 说人话

什么是模型微调？

模型微调（Fine-tuning）是在已有大模型的基础上，用特定领域的数据再训练一遍，让通用模型变成某个行业或任务的专属专家。

用一个类比理解

大模型就像一个全科医生，什么都懂一点，但不够专。微调相当于让这位全科医生去心脏科进修三个月，读了几千份心脏病历、做了大量专科练习题——出来之后他还是那个人，但对心脏科问题的水平上了一个台阶。

微调能解决什么问题？

术语和风格对不上：法律、医疗、金融等行业有大量专业术语和特定写作格式，通用模型经常"不地道"
回答方式不符合要求：比如客服机器人要始终礼貌、只讨论本公司产品
少量专业知识的深度学习：用几千条高质量专业对话，让模型在特定场景表现更好

微调 vs 直接提示词

很多时候，写一个好的提示词就能让通用模型完成大部分任务，成本极低。微调成本更高（需要数据、算力、时间），通常在提示词效果不够理想、场景高度重复、对质量一致性要求极高时才值得做。

常见误解

"微调 = 重新训练模型"——不是。从头训练耗资巨大，微调只是在现有模型权重上做小幅调整，成本低得多。
"微调后模型能学到实时信息"——不能。微调学的是风格和能力，不是最新知识；实时知识要靠 RAG。

相关名词

什么是 RAG？ · 什么是开源模型？ · 什么是模型参数量？

继续看看

什么是 RAG（检索增强生成）？什么是 MCP（模型上下文协议）？什么是大模型？什么是 AIGC？什么是 token？什么是机器学习？