什么是模型微调?
模型微调(Fine-tuning)是在已有大模型的基础上,用特定领域的数据再训练一遍,让通用模型变成某个行业或任务的专属专家。
用一个类比理解
大模型就像一个全科医生,什么都懂一点,但不够专。微调相当于让这位全科医生去心脏科进修三个月,读了几千份心脏病历、做了大量专科练习题——出来之后他还是那个人,但对心脏科问题的水平上了一个台阶。
微调能解决什么问题?
- 术语和风格对不上:法律、医疗、金融等行业有大量专业术语和特定写作格式,通用模型经常"不地道"
- 回答方式不符合要求:比如客服机器人要始终礼貌、只讨论本公司产品
- 少量专业知识的深度学习:用几千条高质量专业对话,让模型在特定场景表现更好
微调 vs 直接提示词
很多时候,写一个好的提示词就能让通用模型完成大部分任务,成本极低。微调成本更高(需要数据、算力、时间),通常在提示词效果不够理想、场景高度重复、对质量一致性要求极高时才值得做。
常见误解
- "微调 = 重新训练模型"——不是。从头训练耗资巨大,微调只是在现有模型权重上做小幅调整,成本低得多。
- "微调后模型能学到实时信息"——不能。微调学的是风格和能力,不是最新知识;实时知识要靠 RAG。