AI 入门指北

什么是模型微调?

模型微调(Fine-tuning)是在已有大模型的基础上,用特定领域的数据再训练一遍,让通用模型变成某个行业或任务的专属专家。

用一个类比理解

大模型就像一个全科医生,什么都懂一点,但不够专。微调相当于让这位全科医生去心脏科进修三个月,读了几千份心脏病历、做了大量专科练习题——出来之后他还是那个人,但对心脏科问题的水平上了一个台阶。

微调能解决什么问题?

  1. 术语和风格对不上:法律、医疗、金融等行业有大量专业术语和特定写作格式,通用模型经常"不地道"
  2. 回答方式不符合要求:比如客服机器人要始终礼貌、只讨论本公司产品
  3. 少量专业知识的深度学习:用几千条高质量专业对话,让模型在特定场景表现更好

微调 vs 直接提示词

很多时候,写一个好的提示词就能让通用模型完成大部分任务,成本极低。微调成本更高(需要数据、算力、时间),通常在提示词效果不够理想、场景高度重复、对质量一致性要求极高时才值得做。

常见误解

  • "微调 = 重新训练模型"——不是。从头训练耗资巨大,微调只是在现有模型权重上做小幅调整,成本低得多。
  • "微调后模型能学到实时信息"——不能。微调学的是风格和能力,不是最新知识;实时知识要靠 RAG。

相关名词

什么是 RAG? · 什么是开源模型? · 什么是模型参数量?