AI 入门指北

什么是神经网络?

神经网络(Neural Network)是一种模仿人脑神经元连接方式设计的数学模型,由大量简单的计算单元相互连接组成,通过训练数据调整连接权重来"学习"。

用一个类比理解

大脑里有数百亿个神经元,每个神经元接受来自其他神经元的信号,超过阈值就"激活"并向下游传递。人工神经网络照着这个原理用数学公式搭了一个简化版:每个"神经元"其实是一个小计算节点,接收数字输入、加权求和、输出数字,层层传递,最终输出结果。

神经网络怎么"学习"?

给它看大量有标注的例子(比如一万张猫的照片),每次预测错了就"反向传播"——告诉每层网络"这一步出了多少偏差",然后微调各个连接的权重,下次预测更准。重复这个过程几百万次,网络就学会了识别猫。

神经网络 vs 深度学习 vs 大模型

  • 神经网络:基础结构,可以很浅(两三层)
  • 深度学习:用很多层神经网络处理复杂任务
  • 大模型:极大规模的深度神经网络,配合 Transformer 架构

常见误解

  • "神经网络在模拟人类大脑"——只是灵感来源,真实的人脑远比任何神经网络复杂,两者工作原理差异巨大。
  • "神经网络能自我进化"——神经网络靠人类提供数据和算力训练,不会自主进化。

相关名词

什么是深度学习? · 什么是 Transformer? · 什么是模型参数量?