回归 VS. 分类

  • 回归估计一个连续值
  • 分类预测一个离散类别

从回归到多类分类

均方损失

对类别进行一位有效(one-hot,独热)编码

使用均方损失训练

最大值最为预测

无校验比例

需要更置信的识别正确类(大余量)

校验比例

输出匹配概率(非负,和为 1)

概率 的区别作为损失

交叉熵损失

交叉熵常用来衡量两个概率的区别

将它作为损失

其梯度是真实概率和预测概率的区别

总结

  • Softmax 回归是一个多类分类模型
  • 使用 Softmax 操作子得到每个类的预测置信度
  • 使用交叉熵来衡量预测和标号的区别