回归 VS. 分类
- 回归估计一个连续值
- 分类预测一个离散类别
从回归到多类分类
均方损失
对类别进行一位有效(one-hot,独热)编码
使用均方损失训练
最大值最为预测
无校验比例
需要更置信的识别正确类(大余量)
校验比例
输出匹配概率(非负,和为 1)
概率 和 的区别作为损失
交叉熵损失
交叉熵常用来衡量两个概率的区别
将它作为损失
其梯度是真实概率和预测概率的区别
总结
- Softmax 回归是一个多类分类模型
- 使用 Softmax 操作子得到每个类的预测置信度
- 使用交叉熵来衡量预测和标号的区别