应用正则化

上文的四阶函数举例,要让 接近 0,则让其代价函数加一个大系数的

会惩罚模型,让其减少 接近 0,负责模型无法做到

这就是正则化背后的原理:如果参数值较小,就有点像拥有一个更简单的模型(特征较少的模型)

但事实上,我们不知道哪些是最重要的特征,也不知道该惩罚哪些特征。所以正则化通常的做法是惩罚所有特征(更确切地讲是惩罚所有 参数),而且可以证明这通常会使得拟合出的函数更平滑、更简单、波动更小、也更不易过拟合

  • :正则化参数,
    • 类似与学习率 ,也需要为 选一个值

新的代价函数兼顾了两个目标:

  1. 均方误差项:促使算法更好地拟合训练数据
  2. 正则化项:促使算法尝试让参数 较小

所选的 值决定了这两个目标之间的权衡程度

  • 取 0 或接近 0,则正则化项为 0 或接近 0,即:忽略正则化,过拟合
  • 取极大数,则正则化项极大,会迫使模型选择 参数极其接近 0,即:,欠拟合
  • 常见的 取 1 或 10

正则化线性回归

在每次送代中,正则化的作用是将 乘以一个略小于 1 的数,这会使 的值稍微缩小一点

导数项求解过程(选修):

正则化逻辑回归