线性回归模型意味着将一条直线拟合到你的数据上
训练集
- 训练集(Training set):用于训练模型的数据集
- :表示输入的标准符号,称为输入变量(“input” variable)、特征(feature)
- :表示输出的标准符号,称为输出变量(“output” variable)、目标变量(“target” variable)、标签(label)
- :训练样本的总数
- :表示单个训练样本
- :第 个训练样本
监督学习的工作流程
线性回归模型属于监督学习:训练集包含特征 和目标 ,经过学习算法得出一个函数(function), 接收输入 ,可以预测输出
- : 的估计值或预测值(prediction)
- :称为模型(model),一些老的论文也称为假设函数(hypothesis function)
单变量线性回归
如何表示 ?或者换句话说,将使用什么数学公式来计算 ?
现在来说,让我们先使用 作为一条直线 —— 线性回归(Linear regression)
更具体地说,这是单变量线性回归(Univariate linear regression),其中“单变量”意味着只有一个输入变量
- 、:称为模型的参数(parameters)、系数(coefficients)、权重(weights)
- 模型的参数是在训练过程中可以调整的变量,以改进模型
- :斜率(slope),权重(weight)
- : 轴截距(y-intercept),偏置(bias)