为方便理解,让我们先从具体示例入手。
我们来定义一下何为“残差”:
在理论上,它是指实际观察值与预估值(拟合值)之间的差异。
简单来说,当一条直线经过数据点进行拟合后,由公式y=ax+b计算得出的数据与实际使用的数据之间会存在一定的差距。这个差距,我们称之为残差。
当残差越小,说明我们的曲线拟合程度越高。那么,如何判断残差的大小呢?这就涉及到了剩余标准偏差的概念。
剩余标准偏差,也就是残差的标准偏差,其计算公式如下:
我们首先计算根据y=bx+a计算出的每一个y值与原始每一个y值的差值,将差值的和进行平方,然后除以(参与拟合计算的数据个数-1),最后再开方。虽然公式看起来较为复杂,但好在Excel已经为我们内置了STEYX函数,可以直接进行计算。
提及标准偏差时,或许大家会自然联想到X-S质控图。不过今天的重点不在于此质控图,而是着重讲解如何计算残差的有关内容。
当我们谈及判定系数时,必须提及三个重要的概念:
残差平方SSE、回归平方SSR以及离差平方SST。
这三个量之间存在以下关系:
SSE = SST + SSR;
R² = SSR/SST = 1 - SSE/SST
随着我们的讨论深入,似乎与最初的示例有了些许相似之处。但在此之前,我们还需要对F值的方差齐性检验进行说明。
F值的计算公式如下:
分母的自由度固定为1;
分子的自由度则为n-m-1,在实际操作中,我们可以直接使用n-2。
当我们对上述公式有了足够了解后,我们可以通过设定所需的α值(如α=0.05),分母自由度为1,分子自由度为n-2,并参考F值表来判定其显著性。
我们还附上了一份α=0.05的F检验表供大家参考。