多重判定系数是指回归平方和占总平方和的比例,反映因变量y取值的变差中,能被估计的多元回归方程所解释的比例,是估计的多元线性回归方程拟合程度的度量。

对于多重判定系数还有一点需要注意:由于自变量个数的增加,将影响到因变量中被估计的回归方程所解释的变差数量。当增加自变量时,会使预测误差变得比较小,从而减少残差平方。在多元线性回归中,多重判定系数不能反映模型拟合的好坏,需要使用修正后的多重判定系数。

统计学多重比较的显著性分析(统计学-多重判定系数与调整后的多重判定系数)(1)

修正后的多种判定系数

在简单线性回归那里,我们采用了可称之为简单判定系数的r2来评价估计回归方程对样本数据拟合效果的好坏。构造简单判定系数r2的思想方法是:将没有任何自变量可作为预测依据而只能以因变量自身的均值来预测因变量自身的个别取值时,所产生的总离差平方和SST,分解为可以被估计回归方程解释的回归平方和SSR与未能被回归方程解释的误差平方和SSE两部分,然后再来观察SSR占SST比重的大小。这个比重越大,则表明拟合效果越好。

同样的思想方法可以运用于多重回归。在多重回归中,总离差平方和同样可被分解为回归平方和与误差平方和两部分,即在多重回归中同样有:SST=SSR SSE。不同之处仅在于多重回归的SSR中包含着被多个自变量解释的部分。将多重回归中SSR占SST的比重称为多重判定系数,记作R2 [3] 。

多重线性回归(multiple linear regression)是简单直线回归的推广,研究一个因变量与多个自变量之间的数量依存关系。多重线性回归用回归方程描述一个因变量与多个自变量的依存关系,简称多重回归 [2] 。

,