第二十六章回归分析
[考情分析]
1、分值:2分
2、备考指导:本章节内容较少,内容相对难理解,注意理解一元线性回归模型的含义,掌握最小二乘法的原理以及决定系数,理解回归模型的检验。
3、考纲要求:
(1)理解回归模型、回归方程、回归系数。
(2)掌握最小二乘法的原理和估计方法。
(3)根据估计的回归方程进行回归系数分析,掌握决定系数以及回
归模型的检验。
一、回归模型
(一)回归分析的概念
1、回归分析:指根据相关关系的具体形态,选择一个合适的数学模型,来近似地表达变量间的依赖关系。
2、回归分析和相关分析的关系
A联系
(1)它们不仅具有共同的研究对象,而且在具体应用时,也必须互相补充。
(2)相关分析需要依靠回归分析来表明现象数量相关的具体形式,而回归分析则需要依靠相关分析来表明现象数量变化的相关程度。
(3)只有当变量之间存在着高度相关时,进行回归分析寻求其相关的具体形式才有意义。
B区别
(1)相关分析:
①研究变量之间相关的方向和相关的程度
②相关分析不能指出变量间相互关系的具体形式,也无法从一个变量的变化来推测另一个变量的变化情况。
(2)回归分析:
研究变量之间相互关系的具体形式,对具有相关关系的变量之间的数量联系进行测定,确定一个相关的数学方程式。根据这个数学方程式可以从已知出变量间相互关系量来推测未知量,从而为估算和预测提供了一个重要方法。
3、因变量:被预测或被解释的变量,一般用Y表示
4、自变量:用来预测或解释因变量的变量,一般用X表示。
[经典真题]
1、[2021]选择合适的统计模型从一个变量的变化来推测另一个变量的变化情况,适用的统计方法是()。
A、散点图
B、移动平均
C、相关系数
D、回归分析
参考答案:D
参考解析:回归分析则是研究变量之间相互关系的具体形式,它对具有相关关系的变量之间的数量联系进行测定,确定一个相关的数学方程式,根据这个数学方程式可以从已知量来推测未知量,从而为估算和预测提供了一个重要的方法。
(二)一元线性回归模型
根据自变量的多少分为:一元回归模型和多元回归模型。
根据是否是线性分为:线性回归模型和韭线性回归模型。
1、一元线性回归模型:描述两个变量之间相关关系的最简单的回归模型。回归模型可以用描述因变量Y如何依赖自变量X和误差项e的方程来表示。
2、只涉及一个自变量的一元线性回归模型可以表示为:Y=B0 p1X E
B0、B1一模型的参数。
(1)Y是X的线性函数(B0 B1X)加上误差项E。
(2)B0 B1X反映了由于X的变化而引起的Y的线性变化。
(3)误差项e是个随机变量,反映了除X和Y之间的线性关系之外的随机因素对Y的影响,是不能由X和Y之间的线性关系所解释的Y的变异性。
3、描述因变量Y的期望E(Y)如何依赖自变量X的方程称为回归方程。一元线性回归方程的形式为:E(Y)=B0 B1X
一元线性回归方程的图示是一条直线,B0是回归直线的截距,B1是回归直线的斜率,表示X每变动一个单位时,E(Y)的变动量。
二、最小二乘法
1、估计回归方程:
2、原理:最小二乘法就是使得因变量的观测值yi与估计值?i,之间的离差(又称残差)平方和最小来估计参数B0,和p1,的方法。根据最小二乘法,使得
[经典真题]
1、[2018]在回归分析中,估计回归系数的最小二乘法的原理是()
A、使得因变量观测值与均值之间的离差平方和最小
B、使得因变量估计值与均值之间的离差平方和最小
C、使得观测值与估计值之间的乘积最小
D、使得因变量观测值与估计值之间的离差
平方和最小
参考答案:D
参考解析:最小二乘法就是使得因变量的观测值与估计值之间的离差(又称残差)平方和最小来估计的方法。
三、模型的检验和预测
(一)回归模型的拟合效果分析
1、模型的检验
一般情况下,在使用估计的回归方程之前,需要对模型进行检验:
①结合经济理论和经验分析回归系数的经济含义是否合理;
②分析估计的模型对数据的拟合效果如何;
③对模型进行假设检验。
2、决定系数R²:也称为拟合优度或判定系数,可以测度回归模型对样本数据的拟合程度。
决定系数是回归模型所能解释的因变量变化占因变量总变化的比例,取值范围为[0,1]
(1)决定系数越高、模型的拟合效果就越好、即模型解释因变量的能力越强。如果所有观测点都落在回归直线上,R²=1,说明回归直线可以解释因变量的所有变化。R²=0,说明回归直线无法解释因变量的变化,因变量的变化与自变量无关。
(2)现实应用中R²大多落在0和1之间,R²越接近于1,回归模型的拟合效果越好;R²越接近于0,回归模型的拟合效果越差。
2、回归系数的显著性检验
在大样本假定的条件下,回归系数的最小二乘估计量B0和B1,渐进服从正态分布,可以用t检验方法验证自变量X对因变量Y是否有显著影响。t检验的原理是反证法:在原假设B1=0(自变量X对因变量Y没有影响)正确的假设下,基于^B1的抽样分布计算一次抽样情况下得到该样本或更极端样本的概率(P值),如果P<0.05,则可以在0.05的显著性水平下拒绝原假设,认为自变量X对因变量Y有显著性影响,即B1≠0
[经典真题]
1、[2021]回归系数检验的目的是()
A、测算回归模型的拟合效果
B、估计回归系数的大小
C、检验自变量的经济含义是否正确
D、检验自变量对因变量是否有显著影响
参考答案:D
参考解析:回归系数的显著性检验主要是用来判断回归模型的自变量对因变量是否有显著影响。
2、[2021]在回归系数的显著性检验中,如果P值=0.04,则()
A、在0.05的显著性水平下接受原假设
B、在0.05的显著性水平下拒绝原假设
C、原假设错误
D、原假设正确
参考答案:B
参考解析:如果P<0.05。则可以在0.05的显著性水平下拒绝原假设,认为自变量X对因变量Y有显著影响。
(二)模型预测
回归分析的一个重要应用就是预测,即利用估计的回归模型预估因变量数值。
(三)二元回归模型案例
多元回归模型在实际应用中,随着自变量个数的增加,即使在有些自变量与因变量完全不相关的情况下,决定系数R²也会增大。为避免因增加自变量个数而高估拟合效果的情况,多元回归模型一般使用修正了自由度的调整后R²(Adjusted R Square)。调整后R²考虑了自变量个数增加带来的影响,在数值上小于R²。
[经典真题]
1、[2021]关于回归模型决定系数(R²)的说法,正确的有()
A、R越接近0,回归模型的拟合效果越差
B、R²是回归模型所能解释的因变量变化占因变量总变化的比例
C、R²数值越大,回归模型的拟合效果越好
D、R²的取值范围是>0
E、自变量个数对R²没有影响
参考答案:ABC
参考解析:决定系数是回归模型所能解释的因变量变化占因变量总变化的比例,取值范围为[0,1]。决定系数越高,模型的拟合效果就越好,即模型解释因变量的能力越强。ABC正确,D错误。多元回归模型在实际应用中,随着自变量个数的增加,即使在有些自变量与因变量完全不相关的情况下,决定系数R²也会增大。
,