第二十六章回归分析
【考点一】
回归模型
一、回归分析的概念
回归分析就是根据相关关系的具体形态,选择一个合适的数学模型,来近似的表达变量间的依赖关系。
【提示1】进行回归分析时,首先需要确定因变量和自变量。回归分析中,被预测或被解释的变量称为因变量用Y表示;用来预测或解释因变量的变量称为自变量,一般用X表示。
例如,在研究边际消费倾向时,目的是预测一定人均收入条件下的平均人均消费金额,因此人均消费金额是因变量,而人均收入为自变量。
【提示2】回归分析与相关分析的关系
二、 回归模型分类
描述因变量如何依赖自变量和误差项的方程称为回归模型,回归模型的类别如下:
1、根据自变量的多少,回归模型可以分为一元回归模型和多元回归模型。
2、根据回归模型是否线性,回归模型分为线性回归模型和非线性回归模型。
三、一元线性回归模型
一元线性回归模型是研究两个变量之间相关关系的最简单的回归模型,只涉及一个自变量。该模型可以表示为:
【提示1】
因变量Y是自变量X的线性函数(β0 β1X)加上误差项ε;
(1)β0 β1X反映了由于自变量X的变化而引起的因变量Y的线性变化。
(2)误差项ε是个随机变量,表示除线性关系之外的随机因素对Y的影响,它是不能由X和Y的线性关系所解释的Y的变异性。
【提示2】描述因变量Y的期望值E(Y)如何依赖自变量X的方程称为回归方程。
一元线性回归方程的图示是一条直线,
β0是回归直线的截距;
β1是回归直线的斜率,表示X每变动一个单位时,E(Y)的变动量。
【提示3】回归分析的一个重要应用就是预测,即利用估计的回归模型预估因变量数值。
【考点二】
最小二乘法
在现实中,模型的参数B0和B1都是未知的,需要利用样本数据去估计,采用的估计方法是最小二乘法。
最小二乘法原理是使得因变量的观测值与估计值之间的离差(残差)平方和最小来估计B0和B1的方法。
1
【多选题】
相关分析与回归分析的区别在于( )。
A.二者的研究对象是不同的
B.相关分析无法从一个变量的变化来推测另一个变量的变化情况
C.二者的研究目的不同
D.相关分析不能指出变量间相互关系的具体形式
E.二者的研究方法不同
BCDE
考查回归分析的概念。
回归分析与相关分析的关系:(一)联系(1)它们具有共同的研究对象。(2)在具体应用时,必须互相补充。相关分析需要依靠回归分析来表明现象数量相关的具体形式,而回归分析则需要依靠相关分析来表明现象数量变化的相关程度。只有高度相关时,进行回归分析寻求其相关的具体形式才是有意义的。
(二)区别:相关分析与回归分析在研究目的和方法上具有明显的区别。(1)分析研究变量之间相关的方向和相关的程度。但是相关分析不能指出变量间相互关系的具体形式,也无法从一个变量的变化来推测另一个变量的变化情况。(2)回归分析是研究变量之间相关关系的具体形式,它对具有相关关系的变量之间的数量联系进行测定,确定相关的数学方程式,根据这个数学方程式可以从已知量来推测未知量,从而为估算和预测提供了一个重要方法。
A选项说法错误,它们具有共同的研究对象。
故此题正确答案为BCDE。
2
【多选题】
在某城市随机抽取1 000户居民作为样本对该城市居民消费水平进行研究,对居民月消费支出Y(单位:元)和月收入X(单位:元)建立回归模型,得到估计的回归方程Y=1 300 0.6X,决定系数0.96。关于该模型的说法,正确的有()。
A.居民月收入和月消费支出之间正相关
B.回归模型的拟合效果很好
C.居民月收入难以解释月消费支出的变化
D.居民月收入每增长1元,月消费支出将平均增长0.6元
E.居民月收入为10 000元时,居民人均月消费支出大约为7 300元
ABDE
由Y=1300 0.6X,可以看出X和Y同方向变化,即正相关,A项正确;0.6表示X每增加一个单位,Y的平均增加量,D项正确;将E项中的10000元代入回归方程即Y=1300 0.6*10000=7300元,E项正确。本题中决定系数0.96接近于1,可看出回归模型的拟合效果很好,x越能解释Y的变化,B项正确,C项错误。
3
【单选题】
某公司产品当产量为1000单位时,其总成本为4000元;当产量为2000单位时,其总成本为5000,则设产量为x,总成本为y,正确的一元回归方程表达式应该是( )。
A.y = 3000 x
B.y = 4000 4x
C.y = 4000 x
D.y = 3000 4x
A
考查一元线性回归模型。
本题可列方程组:设该方程为y = a bx,则由题意可得:4000 = a 1000b;5000 = a 2000b解该方程,得b=1,a=3000,所以方程为y = 3000 x
故此题正确答案为A。
4
【单选题】
根据相关关系的具体形态,选择一个合适的数学模型,来近似地表达变量间的依赖关系,这是( )。
A.相关分析
B.回归分析
C.定量分析
D.定性分析
B
考查回归分析的概念。
回归分析就是根据相关关系的具体形态,选择一个合适的数学模型,来近似的表达变量间的依赖关系。
相关分析是研究现象之间是否存在某种依存关系,并对具体有依存关系的现象探讨其相关方向以及相关程度,是研究随机变量之间的相关关系的一种统计方法。A选项错误。
定量分析是对社会现象的数量特征、数量关系与数量变化的分析。C选项错误。
定性分析就是对研究对象进行"质"的方面的分析。D选项错误。
故此题正确答案为B。
5
【单选题】
关于一元线性回归模型,下列表述错误的是( )。
A.只涉及一个自变量的回归模型称为一元线性回归模型
B.因变量Y是自变量X的线性函数加上误差项
C.β0 β1X反映了由于自变量X的变化而引起的因变量y的线性变化
D.误差项是个随机变量,表示除线性关系之外的随机因素对Y的影响,能由X和Y的线性关系所解释的Y的变异性
D
考查一元线性回归模型。
只涉及一个自变量的一元线性回归模型表示为Y=β0 β1X ε,因变量Y是自变量X的线性函数(β0 β1X)加上误差项ε;β0 β1X反映了由于自变量X的变化而引起的因变量y的线性变化。误差项ε是个随机变量,表示除线性关系之外的随机因素对Y的影响,它是不能由X和Y的线性关系所解释的Y的变异性。
ABC选项说法正确,D选项说法错误。
故此题正确答案为D。
第二十七章时间序列
【考点一】
时间序列的含义及分类
统计对事物进行动态研究的基本方法是编制时间序列,为便于理解,以某国2014-2017年期间若干经济指标的时间序列为例,如下表:
1.时间序列含义:时间序列也称动态数列,是将某一统计指标在各个不同时间上的数值按时间先后顺序编制形成的序列。2.时间序列的构成要素:(1)被研究现象所属时间(2)反映该现象一定时间条件下数量特征的指标值 同一时间序列中,各指标值的时间单位一般要求相等,可以是年、季、月、日。
3.时间序列的分类:
时间序列按照其构成要素中统计指标值的表现形式,分为绝对数时间序列、相对数时间序列、平均数时间序列。
【考点二】
平均发展水平
一、发展水平的有关概念
1、发展水平:发展水平是时间序列中对应于具体时间的指标数值。
2、最初水平、最末水平、中间水平时间序列中第一项的指标值称为最初水平,最末项的指标值称为最末水平,处于二者之间的各期指标值则称为中间水平。
3、基期水平和报告期水平
①基期水平: 是作为对比的基础时期的水平;②报告期水平:是所要反映与研究的那一时期的水平。
4、平均发展水平也称序时平均数或动态平均数,是对时间序列中各时期发展水平计算的平均数,它可以概括性描述现象在一段时期内所达到的一般水平。
二、平均发展水平的计算
(一) 绝对数时间序列序时平均数的计算 1、由时期序列计算序时平均数:就是简单算术平均数。
2、由时点序列计算序时平均数:(1)第一种情况,由连续时点(逐日登记)计算。又分为两种情形。①资料逐日排列且每天登记。即已掌握了整段考察时期内连续性的时点数据,可采用简单算术平均数的方法计算。 ②资料登记的时间单位仍然是1天,但实际上只在指标值发生变动时才记录一次。此时需采用加权算术平均数的方法计算序时平均数,权数是每一指标值的持续天数占总天数的比例
(2)第二种情况,由间断时点(不逐日登记)计算。又分为两种情形。 ①每隔一定的时间登记一次,每次登记的间隔相等。
间断相等的间断时点序列序时平均数的计算思想是“两次平均”:先求各个时间间隔内的平均数,再对这些平均数进行简单算术平均。
(二)相对数或平均数时间序列序时平均数的计算相对数或平均数时间序列是派生数列,相对数或平均数通常是由两个绝对数对比形成的。
计算思路:分别求出分子指标和分母指标时间序列的序时平均数,然后再进行对比。
1
【单选题】
以2006年为基期,某企业2007、2008年销售收入的定基发展速度分别是125.6%和140.5%,则2008年与2007年相比的环比增长速度是( )。
A.14.9%
B.89.40%
C.11.86%
D.111.86%
C
考查发展速度与增长速度。
两个相邻时期定基发展速度的比率等于相应时期的环比发展速度。
所以,环比发展速度=140.5%÷125.6%=111.86%
环比增长速度=环比发展速度-1
根据公式,环比增长速度=111.86%-1=11.86%
ABD为干扰选项。
故此题正确答案为C。
2
【单选题】
关于指数平滑法的说法正确的是()。
A.指数平滑法的特点是观测值离观测时期越久远,其权重也变得越小,呈现线性下降。
B.指数平滑法的特点是观测值离观测时期越久远,其权重也变得越小,呈现指数下降。
C.指数平滑法的特点是观测值离观测时期越久远,其权重也变得越大,呈现线性上升。
D.指数平滑法的特点是观测值离观测时期越久远,其权重也变得越大,呈现指数下降。
B
考查指数平滑法。
指数平滑法的特点是观测值离观测时期越久远,其权重也变得越小,呈现指数下降。
ACD选项说法错误。
故此题正确答案为B。
3
【单选题】
下列指标中累积后没有意义的是( )。
A.商品零售额
B.能源生产总量
C.财政收入
D.股票价格
D
考查时间序列及其分类。
时点指标是反映社会经济现象在某一时刻或某一时点上的状况的总量指标。不具有可加性,指标数值大小与登记时间的间隔长短无关,指标数值是间断计数的。如某地区人口数,某商业企业商品库存额等指标。
时期指标反映的是总体现象在一定时期内的累计总量水平的指标。是表现社会经济现象总体在一段时期内发展过程的总结果。如一定时期的工业总产值、人口出生数、工资总额等。
ABC为时期指标。
D选项股票价格属于时点指标,时点数通常不能累积,其累积后没有意义。
故此题正确答案为D。
4
【单选题】
“十一五”期间,北京市城乡居民人均可支配收入年均增长8%以上,这是( )。
A.发展速度
B.增长速度
C.平均发展速度
D.平均增长速度
D
考查平均发展速度与平均增长速度。
平均增长速度反映现象在一定时期内逐期增长(降低)变化的一般程度。
发展速度是以相对数形式表示的两个不同时期发展水平的比值,表明报告期水平已发展到基期水平的几分之几或若干倍。
增长速度表明报告期水平比基期增长或降低了几分之几或若干倍。
平均发展速度反映现象在一定时期内逐期发展变化的一般程度。
题干中的8%是“十一五“期间(共五年)年增长率的一个平均值,是现象在一定时期内逐期增长(降低)变化的一般程度,所以是平均增长速度。
ABC选项与题意不符。
故此题正确答案为D。
5
【多选题】
下列指标和时间构成的序列中,属于时点序列的是( )。
A.年末总人口
B.钢铁总产量
C.国内生产总值
D.人口自然增长率
E.库存量
AE
考查时间序列及其分类。
1.时期序列:时期指标反映的是总体现象在一定时期内的累计总量水平的指标。是表现社会经济现象总体在一段时期内发展过程的总结果。每一指标值反映现象在一定时期内发展的结果,即过程总量。如一定时期的工业总产值、人口出生数、工资总额等。
2.时点序列:时点指标是反映社会经济现象在某一时刻或某一时点上的状况的总量指标。不具有可加性,指标数值大小与登记时间的间隔长短无关,指标数值是间断计数的。每一指标值反映现象在一定时点上的瞬间水平。如某地区人口数,某商业企业商品库存额等指标。
本题中的BC项为时期序列,D人口自然增长率,属于相对数时间序列。
故此题正确答案为AE。
,