第二十三章统计与统计数据
【考点一】
统计学的定义及两大分支
统计学的定义
统计学的两大分支
统计学的两大分支是描述统计和推断统计。具体内容如下表所示:
【考点二】
变量及数据
变量
变量是研究对象的属性或特征,它是相对于常数而言的。常数只有一个固定取值,变量可以有两个或更多个可能的取值。变量的类别如下表所示。
数据
数据是对变量进行测量、观测的结果。数据可以是数值、文字或者图像等形式。变量的类别如下表所示。
变量和数据的关系及分类如下图所示。
1
【单选题】
下列现象的相关密切程度最高的是( ) 。
A.某商店的职工人数与商品销售额之间的相关系数0.87
B.流通费用水平与利润率之间的相关关系为-0.94
C.商品销售额与利润率之间的相关系数为0.51
D.商品销售额与流通费用水平的相关系数为-0.8
B
在说明两个变量之间的相关关系强弱时,以相关系数的绝对值作为判定标准,相关系数的绝对值越接近于1,两个变量的线性相关程度越高。
2
【单选题】
为了解我国经济活动总量的变动情况,收集国家统计局发布的国内生产总值(GDP)数据,利用统计图形展示GDP的变化,利用增长率计算GDP的基本走势,这是( )。
A.描述统计
B.参数统计
C.假设检验
D.推断统计
A
考查统计学。
描述统计是研究数据收集、整理和描述的统计方法。其内容包括:1.如何取得所需要的数据;2.如何用图表或数学方法对数据进行整理和展示;3.如何描述数据的一般特征。
推断统计是研究如何利用样本数据来推断总体特征的统计学方法,其内容包括参数估计和假设检验两大类。参数估计是利用样本信息推断总体特征;建设检验是利用样本信息判断总体的假设是否成立。CD选项错误。
B为干扰选项。
故此题正确答案为A。
3
【单选题】
能够根据样本结果推断总体数量特征的调查方式是( )。
A.重点调查
B.抽样调查
C.典型调查
D.所有非全面调查
B
考查统计调查的方式。
抽样调查指从调查对象的总体中随机抽取一部分单位作为样本进行调查,并根据样本调查结果来推断总体数量特征的一种非全面调查。
重点调查是指从调查对象的全部单位中选择少数重点单位进行调查。重点调查所选择的重点单位虽只是全部单位中的一部分,但就调查的标志值来说在总体中占绝大比重,调查这一部分单位的情况,能够大致反映被调查对象的基本情况。A选项错误。
典型调查:选择若干具有典型意义的或有代表性的单位进行调查。C选项错误。
D选项说法错误。
故此题正确答案为B。
4
【单选题】
下列属于顺序变量的是( )。
A.性别
B.产品等级
C.产品产量
D.年龄
B
考查变量和数据。
1、定量数据(数值型数据)是对定量变量的观测结果,其取值表现为具体的数值。如企业的销售额是1000万元。2、分类数据指分类变量的观测结果,表现为类别,一般用文字来表述,也可用数字描述。如,用1表示“男性”,2表示“女性”。
3、顺序数据指顺序变量的观测结果,表现为类别,一般用文字描述,也可用数字描述。如用1表示“硕士及以上”,2表示“本科”,3表示“大专及以下”。
A选项性别是一个分类变量,CD选项产品产量和年龄都是数值型变量。
故此题正确答案为B。
5
【单选题】
下列统计变量中,属于定量变量的是( )。
A.注册员工数量
B.员工受教育水平
C.员工性别
D.企业所属行业
A
考查变量和数据。
当变量的取值是数量时,该变量被称为定量变量或数量变量,例如企业销售额、注册员工数量等。
当变量的取值表现为类别时则被称为分类变量,比如企业所属行业。
当变量的取值表现为类别且具有一定顺序时被称为顺序变量,比如员工受教育水平。
A选项为定量变量或数量变量;B选项属于顺序变量。C选项和D选项属于分类变量。
故此题正确答案为A。
第二十四章描述统计
【考点】
离散程度的测度值
离散程度反映的是各变量值远离中心值的程度。衡量离散程度的指标包括方差、标准差、离散系数。数据的离散程度越大,集中趋势的测度值对该组数据的代表性就越差,离散程度越小,其代表性就越好。
1
【单选题】
下列指标中,用于描述定量数据集中趋势,并且易受极端值影响的是( )。
A.算术平均数
B.中位数
C.众数
D.极差
A
考查集中趋势的准确度。
描述定量数据集中趋势的指标有均值(即算术平均数)和中位数,均值易受极端值的影响,中位数不受极端值的影响。A选项正确,B选项错误。
众数不适用于描述定量数据的集中趋势。C选项错误。
极差是指一组测量值内最大值与最小值之差。D选项错误。
故此题正确答案为A。
2
【单选题】
下列数据特征的测度值中,易受极端值影响的是( )。
A.中位数
B.众数
C.算术平均数
D.位置平均数
C
考查集中趋势的测度。
算术平均数易受极端值的影响。极端值的出现,会使平均数的真实性受到干扰。
中位数和众数不受极端值的影响。位置平均数:是指按数据的大小顺序或出现频数的多少,确定的集中趋势的代表值,主要有众数、中位数等。ABD选项错误。
故此题正确答案为C。
3
【单选题】
某企业在全国设有10个分公司,2015年底这些分公司的员工人数(单位.人)分别为:15 17 18 19 19 20 21 25 25 25 这组数据的众数是( )人。
A.15
B.19
C.21
D.25
D
考查集中趋势的测度。
众数是一组数据中出现频数最多的那个数值。
在题干中的数据中,25出现的次数最多,所以众数是25.
故此题正确答案为D。
4
【单选题】
下列关于标准差的表述错误的是( )。
A.能够度量数值与均值的平均距离
B.用来测量数据的离散程度
C.与原始数值具有相同的计量单位
D.用来测量数据的集中趋势
D
考查离散程度的测度。
标准差用来测度数据的离散程度,是方差的平方根,能度量数值与均值的平均距离,还与原始数值具有相同的计量单位。
ABC选项正确,D选项错误。
故此题正确答案为D。
5
【多选题】
按相关的方向,相关方向可以分为( )。
A.完全相关
B.不完全相关
C.正相关
D.负相关
E.不相关
CD
考查变量间的相关关系。
按相关的方向可分为正相关和负相关。
按相关的程度可分为完全相关、不完全相关和不相关。ABE选项错误。
按相关的形式可分为线性相关和非线性相关。
故此题正确答案为CD。
第二十五章抽样调查
【考点一】
抽样调查的基本概念
【考点提示】关于总体、样本、总体参数和样本统计量这几个概念主要在于理解,考试时更侧重考核例子,通过所给出的例子来判断是什么概念。
【考点二】
概率抽样与非概率抽样
根据抽样方法不同,可以将抽样分为概率抽样和非概率抽样两类,具体内容如下表
1
【单选题】
在调查某部门平均工资时,先将该部门员工分为经理和普通职员两类,再采用随机原则分别在经理和普通职员中抽取样本,这种抽样方法属于( )。
A.简单随机抽样
B.整群抽样
C.分层抽样
D.等距抽样
C
考查分层抽样。
分层抽样是先按照某种规则把总体分为不同的层,然后在不同的层内独立、随机的抽取样本,这样所得到的样本称为分层样本。如果每层中的抽样都是简单随机抽样,则称为分层随机抽样。适用于抽样框中有足够的辅助信息,能够将总体单位按某种标准划分到各层之中,实现在同一层内,各单位之间的差异尽可能小,不同层之间各单位的差异尽可能大。
整群抽样:将总体中所有基本单位按照一定规则划分为互不重叠的群,抽样时直接抽取群,对抽中的群调查其全部单位。
题干中“将该部门员工分为经理和普通职员两类”即为分层,“采用随机原则分别在经理和普通职员中抽取样本”对应“在不同的层内独立、随机的抽取样本”,所以为分层抽样。
ABD选项错误。
故此题正确答案为C。
2
【多选题】
为调查我国国有企业在职职工的延迟退休意愿,分别从东部、中部和西部地区采用简单随机抽样方法各自抽取10个地级行政区域,然后在被抽中的每个地级行政区域采用简单随机抽样方法抽取20家国有企业,对被抽中企业的所有在职员工发放问卷进行调查。该调查中,除了简单随机抽样,还使用到的抽样方法有( )。
A.分层抽样
B.配额抽样
C.整群抽样
D.多阶段抽样
E.系统抽样
ACD
考查几种基本概率抽样方法。从题目的描述可看出使用的是多阶段抽样方法,而在此法中第一阶段使用了分层抽样,又再第二阶段使用了整群抽样的方法。
BE为干扰选项。
故此题正确答案为ACD。
3
【单选题】
为了了解某地区职工家庭生活状况,调查时,将职工家庭按居委会分组,并以居委会为单位进行简单随机抽样,再对抽中的居委会所辖每户职工家庭一一进行调查,这种调查组织方式为( )。
A.多阶段抽样
B.系统抽样
C.分层抽样
D.整群抽样
D
考查整群抽样。
整群抽样是将总体中所有的基本单位按照一定规则划分为互不重叠的群,抽样时直接抽取群,对抽中的群调查其全部的基本单位,对没有抽中的群则不进行调查。
多阶段抽样:对经过两个及两个以上抽样阶段的抽样方法的统称。
系统抽样法又叫做等距抽样法或机械抽样法,是依据一定的抽样距离,从总体中抽取样本。
分层抽样是先按照某种规则把总体分为不同的层,然后在不同的层内独立、随机的抽取样本,这样所得到的样本称为分层样本。
题干中“将职工家庭按居委会分组,并以居委会为单位进行简单随机抽样”对应“将总体中所有的基本单位按照一定规则划分为互不重叠的群,抽样时直接抽取群”;“对抽中的居委会所辖每户职工家庭一一进行调查”对应“对抽中的群调查其全部的基本单位”。
ABC选项不符合题意。
故此题正确答案为D。
4
【单选题】
为获得某中学一年级学生的身高数据,从8个班级中抽取3个班级作为样本,这属于( )。
A.简单随机抽样
B.整群抽样
C.系统抽样
D.分层抽样
B
考查整群抽样。
整群抽样是将总体中所有的基本单位按照一定规则划分为互不重叠的群,抽样时直接抽取群,对抽中的群调查其全部的基本单位,对没有抽中的群则不进行调查。如果群内各单位之间存在较大差异,群与群的结果相似,整群抽样会降低估计误差。
简单随机抽样是指从总体N个单位中任意抽取n个单位作为样本,使每个可能的样本被抽中的概率相等的一种抽样方式。
系统抽样法又叫做等距抽样法或机械抽样法,是依据一定的抽样距离,从总体中抽取样本。
分层抽样是先按照某种规则把总体分为不同的层,然后在不同的层内独立、随机的抽取样本,这样所得到的样本称为分层样本。
题干中按班级分为不同的群,从8个群中抽取3个,对着三个班级进行身高统计,对应“对抽中的群调查其全部的基本单位”。所以是整群抽样。
ACD选项不符合题意。
故此题正确答案为B。
5
【多选题】
影响样本量的因素有( )。
A.总体的离散程度
B.调查的精度
C.经费的制约
D.大规模的总体中,总体的规模
E.无回答情况
ABCE
考查样本量的影响因素。
样本量的影响因素
(1)调查的精度.用样本数据对总体进行估计时可以接受的误差水平,要求的调查精度越高,所需要的样本量就越大。B选项正确。
(2)总体的离散程度.在其他条件相同情况下,总体的离散程度越大,所需要的样本量也越大。A选项正确。
(3)总体的规模.对于大规模的总体,总体规模对样本量的需求则几乎没有影响 ,但对于小规模的总体,总体规模越大,为保证相同估计精度,样本量也要随之增大(但不是同比例的)。D选项错误。
(4)无回答情况.无回答减少了有效样本量,在无回答率较高的调查项目中,样本量要大一些,以减少无回答带来的影响。E选项正确。
(5)经费的制约.事实上,样本量是调查经费与调查精度之间的某种折中和平衡。C选项正确。
(6)其他.调查的限定时间,实施调查的人力资源也是影响样本量的客观因素。
故此题正确答案为ABCE。
,