在针对连续变量的统计推断方法中,最常用的有 t 检验 和 方差分析 两种,其中 t 检验是最基本的检验方法,最初由W.S.Gosset在1908年以笔名“Student”发表的一篇关于 t 分布的论文中提出,开创了利用小样本计量资料进行统计推断的先河,打开了统计学的新纪元。
也由此,t检验,亦称 Student t检验(Student's t test),主要用于样本含量较小(例如n<30),总体标准差 σ 未知的正态分布。 t 检验是用 t 分布理论来推论差异发生的概率,从而比较两个平均数的差异是否显著。在医学统计中,t 检验是使用非常频繁的一类假设检验方法,应用条件:
- 样本量较小时,理论上要求样本为来自正态分布总体的随机样本(正态性)
- 当两小样本均数比较时,要求两总体服从正态分布并且总体方差相等(方差齐性)
t检验依据资料分析目的和设计类型的不同,可分为:单样本均数的t检验、配对样本均数t检验、两独立样本均数的t检验
- 单样本均数的t检验:适用于样本所在总体均数与已知总体均数的比较
- 配对样本均数的t检验:适用于配对设计的资料
- 两独立样本均数的t检验:适用于完全随机设计两样本均数的比较,据此推断他们的总体均数是否相等
单样本均数 t 检验主要适用于样本所在总体均数与已知均数的比较,推断单个变量的样本均值与给定的常数(指定的检验值)之间是否存在显著差异。
其实验设计:已知一个总体B,现在一个未知总体A中随机抽取一个已知样本C,问题是总体A与总体B之间是否有差异?我们就用已知样本C与已知总体B相比较来得出结论。
示例:打开数据。根据调查某市7岁以下儿童血铅含量的平均水平为80.59μg/L,从工业园区抽取15名7岁以下儿童测量其体内血铅含量,问工业园区7岁以下儿童平均血铅含量是否不同于全市平均水平?
1. 建立假设:建立检验假设,确定检验水准 α
- H0:工业园区儿童的血铅含量μ与全市血铅含量 μ0 相等,即 μ=μ0
- H1: μ ≠ μ0
- α = 0.05,即置信区间为95%
2. 检验数据是否符合单样本 t 检验的条件
(1)正态分布检验
- 打开 非参数检验—旧对话框—单样本K-S检验
由下表可知,K -S 检验=0.169,P =0.200 > 0.05,血铅含量符合正态分布。
3. 选择检验方法—单样本t检验
(1) 选择 分析—比较平均值—单样本t检验
(2) 参数说明
- 检验变量:用于从变量列表中选入待检验的变量;若选入多个,则他们将对同一个总体均值进行检验。
- 检验值:用于指定待检验的总体均值,默认为0.
- 选项—置信区间百分比:指定样本均值与总体均值之间的置信区间,默认为95%。
- 选项—缺失值:用于设置缺失值的处理方式。
(3) 输出结果与说明
- 单样本统计:给出样本的统计特征,包括样本量、平均值、标准差等。
- 单样本检验:给出T检验的结果,包括检验的总体均值=80.59,t统计量=2.185,显著性p=0.046<0.05,因此拒绝H0,接受H1,所以认为样本均数与总体均值之间显著不同,认为工业园区儿童的血铅含量μ与全市血铅含量 μ0 不相等。
(4)语法
T-TEST
/TESTVAL=80.59
/MISSING=ANALYSIS
/VARIABLES=xqhl
/CRITERIA=CI(.95).