文章和案例数据来源:微信公众号【我看人看我】

一、重复测量的研究设计

研究人员想要了解打字训练是否能提高人们的打字技能,于是对6名被试进行了测试研究,先后收集了被试在打字训练前及打字训练后1个月、2个月、3个月的单位时间内打错字的个数,如下表:

spss单因素方差结果解读(单因素重复测量方差分析)(1)

现在,研究人员需要去检验经过打字训练后被试的打字技能是否提高了,即打错字的个数有没有明显下降,应该采用什么统计方法呢?

该案例中,因变量为单位时间内打错字的个数,为数值型变量;自变量也只有一个且为分类变量,即时间,分为了四个时段:训练前、训练后1个月、训练后2个月、训练后3个月。要检验打字训练后打错字的个数有没有下降,就需要比较四个时段的打错字个数均值是否存在差异。我们知道,比较三个及以上总体均值,如果只有一个自变量和一个因变量,可以采用单因素方差分析的方法。但这里的案例与之前介绍的方差分析《如何使用SPSS进行单因素方差分析?》不一样的地方在于,每一位被试均全程参与了自变量所有水平下的测试,即得到的四组测量数据都来自于同一个样本,这样的实验设计即是心理学、医学中常用的重复测量研究设计。因此,准确来说,该案例应该使用单因素重复测量方差分析来检验四组均值是否相等。

重复测量研究设计,也称为组内设计(within-groups design),指的是,针对同一观测变量使用同一组被试样本进行两次或两次以上的测量,每一位被试都参与了所有的测量条件,得到的测量数据都来自相同的样本。基于这种研究设计而进行的方差分析,即为重复测量方差分析。如果在实验中只做了两次测量,得到两组测量数据,要比较这两组数据的均值,则可使用重复测量t检验,即我们之前介绍过的配对样本t检验《参数检验(三):独立样本和配对样本t检验的SPSS操作》

与重复测量设计对应的是独立样本的研究设计,也称为组间设计(between-group design),指的是每一个实验条件都由不同的被试来完成,得到的测量数据来自于不同且完全独立的样本。比如在跨文化研究中,我们比较来自中国和美国的样本数据,或者在医学研究中的实验组和控制组。之前介绍的独立样本t检验和方差分析,针对的均是独立样本的研究设计。

二、重复测量设计的优势和不足

1. 优势

(1)有效控制个体差异的影响

在实际研究中,不管要观察的行为差异是什么,原则上都有可能受到混淆变量的影响,比如个体差异的干扰。对于重复测量设计来说,每一位被试都参与了自变量所有水平的测试,即每名被试的测量结果都是在和自己前后的表现进行比较,因此能够很好地控制个体差异对测量结果的影响。

(2)提高了组间效应的精确度

通过重复测量设计得到的结果倾向于高度相关,数据变异减弱,因此显著性检验的标准差值就减小了,统计检验更敏感,也就更易于检测出较小的处理效应(即自变量带来的变异的多少)。

(3)无需事先对被试进行测验筛选

在研究前,我们招募测试对象时都需要做测验筛选,以平衡不同测试对象在所要观测的行为特点的差异,以尽可能地控制这些差异导致的测量结果的偏差。但在重复测量设计中,不同水平下的测量结果都是被试与自己的比较,因此个体在某一特点的差异已经完全得到平衡,也就不需要做事前的测验。

(4)可观测因变量的动态变化特征

通过对同一样本在不同时段的多次测试,可获得因变量随时间变化的动态变化趋势,提取更多有价值的研究信息。

2. 不足

在重复测试设计中,每一名被试都需要按照一定的实验顺序来完成任务,比如上述案例中,被试要遵循训练前、训练后的1-3个月来进行打字测试。这样的安排带来的问题是,前一个测试有可能会影响被试在后一个任务中的表现,比如被试可能变得更熟练了,或者变得疲劳了,这些因素很容易与自变量混淆在一起,成为影响因变量的干扰项。

针对这个问题,研究中主要通过两种方法解决:

(1)随机排列各实验条件的顺序;

(2)通过抵消平衡法来消除实验顺序可能带来的影响。抵消平衡法即是要保证每种实验条件以各种顺序出现的机会相同,比如下表的顺序安排,每一名被试在红光、绿光和黄光下的测试顺序都是不一样的。

spss单因素方差结果解读(单因素重复测量方差分析)(2)

三、重复测量方差分析的前提条件

1. 总体服从正态分布

2. 各个总体的方差相等(方差同质性)

3. 样本之间相互独立

4. 样本是随机抽取的

5. 符合球形假设

重复测量方差分析要求在自变量的各水平下的协方差矩阵具有球形性特征,即满足球形假设。因此在进行重复测量方差分析时,需要进行球形假设检验。如果不满足该条件,方差分析的F值会出现偏差,增大第1类错误的概率(即“弃真”,拒绝了实际上成立的假设),这时候就需要进行校正。

四、单因素重复测量方差分析的SPSS操作

接下来,我将基于文章一开始提到的打字训练案例,来演示如何使用SPSS进行单因素重复测量方差分析。

研究问题:打字训练是否提高了打字技能?

原假设:训练后不同时段的打字准确性和训练前没有差别。

(一)操作路径

【分析】-【一般线性模型】-【重复测量】

spss单因素方差结果解读(单因素重复测量方差分析)(3)

(二)定义变量

spss单因素方差结果解读(单因素重复测量方差分析)(4)

进入【重复度量定义因子】窗口,因为该研究是基于时间进行重复测量的,因此【被试内因子名称】我们定义为 “时间”;【级别数】表示进行了多少次测量,这里为4次。

【度量名称】即为要度量的因变量名称,案例中因变量为“打错字个数”,因此我们将因变量名称定为“打错字个数”。

定义好变量名称后,分别单击“添加”。

spss单因素方差结果解读(单因素重复测量方差分析)(5)

(三)选择统计量

单击【重复度量定义因子】的【定义】按钮,打开【重复度量】对话框。

spss单因素方差结果解读(单因素重复测量方差分析)(6)

将左侧对话框中的四个时段的测量结果依次添加到【群体内部变量】框中,这里一定要按照测量时间的先后依次添加。

spss单因素方差结果解读(单因素重复测量方差分析)(7)

单击【重复度量】对话框的【绘制】,打开【重复度量:轮廓图】,主要输出因变量随自变量的变化而变化的趋势图。

spss单因素方差结果解读(单因素重复测量方差分析)(8)

将左侧框中的【时间】添加到右侧【水平轴】的框中,并点击下方的【添加】,将输出以测量时间作为横轴的趋势图。

然后点击继续,返回【重复度量】对话框,并单击【选项】,打开【多变量:选项】对话框。

spss单因素方差结果解读(单因素重复测量方差分析)(9)

将【因子与因子交互】框中的“时间”变量添加到【显示均值】框中,勾选【比较主效应】,【置信区间调节】选择 “Bonferroni”, “Bonferroni”为多重比较检验(事后检验)的一种方法,常用的其他事后检验方法还有LSD(L)。

在【输出】框中,勾选【描述统计】和【方差齐性检验】统计量,显著性水平保持默认的0.05。

【描述统计】输出不同自变量水平下的均值、标准差和个案数;

【方差齐性检验】即是要看数据是否符合方差同质性的前提。

单击继续,返回主对话框,单击确定,系统开始运算。

(四)统计结果解读

1. 主体内因子

主体内因子表告诉我们自变量的不同水平对应的标签分别为1、2、3、4。

spss单因素方差结果解读(单因素重复测量方差分析)(10)

2. 描述统计表

spss单因素方差结果解读(单因素重复测量方差分析)(11)

该表给出了在自变量不同水平下的因变量均值、标准差和个案数。由表可知,训练前打错字平均个数为7个,远高于训练后,而训练后不同时期的打错字个数差异比较小。但我们不能由这个描述性结果作出结论,因为该结果可能是由随机误差带来的,所以还需要看显著性检验结果。

3. 球形假设的检验

spss单因素方差结果解读(单因素重复测量方差分析)(12)

重复测量方差分析需满足球形假设,判断是否满足球形假设,主要看“Mauchly 球形度检验表”中的概率p值(sig.列),如果p值小于事先确定的显著性水平0.05,则说明不满足球形假设;如果大于显著性水平,则满足球形假设。由上述结果可知,在本案例中,X²=3.605,p=0.618>0.05,说明数据满足球形假设条件。

如果数据不满足球形假设,就需要进行Epsilon 校正,校正结果看检验结果表中的“Epsilon”列。SPSS提供了三种校正方法,分别为:Greenhouse-Geisser、Huynh-Feldt 和Lower-bound(下限)。一般来说,以Greenhouse-Geisser、Huynh-Feldt 最常用。由这两种方法得到的Epsilon值越低,说明数据违反球形假设的程度越大;当Epsilon值=1时,说明数据完美的服从了球形假设。

4. 方差分析检验结果

重复测量方差分析的检验结果输出了多个表,主要有“多变量检验表”和“主体内效应的检验表”,具体看哪个表,需要基于球形度检验结果。

如果数据满足球形假设,那么查看“主体内效应的检验表”的第一行“Sphericity Assumed(采用的球形度)”,根据概率p值(sig.列)来判断自变量的不同水平下均值是否存在显著性差异。因为本案例的数据满足球形假设,因此我们只需要查看“采用的球形度”一行的F值及概率p值即可,由下表可知,p<0.01,说明四个时间段的打错字个数存在显著性差异,即认为经过训练后不同时间点的打字准确性和训练前有显著性差异。

spss单因素方差结果解读(单因素重复测量方差分析)(13)

如果数据不满足球形假设,那就要结合“多变量检验表”(如下表)的结果和“主体内效应的检验表”(如上表)的矫正结果做出判断。“主体内效应的检验” 的矫正结果即基于上述的矫正方法Greenhouse-Geisser、Huynh-Feldt 和Lower-bound(下限)得出,分别对应上表中的同名称的三行结果,同样的,也是根据概率p值与显著性水平的比较来判断是否存在统计学意义。有时候可能会出现多变量检验结果与主体内效应检验的矫正结果不一致的情况,这种情况我们一般以多变量检验结果为准。

spss单因素方差结果解读(单因素重复测量方差分析)(14)

5. 事后检验

事后检验,也称多重比较检验、成对比较检验。方差分析的结果只能说明自变量的不同水平的均值存在显著性差异,但没有告诉我们哪两个水平之间存在差异,因此需要通过事后检验,来确定哪两个水平之间存在显著性差异。

事后检验的结果主要看 “成对比较表” ,由下表可知,本案例中,训练前分别与训练后1个月、2个月、3个月之间的检验显著性均小于0.05,说明存在显著性差异;而训练后的1个月、2个月、3个月之间的检验显著性均大于0.05,说明不存在显著差异。因此,我们可以认为,打字训练能有效地提高人们的打字技能。

spss单因素方差结果解读(单因素重复测量方差分析)(15)

6. 轮廓图

spss单因素方差结果解读(单因素重复测量方差分析)(16)

从轮廓图中我们可以直观地了解到训练后的打错字个数比训练前的有了明显的下降,但训练后的三次测试中,打错字个数并没有明显的变化,由此进一步验证了上述的检验结果。

【#关于作者#】

中山大学人类学硕士,用户研究工程师、数据分析师,微信公众号【我看人看我】,主要分享SPSS统计分析、用户研究理论与方法、社会科学研究与方法等。

,