2021年年底,医咖会“临床研究100问”正式启动。第一期直播的完整回放内容可以点击查看:正态分布及正态检验中被问爆了的典型问题。
第二期直播,李延龙老师带来了《独立样本t检验的那些经典问题与常见错误》,例如:不符合正态分布的两组计量资料能用独立样本t检验吗?两组中有一组数据不满足正态性检验怎么办?正态和非正态计量资料比较可以用Mann-Whitney U检验吗?点击左下角“阅读原文”,就可观看完整视频找到解答!
视频内容非常丰富,我们简要整理了部分文字内容,方便大家快速查阅。
两组独立样本有哪些检验方法?
数据分析包括两个部分,一个是统计描述,另一个是假设检验。对于统计描述,如果数据服从正态分布,则描述均数和标准差。如果数据是非正态分布,则考虑进行数据转换,或直接采用中位数和四分位数间距进行描述。
假设检验包括t检验、Z检验和Mann-Whitney U检验(秩和检验)等。当数据服从正态分布时,小规模抽样样本适合用t检验,大样本和总体样本适合用Z检验。如果数据不服从正态分布,则用Mann-Whitney U检验(秩和检验)。
注意:假设检验方法的选择其实与统计描述是对应的,切忌张冠李戴。
独立样本t检验与Mann-Whitney U检验
是否分清了t检验的类型?
常用的t检验包括单样本t检验、独立样本t检验和配对样本t检验。它们都是对样本均数(或样本差值的均数)进行统计推断。
两独立样本t检验
两独立样本t检验需要满足以下条件:有且只有两组;连续性变量;独立性;正态性;方差齐性。
独立性
两种不同的方法获取100份活检组织。第一种方法是选取100个人,进行1次活检,每人取一份组织。第二种方法是选取1个人,进行10次活检,每次活检取10份组织。第一种方法获取的100份样本来自不同的人,样本间互相独立;而第二种方法获取的100份样本来自同一个人的不同组织,样本必然有相关性,不符合独立性要求。
方差齐性
两独立样本t检验分析的数据通常服从正态分布。正态分布有两个重要的参数,均数和标准差(标准差平方以后就是方差)。既然数据的特征具有两个维度,一个是均数,即平均水平,另一个是方差,即离散水平,那么当进行数据分析时,可以采用控制变量法。例如,左图方差相同,比较均数即可;右图方差不同,均数也不一样,直接比较有点困难,此时需要采用校正t检验。
Mann-Whitney U检验
当数据为非正态分布、转换后仍非正态、或者分布未知时,采用非参数检验,比如Wilcoxon符号秩和检验和Mann-Whitney U检验。
Mann-Whitney U检验是一种非常重要的非参数检验,具有以下特点:不需要假定数据符合某种分布(也适用于正态分布资料);适用于等级资料。
虽然数据服从正态分布和不服从都可以采用非参数检验,但当数据服从正态分布时,采用非参数检验会损失原始数据的信息,从而降低检验统计功效(power)。因此,当满足参数检验的要求时,尽量采用参数检验。
参数检验 vs. 非参数检验
参数检验,要求严格,数据信息得到充分利用。要求样本数据来自正态分布的总体,利用样本对未知总体参数做出推断;满足各组数据方差相等条件;常见的有t检验、方差分析。
非参数检验,适用范围广,但可能损失数据信息。对总体分布类型不做要求(因此也被称作“任意分布检验”);一端或两端无界、少量异常值的小样本数据、等级资料数据等也可用;适用性强,但可能增加Ⅱ类错误;常见的有:两独立样本秩和检验、 Wilcoxon符号秩和检验。
选择参数检验与非参数检验时,如果数据满足条件,则首选参数检验。当数据分布未知时,Mann-Whitney U秩检验更适合;但当两组数据服从正态分布(或能转换为正态)且满足其它适用条件时,独立样本t检验比Mann-Whitney U检验统计功效(power)更高。
那些被问过1万遍的经典问题
1. 正态和非正态计量资料比较可以用Mann-Whitney U检验吗?
2. 在正态性检验的时候要分组进行检验吗?还是所有数据一起检验?
3. 两组中有一组数据不满足正态性检验怎么办?
4. 不符合正态分布的两组计量资料能用独立样本t检验吗?
,