用spss平均数差异的显著性检验(统计学SPSS学习心得)(1)

用spss平均数差异的显著性检验(统计学SPSS学习心得)(2)

用spss平均数差异的显著性检验(统计学SPSS学习心得)(3)

两组定量数据的比较,主要的方法有两种。一种是成组两样本t检验,一种是非参数秩和检验(wilcoxon 两样本秩和检验)。

一般来说秩和检验是t检验的补充,如果t检验不适合,就会考虑秩和检验。所以统计分析时,要考虑t检验是否合适?条件是否满足?

总的来说,t检验要求的两组、定量、正态、独立、方差齐的数据比较。前面两个要求和wilcoxon 两样本秩和检验相同,差别在于t检验要求数据符合正态性、独立性、方差齐性三个要求。这里对三个“性”进行简单的解释。

正态性。正态性条件是要求各组数据的总体分布为正态分布。一般来说,要求正态性检验P>0.05。此外,实际操作上,P≤0.05,但直方图显示大致正态也可以(近似正态分布)。关于正态性问题,上一讲已经有所陈述。此外,这里的正态性要求,指的是“各组”数据(本例是2组数据)分别满足条件。

独立性。独立性的意思是,两组数据的观察值相互独立,指的是两组数据不存在着相互相关性。例如,某个临床研究有两组数据,分别是14名高血压患者降压药服用前的血压和服用后的血压。显然,如果有名患者服用前血压很高,那么服用后血压也不会低;反之,服用前血压不高,那么服用后血压也不会高,所以两组数据存在着相关性。一般情况下,医学研究,如果是随机化分组,那么两组数据一般可以认为是独立的。如果是配对设计,那么两组数据就不独立!所以独立性的特点,一般我们根据研究设计主观判断即可。

方差齐性。方差齐性的意思是两组数据的方差大致相同。所谓的方差是标准差平方,其实也意味着标准差大致相同。比如有两组数据分别20±10,20±20。这意味着标准差相差一倍,则方差相差3倍,方差大不同。这种情况也不能直接用t检验。方差齐性的论证也通过统计软件完成;如果方差不齐,那么有类似的代替方法!

何种场景可以采用两样本t检验呢?

1.t检验结论取决于研究设计

t检验是最基本的假设检验方法,在随机、对照、平行的实验性研究中,t检验的结论十分可靠,完全证明一个干预措施是否真正产生效果,或者干预措施和定量结局是否存在着因果关系。

但是t检验如果用在非干预性的观察性研究,比如比较男性、女性的体重有无差别,其结论不能说性别是体重的影响因素,只能说男性和女性体重存在着统计学差异,仅此而已。关于观察性研究t检验,后期再进行分析。

因此,t检验结果到底能够说明什么问题,取决于研究设计。

2.t检验三个条件正态性、方差齐性和独立性一般最好遵守,但是条件不是那么死板。

对于独立性,一般情况下都是符合的,除了配对设计之外,所有诸位也不用特别担心。方差齐性,这个条件影响其实不大,无论方差齐不齐,从广义上来说采用的都是t检验。

对于正态性,需要说道说道。上一讲day 2 我介绍过,我们可以把正态性分为三类,以方便操作。

第一:正态性检验P>0.05,直方图呈中间多两边少特征,显然首先t检验方法

第二:正态性检验P≤0.05(但一般小样本时P值>0.01),直方图呈大致中间多两边少特征,我称之为近似正态分布,这种局面有可能一两个不太极端的异常值存在,或者本身临床上该指标是正态而选取样本有点奇怪造成。虽属于偏态分布,但t检验也可以用(毕竟用均数描述,进行t检验比较容易理解);特别是一组正态分布而另外一组近似正态分布的时候,t检验毫无问题。但是,近似非参数检验方法肯定没有错。因此,近似正态分布可选择t检验,或者非参数检验,视情况而定。比如你开展多个指标进行分析,其中大多数都是t检验,一两个指标近似正态分布,那么干脆全部用t检验;相反,如果大多数都是严重偏态分布,即便一两个指标近似正态,也不妨弃用t检验。

第三:严重偏态,正态性检验P<0.05,任何一组数据直方图偏态情况比较严重,呈“一边倒现象”。造成该现象的原因在于,存在着严重的极端值,或者该指标理论上就是偏态分布。此时,不应该采用t检验。

有人会问,多大偏态才是很严重的偏态,我认为这没有界限,正如t检验和秩和检验没有明显界限一样,因此我才设置缓冲一类(近似正态)。有人建议用偏态系数来评价,我认为这只不过徒增事情的复杂性罢了。

3. 较大的样本(比如超过100的样本量)两组数据的比较,严重偏态分布是否可以采用t检验?

网络上、甚至统计学教材中认为,大样本资料可以无视正态性问题。他们认为“根据中心极限定理,无论样本来自何种分布,只要样本量足够大(一般认为样本量大于50即为足够大或者更大的100以上),其样本均值均近似服从正态分布。因此样本量较大时,完全可以忽视正态性问题,仍然可以采用参数检验方法”。

这是不对的。根据中心极限理论,采用t检验本身没有错。以均数为基础的t检验,是可以比较两组大样本数据均数的差异性。但是,两组严重偏态分布,我们不能用来均数来表现数据,不能用均数来描述它。t检验是可以说两组均数是否有差异,但是均数的差异不能说明两组严重偏态数据的差异性(至少也得用中位数体现呀)。因此,t检验结论无法反映两组严重偏态数据的分布差异性,哪怕你是大样本!

,