大家好,欢迎来到MedSPSS小课堂。
细心的小伙伴发现,在我们前几期的教学案例中,经常会用到正态检验,那在数据分析前,为何要做正态检验?判断数据正态有哪些方法?又如何判断正态检验的效果呢?我们本期将使用MedSPSS为大家操作解答。
1. 为何要进行正态检验?
正态检验主要用于判断连续性变量是否服从或近似服从正态分布。很多常见的分析检验都是以数据正态分布为前提的,如单样本t检验、独立样本t检验、方差分析、Person相关分析、回归分析等。在做这些分析之前,都需要对数据进行正态分析,如果数据不服从正态分布,直接进入分析,得到的统计结论可能会无效。
2. 如何判断数据是否符合正态性?
判断数据的正态性可采用多种方法,例如描述分析法、直方图、P-P图/Q-Q图、统计检验法等。
-
描述分析法
可通过数据的描述分析法得到数据的偏度和峰度系数,检验数据的正态性。
-
直方图
直方图可直观地展示数据分布情况,若数据基本符合正态分布,则会呈现中间直方高、两侧直方低、左右基本对称的“钟形”,同时再结合正态曲线判断数据是否符合正态分布。
-
Q-Q图/P-P图
Q-Q(Quantile-Quantile)图,即分位数-分位数图。图中横坐标表示理论正态分位数,纵坐标表示实际数据的分位数。
P-P(Probability-Probability)图,横坐标表示正态分布累积比例,纵坐标表示实际数据累积比例。
两种图都可以通过散点与正态分布预测直线的重合度来判断数据是否服从正态分布。
-
统计检验法
利用统计图主观判断数据的正态性,容易产生偏差,因此需要再结合统计检验法,比较常用的方法有通过峰度和偏度来进行检验的SW(Shapiro-Wilk)方法,基于拟合优度的KS(Kolmogorov-Smirnov)和AD(Anderson-Darling)正态检验法。
3. 使用案例
下面我们将使用MedSPSS,结合上述检验数据正态性的方法,判断一组体重指数(样本数量183)是否符合正态分布。
3.1描述分析法判断正态性
操作步骤:选择【图表】-【描述性分析】,拖拽分析项“体重指数”到右侧分析框内,点击“分析”即可得到结果。
分析结果
结果说明:严格来说,标准正态分布峰度和偏度都应为0,但现实中数据很难满足标准的正态分布。一般操作中,若峰度绝对值小于10且偏度绝对值小于3,就能认为数据符合正态分布。因此按照峰度和偏度来判断,案例中的体重指数满足正态分布。
3.2直方图
操作步骤:选择【图表】-【常用图表】-【直方图】,拖拽分析项“体重指数”到右侧分析项内,点击“分析”即可得到结果。
分析结果
结果说明:“体重指数”的直方图基本满足中间高、两侧直方低、左右基本对称的“钟形”,数据符合正态分布。
3.3 QQ图
操作步骤:选择【图表】-【常用图表】-【QQ图】,拖拽分析项“体重指数”到右侧分析项内,点击“分析”即可得到结果。
分析结果
结果说明:“体重指数”的QQ图,图中散点分布近似为一条对角直线,散点与正态分布的预测直线重合度好,数据符合正态分布。
3.4统计检验法-SW
操作步骤:选择【假设检验】-【分布检验】-【正态检验】,拖拽分析项BMI到右侧样本框内,检验方法选择shapiro-wilk,点击“分析”即可得到结果。
分析结果
正态检验智能分析结果
结果说明:采用 shapiro-wilk 检验“体重指数”正态性,分析结果的显著性p值大于 0.05,在95%的置信区间下,没有呈现出显著性,故不能拒绝原假设H0,因此数据符合正态分布。
3.5通过统计检验法-anderson
操作步骤:选择【假设检验】-【分布检验】-【anderson检验】,拖拽分析项“体重指数”到右侧样本框内,分布方式选择正态分布,点击“分析”即可得到结果。
分析结果
正态检验智能分析结果
结果说明:采用anderson检验其正态性,分析结果的显著性p值大于 0.05,在95%的置信区间下,没有呈现出显著性,不拒绝原假设H0,因此数据符合正态分布。
4. 其它说明
虽然正态检验法可以较为容易地判断数据是否服从正态分布,但当样本量较少时,检验结果不够敏感,即数据分布存在偏离也不一定能检验出来。而当样本量较大时,检验结果又会太过敏感,数据稍有一点偏离,检验结果就会倾向于拒绝原假设,认为数据不服从正态分布。因此,在实际应用中,可结合图形法和正态检验法综合来判断数据的正态性。
本期内容分享就到这里,MedSPSS将持续为大家带来案例教学,大家在学习的过程中有任何想法,欢迎积极留言。