原创 小薇 A科研显微镜 关注我们
你知道吗?目前已经发表的涉及统计分析的医学类文章大约有一半的统计方法都是错误的。读者普遍认为当一篇文章出现在期刊上时,审稿人和编辑已经仔细审查了手稿的各个方面,包括统计方法。然而事实并非如此。大量临床或生物医学研究人员实际上并没有接受过生物统计学方面的正式培训。盲目信任已发表文献设计自己的实验并进行统计分析是不可靠的。
今天小薇根据统计学相关文献,整理了一些基本的经验法则,可以用于评估已发表文章中统计数据的使用,当然也希望对你的数据分析有帮助。
实验数据一般都总结成mean SD,或SEM。SD代表标准偏差, SEM代表平均值的标准误差。
这里有一个基本法则,即:大约68%的观测值将在平均值的1个标准差范围内,大约95%的观测值将在平均值的2个标准差范围内,上述情况适用于标准差。(能看懂吗?看不懂我们以下面这个例子解释一下)
例如,一篇报道健康成年人的舒张压为 78 ± 6 mm Hg(mean ± SD)的文章,意味着大约95%的健康成年人的舒张压在66-90 mm Hg。
“2 个标准差规则”是一个很好的经验法则:当观测值(或可以假设)同样可能高于或低于平均值并且更可能接近平均值而不是远离平均值时,大约95%它们将在均值两侧的2个标准差内。
与标准差不同,均值的标准误差SEM不会总结观察值的可变性,也不会让读者深入了解观察值的范围。为什么大多数作者使用SEM来总结他们的数据?一是传统;其次,SEM总是小于标准差。如果作者报告了平均值和样本量的SEM,读者可以使用简单的公式计算标准差:
例如,假设一篇文章报道九名健康成人的舒张压为78 ± 2 mm Hg(平均值 ± SEM)。应该包括大约95%的观察结果的舒张压范围是多少?平均值的SEM为2,样本量为9,因此标准偏差(SD)为6 mm Hg。
答案是66-90 mm Hg,
结果和上一个例子一样。
相反,如果将“2 个标准差规则”直接用到平均值和SEM来判断舒张压的范围,就应该是
这个范围其实并不能反映常规的变化范围(范围过窄)。
那么,SEM衡量的是什么呢? 在一个实验中,研究者很少研究一个群体中所有可能的成员,而只研究一个小的、有代表性的样本。从这样一个样本计算出的平均值是对真实平均值的估计,如果可以观察到总体的所有成员,就可以计算出真实平均值。*因为用于计算平均值的样本是由被研究总体中随机抽取的个体组成的,所以这个样本及其平均值没有什么特别之处。特别是,如果抽签的运气不同,研究人员就会抽取包含不同个人的样本,并计算出不同的平均值。同样地,偶然可能导致第三次观察收集和第三次相关的均值。这三个样本都有一个均值,每个样本均值都是真实总体均值的估计。理论上,人们可以计算出所有可能样本的平均值。一般来说,每一个样本均值都是不同的,但如果能够观察到总体的所有成员,那么所有的均值都会聚集在真实均值周围。所有可能样本均值的标准差就是SEM。
因此,SEM并不像标准差那样量化观测值的可变性,而是样本均值估计真实总体均值的精度。也就是说,SEM量化了人们可以从样本中估计真实总体均值的确定性。
最后回到舒张压的例子,九名健康成人的样本让读者有95%的信心相信所有健康成人的平均舒张压为74-82 mm Hg。过窄的数据范围并没有说明数据的真实可变性。
因此,应该使用标准差SD而不是平均值的标准误SEM来总结数据。
你学会了吗?欢迎关注我们,了解更多硬核干货!
,