怎么看geo数据库的样本量(Gpower使用秘籍样本量计算)(1)

小伙伴们有没有过遇到过以下这几种情况:每次开始一个研究前,脑子里总会冒出一个疑问,我的研究需要多少样本量呢?或者论文答辩时,当老师提到你这个样本量能支撑你的研究结论吗?又或者在投稿时,审稿人在反馈意见中提到你这个研究的被试量太少了,结果的准确性有保证吗?那么这时当发现自己样本量不够时,能想到的解决方法就是要么补实验数据;要么让审稿人信服你的被试量是足够的,得到的结果是可靠的。

然而有时因为现实原因,以上方法很难实现。那么,此时大家该怎样去解决这个样本量的问题呢,或许可以尝试另一种方法,即:进行先验分析,估计所需要的样本量,然后看看你的数据量能否大于估计的样本量。或者进行事后分析,说明你现目前的数据量可以达到什么样的效应量和统计功效水平,是足够让人信服的。

而GPOWER软件就可以帮助我们解决一系列样本量的问题。因此为了帮助大家顺利解决这一问题,小编认真的整理了“样本量估计”的相关材料分享给大家!!

本期内容主要从以下几个方面进行讲解分享:

一、相关统计概念介绍

二、GPOWER软件的简介与安装

三、使用GPOWER进行样本量的估计

一、相关统计概念介绍

在进行任何一项研究时,都需要根据已有的理论和经验事先对研究结果作出一种预想的希望证实的假设。这种假设叫科学假设,用统计术语表示时叫研究假设,记作H1。然而在统计学中很难直接检验H1的真实性,因此需要建立与之对立的假设,称作虚无假设,或叫无差假设、零假设、原假设,记为H0。

在假设检验中H0 总是作为直接被检验的假设,而H1与H0对立,二者择一,因而H1有时又叫做对立假设或备择假设。假设检验的问题,就是要判断虚无假设H0是否正确,决定接受还是拒绝虚无假设H0。

当原假设H0正确时,由于样本的随机性,拒绝了H0,犯了“弃真”错误,又称为第一类错误,Ⅰ型错误。概率为α(即假设检验的显著性水平),故常常成为α型错误。

当原假设H0不正确时,但接受了H0,犯了“取伪”错误,又称为第二类错误,Ⅱ型错误。概率为β。

一个好的检验应该在样本容量n一定的情况下,使犯这两类错误的概率α和β都尽可能小。

怎么看geo数据库的样本量(Gpower使用秘籍样本量计算)(2)

而我们一般说研究需要多大样本量?或者研究样本量已经有了,有多大概率可以得出有统计学意义的统计结果(这个样本量值得去做研究吗)?这些问题都可以通过功效分析(Power Analysis)来解决。那么要进行功效分析,先要了解一下分析中涉及4个统计量:样本量(Sample Size)、效应值(Effect Size)、显著标准(Alpha)、统计功效(Power),知其三个可推断另外一个。其中

统计功效指某检验能够正确地拒绝一个错误的虚无假设的能力。用1-β表示。

统计功效的大小取决于四个条件:

1.两总体差异。当两总体实有差异越大,或处理效应越大,则假设检验的统计功效越大;(在α错误概率不变的情况下,1-β变大)

2.显著性标准α:也称显著性水平,是一个特定的值,一个决策标准。通过p与α的决策比较,作出统计决策。

而当假设H0是真实的时候,观察到的差异完全是由随机误差所致的概率称为观察概率p。

显著性标准α越大,则β错误越小,从而统计功效1-β越大;反之,α变小,1-β变小

3.检验的方向:当两总体差异一定,对于同样的显著性标准α,单侧检验比双侧检验的统计功效要大。

4.样本容量。样本容量越大,样本平均数分布的标准误越小,分布曲线越瘦削,统计功效越大。

效应量,反映处理效应大小的度量。效应量表示两个总体分布的重叠程度。Effect Size 越大,表示两总体重叠的程度越小,效应越明显。其实,两样本平均数的差异本身就是一个效应量。由计算出的Effect Size大小,可由专门的表格中查出两样本分布的重叠的百分比。故效应量经常用两总体重叠的程度为指标,重叠的部分百分比越大,效应量越小。或以两个样本不重叠的程度为指标,不重叠的部分百分比越大,效应量越大。效应值是量化现象强度的数值,在不同的统计方法中统计量会不同。

对于有些小伙伴来说,上面的统计学概念可能有些抽象,下面小编为大家推荐一个网址(https://rpsychologist.com/d3/NHST/),在这个网站上,我们可以可视化的了解各个概念之间的关系。这个可视化是基于一个单样本的Z检验。你可以使用滑块改变样本量、功率、显著性水平和效应大小,以观察抽样分布的变化。如下图(左—双尾;右-单尾):

怎么看geo数据库的样本量(Gpower使用秘籍样本量计算)(3)

G*power软件是由德国杜塞尔多夫大学几位乐于分享知识的老师开发的,专门用于统计功效(包括样本量)计算的免费统计软件,在心理学领域有着很高的声誉和认可度。

在官网即可下载软件,网址为:http://www.gpower.hhu.de/

(安装后图表见右图)

怎么看geo数据库的样本量(Gpower使用秘籍样本量计算)(4)

怎么看geo数据库的样本量(Gpower使用秘籍样本量计算)(5)

下图为软件的主界面(红框内中可依据实验设计选择统计方法;黄框内可依据分析目的选择功效分析类型):

怎么看geo数据库的样本量(Gpower使用秘籍样本量计算)(6)

其中,Gpower 中最常见的统计力分析(power analysis)类型包括以下几类:

1.先验 (priori) 分析:根据所给的α水平,统计力水平(1-β)和效应大小(H0和H1的差异),计算样本容量;

2.事后 (post-hoc) 分析:根据N,α,效应大小,得出β;

3.折中 (compromise) 分析:想得到较小的α和较大的1-β,所以α和β之间的权重用q = β/α表示,所以知道 N,q和具体的效应大小,得出α和β。

4.标准(Criterion)分析:根据 1-β、effect size 和 N 计算a 和相关决策标准。

5.敏感性(Sensitivity)分析:根据α、 1-β和N计算effect size 。

G.Power的功能强大,即可以计算事后统计检验力(事后分析),也可以进行事前样本量的估计(先验分析)。

基本步骤如下:

1、选择统计方法:(Exact—Fisher\F test—方差分析\t test差异性t检验\X2test—卡方检验\Z test—非参数检验)

怎么看geo数据库的样本量(Gpower使用秘籍样本量计算)(7)

2、进一步选择分类:(这里以t 检验为例)

怎么看geo数据库的样本量(Gpower使用秘籍样本量计算)(8)

3、确定想得到的参数:

①A Priori:研究设计时,想知道所需样本量N

②Compromise:α与β固定(不常用)

③Criterion:计算α(一般α为0.01、0.05不需要计算)

④Post hoc:计算研究结果的检验效能(power)——1-β

⑤Sensitivity:实验完成后,计算效应量

一般来说,①、④、⑤比较常用

怎么看geo数据库的样本量(Gpower使用秘籍样本量计算)(9)

4、设定各个参数:

怎么看geo数据库的样本量(Gpower使用秘籍样本量计算)(10)

Tail:one—单尾;two—双尾。一般选择后者;

Effect size:效应量,t检验里,采用Cohen(1988)的计算方法,小=0.2、中=0.5、大=0.8,不知如何填时,选0.5;

a err prob:一般为0.05、0.01;

Power:检验效能,0.8以上可以;

Allocation ratio:2组样本量n比值

5、最后点击Calculate:

结果里给出了所需样本量。在本例中,结果显示,保证得到效应在0.5(中)的前提下,设定a=0.05并且检验效能为0.8时,需要每组至少有64个样本。

怎么看geo数据库的样本量(Gpower使用秘籍样本量计算)(11)

以上就是本期分享的主要内容,希望可以帮助你顺利解决目前的苦恼~

在下期内容中小编会为大家详细讲解各个统计方法下具体是如何用GPOWER进行样本量估计的。

记得关注momo老师,获得更多精彩内容哦~

,