在假设检验中,我们经常见到这样的说法:因为P<0.05,所以拒绝原假设。这里的P值究竟是什么含义呢?很多人对P值存在误解,认为既然是与0.05作比较后得出结论,那么P值就是零假设成立的概率,P值越小,零假设越不正确。这种理解是错误的。例如零假设为某人患有肺气肿,对于这个问题,不能去讨论患肺气肿的概率,因为对于所有人,要么患此病,要么不患此病,不会因为P值的大小而改变。
先用一句通俗的话来解释P值:在原假设成立的条件下(注意该前提),出现该试验结果或更极端情况的概率。
从例子中了解P值:
有一天你和男朋友打赌说你有特殊技能,能够通过观察辨别出白酒和白水(颜色、外观等一切特质都相同)。
男朋友表示质疑,准备对你进行测试。随即摆出了20杯看上去毫无差别的白酒和白水让你区分,他事先已经做好万全准备,很清楚的知道每一杯装的是水还是酒,并用他的统计学知识写下了如下检验:
H0:没有特殊技能,分辨成功的概率为0.5(无确凿证据不能推翻的)
他一脸震惊的说:“这可是一个小概率事件,P值那么小的事件都发生了,你真的有特殊技能啊!”
这时,你嫌弃地对他说:“你的统计学确实不如我学的好,现在我是猜对了18杯,如果我猜对19杯,甚至20杯呢,是不是更说明我有特殊技能?
P值的含义就是在零假设成立的前提下,出现该结果或更极端情况的概率,而这儿的19、20就属于更极端的情况,所以刚刚那不是P值,加上猜对19杯、20杯的概率才是P值。”男朋友一脸膜拜的看着你,并立刻掏出了小本本计算P值:
你欣慰地说:“没错,就是这样。”
(理论上说,只猜对一杯、两杯的情况也属于极端情况,在这里我们只考虑单侧。)
这里的例子是取值为离散值时候的P值,取值为连续值时,P值则为出现某一区间范围的概率。#清风计划#
,