查看原文
其他

统计知识 | 谈谈P值和α水平

胡传鹏 OpenScience 2019-07-03

谈谈P值和α水平


2016年,对国内心理学专业的学生和研究人员(n = 308,其中本科生91名,硕士生134名,博士生56名,博士以上27名)做的一个调查显示,95%以上参与调查的人均无法正确理解P值的含义。其中对P值最大的误解是:将P值作为假阳性率(即拒绝零假设犯错的概率)(胡传鹏 et al., 2016)。


图1 引自《心理学研究中的可重复性问题:从危机到契机》


我也发现对P值和α水平的概念以及关系并不是那么容易理解,因此整理了自己关于P值和α水平的理解,希望与大家分享。

首先P值是我们通过转换得到的一个值,在假设检验中,我们得到的t值,z值,F值都可以转换为P值,比如Z=1.96,我们就可以通过查表或者统计软件计算得到对应的P=0.05。那么P值是什么意思呢?用书上的定义来讲,P值是当原假设为真的时候,得到当前结果以及更极端结果的概率。这个概念不是很好理解,我们可以通过例子来说明。

这里我们假设原假设分布是正态分布,我们做的是右侧检验,我们得到的样本均值是X1。如图2所示。

从图上我们可以看到,当原假设为真,我们求得X1的概率是P(X1),我们将X1代入正态分布的公式,就很容易计算出P(X1)的值。很多人会误认为P(X1)就是P值,但其实不是的,P(X1)只代表了当前结果的概率,而没有代表更极端结果的概率。

那么当前概率及更极端结果的概率应该包括哪些部分呢?

在这个右侧检验里,它就应该包括X1及其以右的部分,如图3阴影部分的区域A。这里区域A的面积SA=p(>=x1 | H0)= ∫f(x)dx (x>x1)(注:f(x)为正态分布表达式),这里区域A的面积SA就是我们要求的P值。

而至于α水平,它是我们人为设定的拒绝域,通常来说我们会把它设定为0.05,这意味着,当原假设为真时,我们的抽样只有5%的可能性落在该区域内。

如图4所示,在这个右侧检验里,如果α水平设定为0.05,那么区域B面积SB=P(α|H0)=0.05。所以在这个假设检验里,如果原假设为真,那么我们一次抽样结果只有5%的可能性落在区域B里,而根据小概率事件原理,我们认为这样小概率的结果不会在一次抽样中发生。如果它发生了,那么就说明我们样本并不来自于这个总体,所以我们拒绝原假设。而当我们需要更严苛的标准时,我们可以将α水平设为0.01,或者更小。

因此P < α(即SA<SB)表达的是在一次抽样中出现当前结果及更极端结果的可能性比我们认为的在一次抽样中不可能发生的小概率事件的概率更小,也就是说我们的观察结果比我们设定的拒绝程度更加极端。 所以在样本量不变的情况下,P值比α水平越小,我们就越有信心认为这个样本不属于原假设分布代表的总体,就越有信心拒绝原假设。


回到文章开头关于对P值理解的调查,很多人会把P值当作我们拒绝原假设的犯错概率(i.e., p     ),但其实拒绝原假设犯错属于一类错误,错误的概率就是我们的α,P值只是我们根据一次抽样结果计算出来的值。这就好比我们设定超速的标准为120km/h,而我们探测到n辆汽车的平均时速为110km/h,但我们不能因此就认为超速标准为110km/h。


以上的内容是自己暂时的一个认识,如果读者有其他见解,欢迎提出指正。



参考文献

胡传鹏, 王非, 过继成思, 宋梦迪, 隋洁, & 彭凯平. (2016). 心理学研究中的可重复性问题:从危机到契机. 心理科学进展, 24(9), 1504-1518.


作    者:殷继兴

校    对:纪学君、赵加伟

编    辑:崔芷君


Modified on

    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存