查看原文
其他

P-Values到底是什么?

AWei 自我整合 2023-02-24

P-Values到底是什么?

心理学正处于重复性危机之中。这场危机仍在持续,至少已有60年的历史(Sterling, 1959)。自2011年以来,心理学研究者越来越意识到危机的存在,而且有一些改善的迹象。然而,人们对危机的程度和危机的原因也有很多困惑。


危机的根本原因是缺乏对统计数据的培训和理解。大多数心理学学生,虽然接受了关于统计学的入门课程的学习,但这是由缺乏统计理论知识的教师讲授的,以至一遍又一遍,一代又一代的错误学习与理解。


心理学研究员计算和报告的最重要的统计数据是p值,它与标准值进行比较,以表明假设得到了支持,如 p < 0.05。然而,在不了解p值含义的情况下报告p值竟成为了一种“仪式”。一篇又一篇写道:p < 0.05…p < 0.05…


一些心理学研究者喜欢把心理学的危机归咎于统计学家。毕竟,他们发明了p值和显著性检验。因此,如果心理学研究者使用了这些工具,并陷入危机,统计学家应该为这场危机负责。


emmm…

Fisher、Neyman、Pearson和在世的统计学家会对心理学研究者的p值仪式感到震惊。


正确的p值很难解释,但这并不意味着它们毫无用处。事实上,精确的p值对于显著性检验没有特别重要的意义。重要的是p值与标准值的比较。这个标准值叫做alpha。如果p值小于alpha,则表示结果具有统计学意义。如果p值大于alpha,则表示结果不显著。我们可以解释p <alpha或者p >alpha,但无法解释p = x的结果。


所以,真正的问题不是p值是什么意思,而是p小于alpha是什么意思?


要回答这个问题,我们先使用假设情境,因为我们永远不知道一个假设是真的还是假的。


场景A

假设研究人员以alpha=0 .05为标准测试100个假设。重要的是,研究人员不知道他所有的假设都是正确的。因此,没有一项统计测试产生假阳性结果。显著性结果的百分比取决于测试的概率。为了简化,我假设有50% power。有了这些假设,我们可以填入2×2频率表,该表包含假设的真与假,统计结果为显著(SIG)与不显著(NS)。


‘’

NS

SIG

Sum

TRUE

50

50

100

FALSE

0

0

0

Sum

50

50

100

假阳性结果(false & SIG)的百分比为0/100 = 0。在频率统计中,百分比与概率相等。所以,在这组研究中,假阳性结果的概率是0。


场景B

是另一个极端,研究者不知道所有的假设都是假的(e.g.,Bem, 2011)。我们不需要对power做出假设,因为没有真正的假设。


‘’

NS

SIG

Sum

TRUE

0

0

0

FALSE

95

5

100

Sum

95

5

100

在这种情况下,假阳性结果的百分比(false & SIG)是5/100 = 5%。这不是一个巧合。Alpha设置所有测试的显著性结果百分比的上限。

误报= k *alpha;k =进行的研究数量


如果错误假设的百分比介于0(场景A)和100(场景B)之间,那么错误阳性的百分比将介于0和alpha之间。例如,如果有60个错误的假设和40个正确的假设,那么所有测试中有3%会是假阳性。


‘’

NS

SIG

Sum

TRUE

2

20

40

FALSE

57

3

60

Sum

77

23

100

在现实中,假阳性的真实百分比是永远不知道的,因为这需要关于假设的真实性的知识。然而,最大的假阳性是已知的,并由alpha设置。这使得解释p值与alpha很容易。我们可以说,长期误报的频率不大于alpha。它可以小于alpha,但不能大于alpha。因此,假阳性结果的概率是p <alpha。


 在场景A中,观察到50个显著结果。在k = 100和alpha= 0.05的情况下,这些显著结果中不超过5个是假阳性。因此,至少有45(45/50 = 90%)的显著结果为真阳性。

在场景B中,只观察到5个显著结果。如果所有的假设都是假的,我们预计会有5个显著的结果,那么没有一个显著的结果可能是真正的阳性。

在方案C中,观察到23个显著结果。由于5个结果可能为假阳性,18个显著结果(18/23 = 78%的显著结果为真阳性)。


综上所述,将p值与标准值alpha进行比较,可以构建最大假阳性结果数量上最多的最坏情况场景,该场景由标准值alpha设置。可信的结果在显著的结果中有很高的真阳性比例。


来源https://replicationindex.com/2019/01/08/psychologists-p-values/

声明:部分文章和信息来源于互联网,如转载内容涉及版权等问题,请立即与小编联系,我们将迅速采取适当的措施。

感谢您抽出  · 来阅读此文

更多精彩请点击下列分类文章

↓↓↓

Meta分析 | 研究设计的检索

Mplus中常见错误提示

Meta分析 | 检索自由词

心理学上的验证危机

结构方程建模 | 打包步骤

治疗

你的问题实在是让我很为难。如果我说“不,我并没有觉得你很性感”你可能会感到很失望。如果我承认确实对你有想法,那么你可能会觉得知不治疗并没有你原先人为的那样安全。所以我觉得我最好还是不回答你的问题。

向左滑动

关注“自我整合”

从心开始做更好

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存