心理学上的验证危机

Original AWei 自我整合 2023-02-24

心理学上的验证危机

大多数公布的心理测量都是无效的。

*无效=测量的有效性未知。

8年前，心理学家开始意识到他们有重复危机。在允许数据决定假设是真还是假的情况下，许多已公布的结果没有被重复研究中复制。

重复危机有时归因于2011年前缺乏重复研究。然而，事实并非如此。大多数发表的结果都被成功地重复。然而，这些成功是完全可以预测的，因为只有成功的重复才会出版(Sterling, 1959)。过去8年，这些虚假的重复研究对可信的重复研究理论提供了虚假证据。这种开放科学的新举措可能会在未来提高心理科学的可重复性，尽管朝着这一目标的进展非常缓慢。

可重复性只是健康科学的一个必要特征。健康科学的另一个必要特征是使用方法的有效性，即构念效度（Construct Validity）（心理测量属性的标准）。为了检验理论构念之间相互关联的理论(例如，在条件C下，从群体P中抽取的个体构念A对个体构念B的影响)，有必要具有有效的构念测量。但是，尚不清楚措施必须满足哪些标准才能具有结构效度。因此，即使对理论进行成功和可重复的测试也可能是错误的，因为所使用的测量方法缺乏结构有效性。

为了证明预测有效性，我们可以简单地获得一个测量值和一个标准的分数，并计算这两个变量之间的相关性。相关系数表明了该测度的预测有效性。然而，由于构念是不可观察的，因此不可能使用简单的相关性来检验构念的有效性。

构念验证的问题可以用IQ分数的发展来说明。IQ分数具有预测效度(例如，学生的表现)，而不需要对被测量的结构做出任何声明(IQ测试测量他们测量的东西，以及他们测量的东西预测重要的结果)。然而，智商测试通常被视为智力的衡量标准。为了使智商测试成为有效的智力测量手段，有必要定义智力的结构，并证明所观察到的智商分数与未观察到的智力变化有关。

因此，构念验证需要对独立于被验证的度量的构念进行清晰的定义。如果没有对构念的清晰定义，测量的意义本质上就会回到“测量的是什么”，就像老话所说的“智力就是智商测试所测量的是什么”。这句话说明了研究的问题在于测量没有明确的构念和构念效度。

目前心理学中使用的一些测量方法可能存在构念效度不足的问题。自从Cronbach和Meehl(1955)提出了一个构念验证研究方案以来，验证研究缺乏改进。大量引用表明，他们成功地引入了这个术语，但未能建立严格的构念效度标准。就像心理学家在过去几年开始欣赏重复失败一样，现在也需要接受构念验证失败这种现状。

参考来源：

The Validation Crisis in Psychology – Replicability-Index https://replicationindex.com/2019/02/16/the-validation-crisis-in-psychology/amp/

声明：部分文章和信息来源于互联网，如转载内容涉及版权等问题，请立即与小编联系，我们将迅速采取适当的措施。

感谢您抽出 · 来阅读此文

更多精彩请点击下列分类文章

↓↓↓

Meta分析 | 研究设计的检索

Mini Meta-analysis或单论文中的元分析

两周年小记暨2018文章集锦

元分析程序包使用指南

9102，猪事顺利

治疗