心理学上的验证危机
心理学上的验证危机
大多数公布的心理测量都是无效的。
*无效=测量的有效性未知。
8年前,心理学家开始意识到他们有重复危机。在允许数据决定假设是真还是假的情况下,许多已公布的结果没有被重复研究中复制。
重复危机有时归因于2011年前缺乏重复研究。然而,事实并非如此。大多数发表的结果都被成功地重复。然而,这些成功是完全可以预测的,因为只有成功的重复才会出版(Sterling, 1959)。过去8年,这些虚假的重复研究对可信的重复研究理论提供了虚假证据。这种开放科学的新举措可能会在未来提高心理科学的可重复性,尽管朝着这一目标的进展非常缓慢。
可重复性只是健康科学的一个必要特征。健康科学的另一个必要特征是使用方法的有效性,即构念效度(Construct Validity)(心理测量属性的标准)。为了检验理论构念之间相互关联的理论(例如,在条件C下,从群体P中抽取的个体构念A对个体构念B的影响),有必要具有有效的构念测量。但是,尚不清楚措施必须满足哪些标准才能具有结构效度。因此,即使对理论进行成功和可重复的测试也可能是错误的,因为所使用的测量方法缺乏结构有效性。
为了证明预测有效性,我们可以简单地获得一个测量值和一个标准的分数,并计算这两个变量之间的相关性。相关系数表明了该测度的预测有效性。然而,由于构念是不可观察的,因此不可能使用简单的相关性来检验构念的有效性。
构念验证的问题可以用IQ分数的发展来说明。IQ分数具有预测效度(例如,学生的表现),而不需要对被测量的结构做出任何声明(IQ测试测量他们测量的东西,以及他们测量的东西预测重要的结果)。然而,智商测试通常被视为智力的衡量标准。为了使智商测试成为有效的智力测量手段,有必要定义智力的结构,并证明所观察到的智商分数与未观察到的智力变化有关。
因此,构念验证需要对独立于被验证的度量的构念进行清晰的定义。如果没有对构念的清晰定义,测量的意义本质上就会回到“测量的是什么”,就像老话所说的“智力就是智商测试所测量的是什么”。这句话说明了研究的问题在于测量没有明确的构念和构念效度。
目前心理学中使用的一些测量方法可能存在构念效度不足的问题。自从Cronbach和Meehl(1955)提出了一个构念验证研究方案以来,验证研究缺乏改进。大量引用表明,他们成功地引入了这个术语,但未能建立严格的构念效度标准。就像心理学家在过去几年开始欣赏重复失败一样,现在也需要接受构念验证失败这种现状。
参考来源:
The Validation Crisis in Psychology – Replicability-Index https://replicationindex.com/2019/02/16/the-validation-crisis-in-psychology/amp/
声明:部分文章和信息来源于互联网,如转载内容涉及版权等问题,请立即与小编联系,我们将迅速采取适当的措施。
感谢您抽出
更多精彩请点击下列分类文章
↓↓↓
当解释工作被推迟到接下来的一次治疗时,治疗师和患者双方都已“冷静下来”,此时进入分析性空间的能力得以恢复。