2019年值得关注的心理统计学文章(上)
不管愿不愿意,2020来了;人为的时间刻度标注了一个完全崭新的开始,伴随着新的挑战和机遇。在开始2020年更精彩、更有趣的心理学和管理学研究之际,或许我们也期望停下匆忙的脚步片刻,看看我们能从过去的2019年学到些什么。
“荷兰心理统计联盟”满足你的愿望!我们特推出两期年终盘点特别节目,介绍2019年心理统计领域最值得关注的研究报告;今天的第一期我们将特别关注那些讨论,修正和规范过往研究和统计方法的报告,也呼应在心理学如火如荼的“开放科学”风潮;第二期我们将重点介绍一些崭新的统计方法,以期提供给研究者更强有力的研究武器。
我们当然也只是精力和能力相当有限的凡人,因而这两期年终盘点难以避免地有以下局限性。第一,我们搜集的文章集中在发表于2019年的心理统计(和管理学统计)的三本刊物上——<Psychological Methods>, <Advances in Methods and Practices in Psychological Science> 和 <Organizational Research Methods>,其他知名期刊当然也有很重要很有意思的研究报告,很遗憾我们的盘点无法涉及。第二,判断文章是否重要(值得关注)是一个很主观的过程,事实上我们认为几乎所有发表在顶级心理统计期刊上的文章应该都是相当重要的;限于篇幅我们只能做出取舍,所依据的是我们相对主观的判断。第三,很遗憾再次限于篇幅,我们在盘点中对各文章的介绍相当简单和粗略,我们鼓励读者自行阅读感兴趣文章的全文,以真正掌握其精髓。废话不多说,以下是第一期中我们盘点的六篇文章(排名不分先后)。
文章1
在新方法涌现的当下,如何保障分析的可复制性
简单介绍和评论:
近几年来,以R为代表(还包括JASP,python)的免费开源统计软件以迅雷不及掩耳盗铃之势席卷心理学和管理学研究,极大程度上方便了研究者使用最新的统计方法,也因为代码的易传播性助推了心理学研究结果的可复制。然而, Epskamp的这篇文章强有力地指出R的广泛流行也对可复制性提出一定程度的挑战:第一,很多R的统计软件包还没有开发完全(比如很多beta初始版本),这些统计软件包(相比于付费软件如SPSS和SAS)无法保障计算完全可靠;第二,相当一部分统计软件包(甚至是相对常用的一些)及所使用的方法没有经过严格的验证(比如发表同行评审的论文),因此其可靠性难以得到保障;第三,站立在巨人的肩膀上,统计软件包大部分都有其仰仗的前序软件包(dependencies),因此软件包本身或者任一前序软件包的版本更新都可能导致运算结果发生改变。作者进而对研究者提出几点建议,包括推荐使用经过同行评审的经历时间考验的软件包,不仅提供分析的代码也提供分析的数据,注意所使用软件包的版本并在论文中明确指出,在编程过程中详细记录各个步骤的产生原因,以及尽可能检查代码中的错误。
文章2
提升二手数据分析透明度的一些建议
简单介绍和评论:
开放科学(open science)在心理学和管理学领域已经被广为接受和传颂了,她包含提升数据的易得性,在分析前预先注册假设,和提供所有分析过程这几个最重要的元素。在Weston等人的这篇文章里,他们讨论了开放科学一个重要但是被之前研究忽视的课题——对二手数据分析的透明度和可重复性。作者们认为,二手数据在获取代价较小,样本量相对较大这些优势之外,也不可避免地包含一些劣势,最为重要的是其中所使用测量的信度难以保障和控制,以及它在开放科学议题上的天然劣势——二手数据包含的大量变量使得“故意寻找显著性(p-harking)”轻而易举;与此同时,研究者(特别是之前使用过该数据的研究者)对其中很多变量和其相互关系有着非比寻常的知识。有鉴于此,作者提出了一系列建议来提升二手数据分析过程中的透明度,包括详细记录数据使用的情况(尝试了哪些变量,获得了怎样的结果);清晰完整地列出数据预处理的过程和使用的统计软件语句;在分析之前预注册假设;以及通过一些诸如交叉验证(在一个完全独立的新数据集上重复之前分析的结果)和稳健性检验(考察删除或添加一些控制变量对结果带来的影响)之类的统计方法增加结论的可靠性。
文章3
有序回归建议操作指南
简单介绍和评论:
问卷法研究是毫无争议的心理学和管理学中最常用的研究方法之一。问卷法中包含的里克特量表(也是参与心理学研究的人对心理学最根深蒂固的刻板印象之一)会输出五点或七点的有序回答(例如从“极不喜欢”到“极喜欢”)。心理学和管理学家们对此最常用的数据分析策略就是把它当作连续变量,殊不知,这一将有序变量当作连续变量的过程可能会导致例如ANOVA等分析的假设难以成立,体现在以下三个方面:(1)很难说有序变量不同等级之间是等距的,例如“极不喜欢”到“非常不喜欢”的距离可能比“较不喜欢”到“中立”的距离近得多,这违背了连续变量的一个基本原则;(2)有序变量的分布不一定能够符合正态分布(例如最低等级“极不喜欢”和最高等级“极喜欢”可能有着数量最多的拥趸);(3)有序变量的使用导致各被试组的方差很有可能不同。这也使得把有序变量当作连续变量很容易导致一型和二型错误的增加,错误的效应量估计,甚至混淆的效应方向性。在指出这一问题之后,Bürkner介绍了有序回归(即因变量是有序变量的回归模型)的基本概念和三种最为常用的模型及其分别适用的有序因变量种类:累积模型(cumulative model),其对应的有序因变量源自对于连续变量分类的结果(例如里克特量表测量“幸福感”的有序变量是对于幸福感这一潜变量分类的结果);序列模型(sequential model),其对应的有序因变量来自于一个序列(例如前女友数量来自于一个1开始的数字序列);和相邻种类模型(adjacent-category model),它所对应的有序因变量无法很好用之前两种模型来形容,这一模型主要通过其数学模型来定义。作者同时提供了适用R软件包brms完成有序回归的代码,示例和展示。
文章4
多重比较的最新指南
简单介绍和评论:
ANOVA大概是所有心理学和管理学者最为熟悉的初等统计方法之一了——我们大概都还记得本科心理统计课上被它支配的恐惧。在单因素ANOVA显著之后,倘若有不止两个组,我们都学过通用的做法就是用配对比较(或者说多重比较)去验证各个组之间的均值是否相同。Sauder的这篇文章真是着眼于确定配对比较所应该关注的统计程序上。作者们指出SPSS可以给出多达18种不同的程序,使得研究者异常困惑。他们通过仿真模拟的方法考察在ANOVA的假设(各组的样本量相同,各组的标准差相同)不能得到满足的情况下,哪些程序能够兼顾不犯太多的一型错误和令人满意的统计效力。他们发现了四种程序是相对更好的:Dunnett’s C, Dunnett’s T3, Games-Howell, 和 Tamhane’s T2。有意思的是,我们最熟悉的Bonferroni, LSD 和Tuker’s HSD 都不是被推荐的程序。
文章5
探索性因素分析确定因子个数的最新指南
简单介绍和评论:
探索性因素分析同样毫无疑问地位列最常用的心理统计方法,同时也是我们本科阶段心理统计课程中最先和最多接触的方法之一。探索性因素分析中最为关键的问题之一就是确定模型中潜变量(即因子)的数目。教材中最常见的方法是Kaiser-Guttman 标准(保留所有特征值大于1 的因子)和寻找特征因子图像中的拐点(Scree Test)。几年来,一些其他标准也被提出;加在一起总共有不下十种确定因子数量的方法,这也给实际研究带来了相当程度的困扰。Auerswald在这篇文章中探索了所有这些确定因子数量的方法在三种情况下的表现:只有一个潜在因子,有几个不相关的因子,以及有几个相关的因子。前两种情况下,基于主成分的平行分析(parallel analysis),Hull方法和一个改进版的Kaiser-Guttman 标准表现得最好;在最后一种情况下,数据比较法(comparison data)和序列卡方检验(Sequential chi-square model test)表现得最好。更有意思的是,作者建议把其中的几个指标联合起来分析,以得到最佳的因子选择方法——他们发现如果序列卡方检验和基于主成分的平行分析得到同样的因子个数,在绝大多数情况下这也是正确的因子数量。
文章6
基于实验数据的结构方程模型
简单介绍和评论:
本文的作者注意到一个有趣的事实——虽然结构方程模型被非常广泛用于对于问卷数据的处理;绝大部分实验数据的处理却依然仰仗非常原始的ANOVA。他进而指出ANOVA有着非常严苛的、绝大部分条件下难以满足的假设:ANOVA的使用需要假设因变量是被完美测量的,没有测量误差;ANOVA只能考察实验的不同条件对因变量的直接作用,因而无法同时考虑操纵检验;虽然ANOVA可以加入协变量(ANCOVA),但是协变量不允许和其他协变量或操纵因素相关,并且各组在协变量上的效应也必须相同。正是因此,作者进一步推荐两种结构方程模型用以分析实验数据:多指标多因素模型(multiple-indicator-multiple-cause, MIMIC)和结构均值模型(structured-means-modeling)。前者更为大家所熟悉,它的一个重要假设(而后者并没有这一假设)是所有组的测量模型完全相同(即测量具有不变性);其他假设还包括包含其中的因变量,协变量和操纵检验的方差需要在各组中保持同质性。换句话说,前者(MIMIC)是一个包含更多假设,更为简化的模型;后者(SMM)是一个假设更少也即更为复杂的模型。实际使用的过程中,本文作者推荐先尝试更为复杂的模型,在样本量不够的情况下再使用简单的MIMIC模型;我们做出相反的推荐——为了保证模型不过度拟合,研究者需要先从简单的模型开始,如果模型没有很好的拟合(通过结构方程模型的一些拟合诊断指标),辅以对残差的可视化分析,再过渡到相对更复杂的模型。
本文作者:袁帅
图文排版:张曼玉
该文章由荷兰心理统计联盟原创,未经授权,不得匿名转载。转载事宜后台联系,或邮件:infohpa2019@gmail.com
新内容预告及合作者招募:自2020年起,荷兰心理统计联盟拟对于发表在Psychological Methods 和Organizational Research Methods(季刊)的文章进行深度解析(每期文章的核心内容及应用),以便我们研究者能够了解最新的统计方法。如果您对统计方法感兴趣,有意向参与我们的活动,欢迎在文章底部留言,或后台联系我们。
往期精选