统计知识 | 如何报告贝叶斯因子
贝叶斯因子是贝叶斯统计方法在假设检验方面的一个应用,其代表的是当前数据对一个模型的支持程度与对另一个模型程度支持程度的比例。
近年来,由于心理学中受到可重复性危机的困扰,而对零假设显著性检验(Null Hypothesis Significance Test, NHST)的过度依赖正是其中 一个非常重要的原因,所以不少研究者推荐使用贝叶斯因子,并且开发了相应的软件JASP(jasp-stats.org)。关于贝叶斯因子及其如何在免费开源软件JASP中实现,见论文:[Pre-print]贝叶斯因子及其在JASP中的实现(点击阅读原文,查看全文)。在论文中,我们对贝叶斯因子进行了较为系统地介绍。
在这里,我们单独将如何报告贝叶斯因子部分摘录出来,因为这一部分内容对于想应用JASP及贝叶斯因子的小伙伴们非常重要。
以下引号内的部分是原文内容,引号外的内容是更为通俗的解读。
“贝叶斯统计在目前的心理学研究中并不常见。虽然大部分杂志的编辑和审稿人会欣赏采用更加合理的统计手段, 但是出于对贝叶斯方法的陌生, 研究者使用贝叶斯因子时, 需要提供相关的背景信息让编辑和审稿人了解这种背景。”
如果编辑和审稿人不了解你的使用的统计方法,TA们可能更有可能不信任你的论文。
“因此, 除了报告贝叶斯因子的结果之外, 还需要首先报告如下几点(Kruschke, 2014)。
第一, 选用贝叶斯因子的动机与原因, 即为什么在某个报告中使用贝叶斯因子而不是 NHST。如前所述, 可以说明贝叶斯因子提供了更加丰富的信息, 或者数据特点不满足 NHST的前提假设(如在自然情境下收集的数据, 无法判断数据收集的动机和实验假设)。”
使用贝叶斯因子的原因有无数个,因为NHST对于科学研究来说,其存在的问题实在不少。比如,论文中还提到,贝叶斯因子可以用来支持零假设,这一点对于NHST来说就会比较复杂了(虽然不是无法实现)。
“第二, 描述贝叶斯因子在模型比较中的基本逻辑。即, 假定读者并不非常了解贝叶斯因子, 简单地解释贝叶斯因子中模型比较的思想。”
嗯,与前面说的相似,让编辑和审稿人明白你在做什么。虽然大部分人可能已经听说过贝叶斯因子,但不排除你的编辑或者审稿人不知道。
“第三, 描述贝叶斯因子分析中的先验分布以及采用该先验的原因, 先验分布应该或多或少对数据分析提供一些信息。”
这个非常重要!因为先验分布对贝叶斯因子的影响太大了。但对于大部分情况下,你可以使用JASP的默认先验分布。在这种情况下,你只需要说,我们使用JASP的默认分布即可。
“第四, 解释贝叶斯因子, 将贝叶斯因子与研究中的理论或假设结合起来。”
这同样非常重要。在NHST中,大家知道p值小于0.05就是显著了,但是使用贝叶斯因子,这个值该怎么解读呢?在我们的论文中,我们介绍了贝叶斯因子用来判断的标准:
我们可以以最近Journal of Autism and Developmental Disorders一篇文章(Gray, et al., 2018)为例,在方法部分的数据分析中,作者们写到:
Bayes factors were computed using JASP (Love et al. 2015) with default prior width; we report evidence that the data were more likely under the alternative model compared to the null model, and interpreted Bayes factors (BF) of < 3 as anecdotal, 3–10 as substantial, 10–30 as strong, 30–100 as very strong, and > 100 as decisive evidence (Jeffereys 1961). In all Bayesian analyses reported, we included subject, age and gender as random factors.
以上的加粗部分即包括了先验分布与贝叶斯因子解读的信息。
那么在结果部分,应该如何进行描述呢?我们在论文中翻译了Wagenmakers et al (2015)论文的结果部分:
“贝叶斯因子不使用统计显著, 而是描述数据对假设的支持程度。例如, 在 Wagenmakers 等(2015)中, 对 Jeffreys 默认先验下的贝叶斯因子结果进行如下描述:‘贝叶斯因子为 BF01 = 10.76, 说明在(假定没有效应的)零假设下出现当前数据的可能性是在(假定存在效应的)备择假设下可能性的 10.76 倍。根据 Jeffreys (1961)提出的分类标准, 这是较强的证据支持了零假设, 即在顺时针和立逆时针转钟表指针的人在经验开放性(NEO)得分上没有差异。 ’”
“此外, 使用贝叶斯因子进行分析时, 还可以报告探索性的结果, 如稳健性分析和序列分析的结果, 这将进一步丰富结果, 给其他研究者提供更加全面的信息。”
在结果报告中,报告这些额外分析会给论文提供额外的信息。例如稳健性分析可以看到改变先验分布对贝叶斯因子的影响有多大,这能够提供关于结果是否稳定的信息。
参考文献:
胡传鹏, 孔祥祯, Wagenmakers, E.-J., Ly, A., 彭凯平. (2018). 贝叶斯因子及其在JASP中的实现. 心理科学进展, 26(6), 951-965. doi:10.3724/SP.J.1042.2018.00951
Gray, K. L. H., Haffey, A., Mihaylova, H. L., & Chakrabarti, B. (2018). Lack of Privileged Access to Awareness for Rewarding Social Scenes in Autism Spectrum Disorder. Journal of Autism and Developmental Disorders. doi:10.1007/s10803-018-3595-9
作者:胡传鹏
校对:王薇薇
排版:赵加伟
Open Science Club
Make psychology open and trustworthy!