中介效应分析:三段式中介效应模型真的适用于经济学研究吗?
👇 连享会 · 推文导航 | www.lianxh.cn
🍎 Stata:Stata基础 | Stata绘图 | Stata程序 | Stata新命令 📘 论文:数据处理 | 结果输出 | 论文写作 | 数据分享 💹 计量:回归分析 | 交乘项-调节 | IV-GMM | 时间序列 | 面板数据 | 空间计量 | Probit-Logit | 分位数回归 ⛳ 专题:SFA-DEA | 生存分析 | 爬虫 | 机器学习 | 文本分析 🔃 因果:DID | RDD | 因果推断 | 合成控制法 | PSM-Matching 🔨 工具:工具软件 | Markdown | Python-R-Stata 🎧 课程:公开课-直播 | 计量专题 | 关于连享会
连享会 · 效率分析专题
作者:文海铭 (广西大学)
邮箱:hming_wen@sina.com
温馨提示: 文中链接在微信中无法生效。请点击底部「阅读原文」。或直接长按/扫描如下二维码,直达原文:
编者按:本文主要摘译自下文,特此致谢!
Source:Bullock J G, Green D P, Ha S E. Yes, but what’s the mechanism?(don’t expect an easy answer)[J]. Journal of personality and social psychology, 2010, 98(4): 550. -PDF-
目录
1. 中介效应的起源和发展
2. 中介效应基本模型和分析
3. 中介效应常见问题
4. 对问题的解释方案
5. 总结
6. 相关推文
1. 中介效应的起源和发展
中介效应分析在自然科学和社会科学中有着悠久的历史 (Blau 和 Duncan,1967;Fisher,1935;Lazarsfeld,1955),但现在它在心理学中比在其它学科中更常见。Baron 和 Kenny (1986) 关于中介的文章,是 Journal of Personality and Social Psychology 历史上引用最多的文章。
由于其突出的地位,Baron 和 Kenny (1986) 提出的中介分析方法尽管仍然被广泛使用,但已经受到了一系列的批评,并有了改进 (Mathieu 和 Taylor,2006)。不过,这些改进并没有解决关于中介分析的基本问题。这些问题越来越多地引起统计学家的关注 (Robins,2003;Rubin,2005),他们认为巴伦-肯尼方法 (Baron-Kenny method) 和其他非实验性方法的应用可能会产生有偏的中介效应估计。
在本文中,我们简要介绍了中介效应分析的设计、存在问题、以及改进建议。关于中介效应是否在经济学研究中适用,大家也可以参考知乎热议「三段式中介效应模型真的适用于经济学研究吗?还可以用什么方法来检验影响机制?」。
2. 中介效应基本模型和分析
中介效应分析大都基于以下三个线性方程:
其中, 是样本中的个体, 是因变量, 是自变量, 是自变量的潜在中介;、、 是截距;、、 是均值为零的误差项,代表遗漏变量的累积效应,例如 代表 以外的变量对 的影响。
为了回避 是否真正导致 的问题,我们在本文中假设 是随机分配的。 对 的影响是 , 对 的总影响是 , 对 的直接影响是 , 对 的间接 (中介) 影响是 ,或者说是 。
在没有抽样变化的情况下,巴伦-肯尼方法 (Baron-Kenny) 中 的估计值等于:
的估计值等于:
其中, 是 和 的协方差, 是 的方差。可以看出, 的估计值是有偏的,即使在无限大的样本中,它也等于 的真实值加上一个额外的量。 的估计值也是有偏差的,它等于 的真实值减去一个额外的数量。
和 的估计值只有在这些额外的数量等于零时,才是无偏的 (即只有在 和 不相关时)。但很不幸的是,在实践中 和 几乎肯定是相关的。如果一个未观察到的变量对 和 都有影响,它将反映在两个误差项中,导致这些误差项相关。
即使没有未观察到的变量同时影响 和 ,如果 只是与未观察到的变量 (如另一个中介) 相关,误差项也可能会相关。这个警告曾经被那些写中介分析的人发出过 (MacKinnon 等,2002),但它似乎没有被该学科的主流所注意。正如 Kenny (2008) 所说,许多学者要么没有意识到他们正在进行因果分析,要么无法证明他们所做的假设是正确的。
巴伦-肯尼的估计不仅容易产生偏误,而且还容易产生夸大中介效应的偏误。具体地,对于 估计量中的偏差项 ,如果此项与 的符号相同,那么巴伦-肯尼对 的估计就会被夸大。在实践中,这项通常与 的符号相同,因为除 以外的影响 的因素也在同一方向上影响 。
例如,父母收入 对子女的收入 的影响可能是由子女的教育 部分中介。富裕的父母为他们的孩子购买更好的学校教育,这反过来又会增加孩子的收入。许多变量可能会在同一方向上影响子女的教育和收入:靠近好学校,父母对教育的态度,就业市场上的教育回报,以及政府的教育政策都符合。在经济学研究中,中介分析往往会遗漏这些变量,进而使得分析偏向于发现中介效应,而且遗漏的变量越细微,偏向性就越大。
实验性研究相比观察性研究是否能更好地进行因果推断呢?在方程 3 中,对 的实验操纵允许无偏估计 ,即 对 的影响。事实上实验性研究仍然存在问题:
第一,除非实验性干预只影响有关的中介者,而没有其他中介者,否则对中介者进行实验性操纵的分析将是不准确的; 第二,实验性中介分析产生的间接效应估计值通常只适用于一个未知的主体子集; 第三,如果样本中的变量受到 和 变化的不同影响,即使是成功地操纵了单一中介物的实验,也可能产生不准确的间接因果效应的估计。
这些问题都不能简单地归结为未观察到的变量问题,其中前两个问题特别适用于中介分析。
3. 中介效应常见问题
第一,只有当实验干预只影响有问题的中介而没有其他中介时,对间接影响的估计才是准确的。例如 Bolger 和 Amarel (2007) 的实验:使用同伙的陈述来促进或减少他们的效能感。如果同伙的陈述也会影响受试者的情绪,然而情绪也会调节支持和减轻压力之间的关系,那么就违反了没有其他中介的假设,对效能效果的估计也会被情绪的影响所污染。
如果实验干预要产生有意义的因果推论,他们必须针对我们想要确定其影响的特定因素。经济学研究中很多时候不能判定干预只影响有问题的中介,中介效应对间接影响的估计也不够准确。
第二,多种中介的存在带来的挑战。首先,一个自变量的效应可能通过多种因果途径传递,但很难建立一个包含所有潜在途径的综合模型。其次,即使人们可以详细描述所有的因果路径,测量这些路径的要素——也就是所有潜在的中介——也是一项艰巨的任务。但这是确保对中介估计的准确性所必需的。
即使成功地瞄准了特定的中介,也会面临第二个困境:该方法产生的间接影响的估计不适用于整个样本,而只适用于那些受干预影响的样本。例如临床试验检验药物的效果,对照组样本都被要求服用避孕药,但如果有人拒绝,我们没有办法了解这些不遵守规定的人在服用了避孕药的条件下,会有何种影响。因此,我们无法估计样本中所有样本服用避孕药的平均效果。
同时,对中介 的不同操作可能会产生关于中介的不同结论,即使这些操作对 有相同的平均影响。当不同的操作影响到样本内不同的受试者群体时,中介分析试图衡量 诱导的 变化对 的影响。我们不能简单地操纵 来衡量这种影响:基于 操作的分析存在偏差。
相反,我们必须使用另一种干预——称之为 ——在保持 不变的情况下诱导 的变化。但新的问题是, 的变化可能会影响一组受试者的 ,而 的变化可能会影响另一组的 。除非 和 之间的关系对两组都是相同的,否则使用 来操纵 将会对 中介 的方式产生有偏误的估计。
第三,因果异质性阻碍计算平均的直接和间接影响。考虑以下方程:
给定方程 1a 和 3a,对任何主体 , 对 的间接影响是 。我们不能观察任何个体受试者的 或 ,但我们可以进行一个实验,产生 的平均估计 ,和另一个实验,产生 的平均估计 。
如果 和 对每个主体都是相同的,那么 将是准确的估计平均直接效应。假设 和 对某些受试者都是负向的,对另一些人都是正向的。在这种情况下, 对样本中的每个受试者都有正向的间接影响,因为每个受试者的 。但是 可以是 0、正向的、负向的, 也可以是 0、正向的、负向的。因此,平均间接效应的估计可能是零或负的,即使真正的间接效应不仅平均是正的,而且对样本中的每个受试者都是正的。
即使中介被实验操纵,因果异质性也难以估计间接影响。对于图 A, 和 ,表示间接影响 。对于图 B, 和 ,表示间接影响 。间接效应对每一个主体都是正向的。但如果 和 的受试者数量相等,则 和 ,平均间接效应 。尽管 和 都是随机化的,但这个估计的符号错误,而且比真正的间接效应要小得多。
4. 对问题的解释方案
一些统计程序可以帮助我们理解中介,但中介分析的最大障碍不能完全或甚至主要通过这些程序来克服,使用中介分析时,做一些额外的解释可能会使模型更可靠。
第一,如果不是操纵中介,则应该解释为什么 ,即为什么未观察到的影响 的因素与未观察到的影响 的因素不相关。此外,还应该解释为什么观察到的中介 与没有观察到的中介不相关。
第二,如果是操纵中介,则应该解释为什么认为每一个操纵只影响一个中介,而不是其他中介。这需要描述 可能影响 的因果路径,并解释为什么每个操作只影响这些路径中的一条。替代因果路径的列表可能是广泛的,因此需要一系列的研究来证明一个给定的干预往往不会影响这些替代路径。
第三,中介分析需要在保持 不变的情况下改变 的值,这是有问题的。因为理论上, 相关的变化是由 引起的。实验中介分析要求我们找到另一种改变 值的方法,但不能保证这些变化与 引起的变化相同。 的变化可能会影响一组受试者的 值,而对 的操纵 (称之为 ) 可能会影响另一组受试者的 值。在这种情况下,即使是实验性中介分析也可能产生关于间接影响的误导性推论。
第四,如果 和 的影响在一个样本中因受试者而异,那么估计整个样本的平均直接或间接影响可能会产生误导。为了确定异质性效应是否是一个问题,我们建议检查 和 在不同的受试者组之间的影响。如果这些影响在群体间差别很小,我们就更有信心异质性不会影响分析。另一方面,如果 和 的影响在组间有很大的差异,那么对平均间接影响的估计可能是不准确的,即使它们是来自一个 和 都被操纵的实验。
第五, 对 和 对 的异质性影响导致的问题,可以通过受试者暴露于不同的、实验确定的 和 值。这种设计可以克服异质性问题,因为它们允许测量对每个受试者的间接影响。但是,重复测量的实验设计在社会心理学的许多领域很难执行。
即使它们可以被执行,它们的使用也需要一组可能难以满足的假设,包括对个人的影响不会随时间而改变的假设和影响 和 的每一个操作在下一次操作之前就已经磨损了。然而,让受试者接受反复干预的设计在社会科学中没有得到充分利用,它们有可能讨论异质性治疗效果的问题。
5. 总结
在 Baron 和 Kenny (1986) 出版以来的几十年里,大多数中介分析都是由多方程回归框架指导的,这个框架强加了一些在大多数心理应用中不太可能得到满足的假设。当中介变量与影响结果的未观察到的变量相关的情况下,这种方法错误地陈述了中介变量在因果过程中的作用。
认识到这一局限性,学者们越来越多地推荐对中介进行实验操作。中介的实验方法可以克服未观察到的变量问题,因此,它在原则上是对中介测量方法的一种改进。但它所依赖的假设似乎没有得到充分的重视。
首先,在中介分析中使用的实验操作必须影响一个中介而不影响其他中介; 其次,如果一个实验性干预只影响一个样本中的某些成员,那么间接影响的估计只适用于这些成员,而不是适用于整个样本; 最后,如果处理和中介的影响在样本成员之间有所不同,就不能估计整个样本的平均间接影响。当这些问题出现时,解释直接和间接影响的通常规则就会失效。
这些并发症不能通过纯粹的统计创新来克服。那些进行非实验性中介分析的学者应该明确地证明,被分析的中介变量与其他可能影响结果的变量不相关的假设。实验者应该知道,对 的不同操作可能会导致关于中介的不同结论。因此,他们可以通过以多种方式操纵 来加强他们的结论。
最后,尽管这些论点在统计学家中并不新颖,但社会科学家——比如一些经济学家在很大程度上并不知道它们。近几十年来,人们对中介的兴趣急剧增长,研究人员对中介分析的技术复杂程度也有所进步。然而,论证的质量仍然不够,因为研究人员还没有掌握他们的分析所依赖的一些关键假设。缺乏论证反过来又会导致对设计问题的关注不足。评估中介是一项概念上深刻的、经验上的令人烦恼的任务,那些急于回答中介问题的人似乎低估了因果路径研究所带来的挑战。
6. 相关推文
Note:产生如下推文列表的 Stata 命令为:
lianxh 中介, m
安装最新版lianxh
命令:
ssc install lianxh, replace
专题:IV-GMM Stata:基于IV的因果中介分析-ivmediate 专题:交乘项-调节 medsem-中介效应:基于结构方程模型SEM的中介效应分析-T331 Stata:因果中介分析大比拼-T323 med4way:中介效应和交互效应分析 Stata:调节中介效应检验.md Stata+R:一文读懂中介效应
课程推荐:因果推断实用计量方法
主讲老师:丘嘉平教授
🍓 课程主页:https://gitee.com/lianxh/YGqjp
New! Stata 搜索神器:
lianxh
和songbl
GIF 动图介绍
搜: 推文、数据分享、期刊论文、重现代码 ……
👉 安装:
. ssc install lianxh
. ssc install songbl
👉 使用:
. lianxh DID 倍分法
. songbl all
🍏 关于我们
连享会 ( www.lianxh.cn,推文列表) 由中山大学连玉君老师团队创办,定期分享实证分析经验。 直通车: 👉【**百度一下:**连享会】即可直达连享会主页。亦可进一步添加 「知乎」,「b 站」,「面板数据」,「公开课」 等关键词细化搜索。