查看原文
其他

中介分析: 一份实践者指南, 来自大牛的顶刊文章总结!

计量经济圈 计量经济圈 2022-05-11

凡是搞计量经济的,都关注这个号了

稿件:econometrics666@126.com

所有计量经济圈方法论丛的code程序, 宏微观数据库和各种软件都放在社群里.欢迎到计量经济圈社群交流访问.

关于相关计量方法视频课程,文章,数据和代码,参看 1.面板数据方法免费课程, 文章, 数据和代码全在这里, 优秀学人好好收藏学习!2.双重差分DID方法免费课程, 文章, 数据和代码全在这里, 优秀学人必须收藏学习!3.工具变量IV估计免费课程, 文章, 数据和代码全在这里, 不学习可不要后悔!4.各种匹配方法免费课程, 文章, 数据和代码全在这里, 掌握匹配方法不是梦!5.断点回归RD和合成控制法SCM免费课程, 文章, 数据和代码全在这里, 有必要认真研究学习!6.空间计量免费课程, 文章, 数据和代码全在这里, 空间相关学者注意查收!7.Stata, R和Python视频课程, 文章, 数据和代码全在这里, 真的受用无穷!

正文

关于下方文字内容,作者:宋成校,南京财经大学经济学院,通信邮箱:schengxiao@163.com
推荐:整理了34篇关于中介, 调节和机制分析的文章! 揭开事务间的机理就靠它了! ②重新思考BK中介模型, 关于中介效应分析的神话与事实!
VanderWeele TJ. Mediation Analysis: A Practitioner's Guide. Annu Rev Public Health. 2016;37:17-32. doi:10.1146/annurev-publhealth-032315-021402
This article provides an overview of recent developments in mediation analysis, that is, analyses used to assess the relative magnitude of different pathways and mechanisms by which an exposure may affect an outcome. Traditional approaches to mediation in the biomedical and social sciences are described. Attention is given to the confounding assumptions required for a causal interpretation of direct and indirect effect estimates. Methods from the causal inference literature to conduct mediation in the presence of exposure-mediator interactions, binary outcomes, binary mediators, and case-control study designs are presented. Sensitivity analysis techniques for unmeasured confounding and measurement error are introduced. Discussion is given to extensions to time-to-event outcomes and multiple mediators. Further flexible modeling strategies arising from the precise counterfactual definitions of direct and indirect effects are also described. The focus throughout is on methodology that is easily implementable in practice across a broad range of potential applications.
一、引言
本文介绍了两种传统的中介分析方法,并指出四个基本假设条件。在此基础上,基于现有因果推断文献,阐述了在暴露变量和中介变量的交互作用、二元因变量、二元中介变量的研究中进行中介分析的方法。另外,本文还介绍了敏感性分析技术在中介分析方法中的应用、时间事件与多重中介分析方法、直接和间接效应的反事实定义以及更为灵活的建模方法。
二、中介分析的传统方法
常用的两种传统中介分析方法为:差分法和乘积法(或系数乘积法)。
1.差分法
差分法在流行病学和生物医学中的应用越来越广泛。通过拟合两个回归模型实现。A表示研究关注的暴露变量,M表示中介变量,Y是因变量,C表示线性协变量集合。
第一个回归模型是暴露变量A和协变量C对因变量Y进行回归:

2.乘积法
乘积法(或系数乘积法)在社会科学中使用频率更高。这种方法同样采用两个回归模型。第一个模型是暴露变量、中介变量以及协变量对因变量Y进行回归:

三、 中介分析的假设条件
第一,控制暴露变量和因变量之间的混杂因素(假设A1);第二,控制中介变量和因变量之间的混杂因素(假设A2);第三,控制中介变量和暴露变量的混杂因素(假设A3);第四,中介变量和因变量之间的混杂因素不受暴露变量的影响(假设A4)。中介分析的四个假设条件极其重要,违反这些假设估计结果会存在误差。

从图1中可以想象出前三个假设。这三个假设控制了暴露变量和因变量、中介变量和因变量、暴露变量和中介变量的混杂因素。关于假设4,中介变量和因变量之间的混杂因素不受暴露变量的影响。如图2所示,L既影响中介变量体M,也影响因变量Y,并且本身受到暴露变量A的影响,即假设4被违反。这种情况的处理更为复杂。

四、 暴露变量和中介变量的交互作用
假设模型中包含包括暴露变量与中介变量的交互项,那么模型形式如下:

五、二元因变量与Logistic回归
假设因变量为二元变量,中介变量服从正态分布,利用Logistic回归模型对因变量进行拟合,并加入中介变量与暴露变量的交互项:

六、二元中介变量
1. 假设中介变量是二元变量、因变量为连续变量,并假定模型设定正确且包含交互项:

七、无法衡量的混杂因素敏感性分析
假设A1-A4相当强,在实际应用中很难满足,而敏感性分析是应对这种情况的一种较好的技术。如果假设A1、A3和A4得到满足,而假设A2不成立,并且考虑一种如图3所示的因果结构;同时,假设因变量是二元变量,表示无法衡量的中介变量和因变量之间的混杂因素,令:

这个参数是可以通过以外的途径影响的可能性的最大比率。令:

这个参数比较难解释。如果都影响,那么即使都不影响对方,两者也将存在关联。对于从直觉上来看,在许多情况下之间的关联将小于之间的关联,也小于之间的关联,并且方向相反。这些直觉有助于指定参数的数值。

如果图3表示正确的因果结构,那么这样一个无法衡量的混杂因素可以减少直接效应或增加间接效应的最大比率为:

假设存在图3所示的因果结构,且满足假设A1、A2和A4,那么可以从观测数据中获得直接效应和间接效应的估计值及其置信区间,并将直接效应估计值及其置信区间的两个极限值除以偏差因子,然后将间接效应估计值及其置信区间的两个极限值乘以偏差因子,得到修正后的估计值。
八、 测量误差和分类错误
如果中介变量是二元变量,或者中介变量和因变量都是连续变量,并且不包含暴露变量与中介变量的交互项,可以证明间接效应将偏向于零,直接效应将偏离零。
其他研究已经考虑了在暴露变量或因变量在非差分测量误差的情况下直接和间接效应估计量的偏差。对于连续因变量的非差分测量误差,直接和间接效应都是无偏的,而对于二元因变量,两者都偏向于零。对于暴露变量的非差分测量误差,在没有暴露变量与中介变量交互项的情况下,自然直接效应偏向于零,而间接效应可以偏向任何一个方向。另外,有学者在暴露变量和因变量存在非差分测量误差的情况下,开发了估计直接和间接效应的校正方法。
九、 时间事件的中介分析
中介分析的类似方法也可以用于时间事件的分析。例如,比例风险模型或加速失效时间模型,对连续的或二元中介变量构建线性或Logistic回归模型,通过系数的再次组合,获得直接和间接效应的估计值。对于比例风险模型,乘积法和差分法需要一个罕见结果假设;而使用加速失效时间模型不需要这个假设。对于具有共同结果的比例风险模型,可以使用加权方法。还有学者利用附加风险模型开发中介方法。另外,敏感性分析技术也是可以被利用的。
十、多重中介
有时对多个中介变量采用非正式的方法,一次评估一个中介变量,然后汇总中介变量的影响比例。但是,如果中介变量之间相互影响,这种方法便不适用。即使中介变量之间没有相互影响,如果各种中介变量对因变量的影响之间存在相互作用,这种方法仍然会失效。VanderWeele TJ和Vansteelandt S提出一种基于回归的方法,用于评估暴露变量的影响在多大程度上是由一组完整的中介变量传导的,可以解决上述问题;并且,即使中介变量的顺序未知,也可以使用这种方法。VanderWeele (47, chapter 5)提供了额外的信息和所需的精确假设与方法。
十一、精确的反事实解释

根据假设A1-A4,这些效应是通过上面所示的方法和表达式确定。直接效应只需要假设A1和A2,虽然需要特殊的方法(如边际结构模型和结构嵌套模型),但直接效应也可以被估计,即使暴露变量影响中介变量和因变量之间的混杂因素。在上述模型中没有暴露变量和中介变量交互项的情况下,直接效应等于自然直接效应。另外,直接效应不能用于效应分解或评估特定途径的相关性;但直接效应通常具有更大的政策相关性。
十二、更灵活的模型
如果需要更大的灵活性,Imai等人已经开发了一种基于模拟的方法,这使得研究人员可以为因变量和中介变量指定更灵活的模型,然后通过模拟来估计直接和间接的影响。该方法需要假设A1-A4,但模型构建更为灵活且可以使用R和Stata软件进行分析。
关于中介分析的方法在不断的发展过程中。例如,目前已经开始开发处理时变暴露变量和中介变量问题的方法,但在这方面还要继续深入。现在也可以同时估计中介效应以及交互效应。事实上,一个总的效应可以分解为四个不同的组成部分:仅中介变量带来的效应、仅交互项带来的效应、中介变量与交互项共同产生的效应以及其他因素。新的方法考虑了上述直接效应以及间接效应中有多少是或不是由于相互作用产生的。另外,其他新的方法也将继续发展。
下面这些短链接文章属于合集,可以收藏起来阅读,不然以后都找不到了。

2.5年,计量经济圈近1000篇不重类计量文章,

可直接在公众号菜单栏搜索任何计量相关问题,

Econometrics Circle




数据系列空间矩阵 | 工企数据 | PM2.5 | 市场化指数 | CO2数据 |  夜间灯光 | 官员方言  | 微观数据 | 内部数据计量系列匹配方法 | 内生性 | 工具变量 | DID | 面板数据 | 常用TOOL | 中介调节 | 时间序列 | RDD断点 | 合成控制 | 200篇合辑 | 因果识别 | 社会网络 | 空间DID数据处理Stata | R | Python | 缺失值 | CHIP/ CHNS/CHARLS/CFPS/CGSS等 |干货系列能源环境 | 效率研究 | 空间计量 | 国际经贸 | 计量软件 | 商科研究 | 机器学习 | SSCI | CSSCI | SSCI查询 | 名家经验计量经济圈组织了一个计量社群,有如下特征:热情互助最多前沿趋势最多、社科资料最多、社科数据最多、科研牛人最多、海外名校最多。因此,建议积极进取和有强烈研习激情的中青年学者到社群交流探讨,始终坚信优秀是通过感染优秀而互相成就彼此的。

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存