查看原文
其他

前沿: nature刊掀起DAG热, 不掌握就遭淘汰无疑!因果关系研究的图形工具!

计量经济圈 计量经济圈 2021-10-23

凡是搞计量经济的,都关注这个号了

稿件:econometrics666@126.com

所有计量经济圈方法论丛的code程序, 宏微观数据库和各种软件都放在社群里.欢迎到计量经济圈社群交流访问.

关于因果推断,各位可以参看以下文章:关于各种因果识别方法的120份经典实证文献汇总”,②哈佛大学新修订完成的因果推断经典大作免费下载!附数据和code,③因果推断的统计方法总结, 177份文献政策评估的计量方法综述, 包括最新因果推断方法在教育领域使用IV, RDD, DID, PSM多吗? 使用具体文献,⑥看完顶级期刊文章后, 整理了内生性处理小册子,⑤工具变量精辟解释, 保证你一辈子都忘不了,⑦DID, 合成控制, 匹配, RDD四种方法比较, 适用范围和特征,⑧关于双重差分法DID的32篇精选Articles专辑!关于(模糊)断点回归设计的100篇精选Articles专辑!匹配方法(matching)操作指南, 值得收藏的16篇文章等,⑪MIT广为流传的政策"处理效应"读本,⑫DID的研究动态和政策评估中应用的文献综述,⑬最新政策效应评估的四种方法,⑭政策效应评估的基本问题

关于因果图,我们引荐过用"因果关系图"来进行因果推断的新技能,②因果推断专题:2.因果图,③因果推断专题:4.有向无环图DAG,④confounder与collider啥区别? 混淆 vs 对撞,⑤三张图秒懂, 混淆, 中介, 调节, 对撞, 暴露, 结果和协变量的复杂关系,⑥中介效应检验流程, 示意图公布, 不再畏惧中介分析等等。今天,我们再次引荐一篇较为系统介绍有向无环图(DAG, directed acyclic graph)的文章,毕竟图灵奖得主Jedea Pearl在其书籍《图灵奖得主Pearl的因果推断新科学,Book of Why?》中花很多笔墨强调DAG在因果推断中的重要性。

正文
关于下方文字内容,作者:王双石,西北大学人口、资源与环境经济学通信邮箱:15700799618@163.com
有向无环图(DAG, directed acyclic graph)是一种图像化的分析工具,其可以帮助我们表示和更好地理解因果推断中的“暴露(exposure),结果(outcome),因果关系(causation),混杂(confounding)和偏误(bias)”等核心概念。这篇文章利用临床医学的案例,利用DAG的语言构建分析框架并阐述DAG 的潜在应用。作者在本文中展示了DAG如何有效识别“混杂”和“偏误”、论述对于假定偏误的不合理的调整等问题。对于DAG方法的学习可以帮助研究者更好地设计研究,从而理清真实的因果关系。
文章主要分为三个部分对DAG的研究进行综述:第一部分即引言,对DAG方法做一简要的介绍;第二部分讨论了如何建立和解释DAG,并通过实例来说明DAG如何纠正因果推断中存在的混杂和偏误情况;第三部分指出DAG的局限性。

第一部分

有向无环图(DAG, directed acyclic graphs)是一种简单的图像化的分析工具,可用来表示、联系和理解相关性的关键概念,尤其有助于描述和理解“暴露——结果”关系中的混杂因素和潜在的偏误来源。其中偏误指“暴露”与“结果”关系的不正确的解释。偏误不同于随机误差(random bias),因果关系中的偏误是在重复实验或增加样本量的情况下都不会消除的偏差。混杂和偏误都会在很多方面扭曲研究中的因果解释。如果研究者没有意识到混杂因素,并且没有对它们进行适当的控制,那么在没有因果关系的情况下,变量间的因果关系将会出现问题,或者这种关系的大小可能会被扭曲。相反,如果研究人员将与暴露和结果相关的变量视为混杂因素,而实际上它们并不是,并对它们进行不恰当的控制,这也可能导致偏误。

第二部分

1. DAG的建立和解释
多年来,从遗传学到社会学,众多领域都使用图表来表示因果关系。然而近些年来,流行病学文献中涉及DAG方法的文献增多,这些文献中概述了一套标准的术语和规则。在DAG中,因果关系由变量之间的有向箭头表示(箭头由因指向果)。DAG遵循两条基本准则:第一DAG是非循环的。这意味着不可能从DAG中的任何变量开始,沿着定向箭头所指方向,最后到达初始的变量。换句话说,DAG不能包含一个由变量引起自身的反馈循环。由此得出一个推论:两个变量之间的因果关系必须是单向的,变量之间不能相互导致。第二,要完成DAG,必须包含DAG中任何两个变量的共享原因。在DAG中,两个变量可以通过它们之间所谓的“路径(path)”连接起来。开放的“路径”表示两个变量之间的统计关联;封闭的“路径”代表了这种关联的缺失。变量和箭头可以组合成以下三种主要的路径类型:
(1) 定向路径(directed paths):所有的箭头指向同一个方向,这些变量之间的联系反映了因果关系。这样的道路是开放的。屏幕使用时间的增加直接导致体育活动的减少,而体育活动减少又会增加肥胖的风险(如图fig.1 b)。
(2) 后门路径(backdoor paths): 此种路径反映了两个变量存在共同的原因。从图fig.1 c可以看出,父母受教育水平低会导致儿童屏幕使用时间增加和儿童时期的肥胖。在DAG的术语中,屏幕使用时间和儿童肥胖被认为是通过父母教育的后门途径联系在一起的。这条路径是开放的,并通过父母受教育水平描述了屏幕时间和肥胖之间的统计关联。然而,通过这种后门途径传播的关联是非因果的,这就出现了混杂。
(3) 关闭(或阻塞)路径(closed paths or blocked path):此时两个变量具有相同的效果,称为碰撞器(collider)。如图fig.1 d所示,屏幕时间和肥胖都被发现会增加青少年的自卑、自残和产生自杀想法的风险,也就是说自残是体育活动和肥胖之间的碰撞。在这种情况下,这条路径是封闭的(屏幕时间和通过自残传播的肥胖之间没有联系)。
研究者可以通过条件作用或控制一个变量,将路径的状态从开放状态变为封闭状态,反之亦然。该变量可以通过研究设计或统计调整(如限制、分层、匹配、标准化或多元回归)来实现。在本文的例子中,控制父母的教育(一个混杂因素)将关闭这条后门路径,并在屏幕时间和肥胖之间的定向路径上导致较少的偏误关系。相反,在两个变量(中介)之间的有向路径中对一个变量进行条件作用(在本文的示例中为体育活动)会关闭这条路径,这可能导致对于变量间真实关系的错误估计。最后,条件作用于一个封闭路径中的变量(一个碰撞器)会打开这条路径并导致非因果关联。如果我们错误地将自残定义为一种混杂因素,并条件作用与它,这将扭曲暴露与结果之间的真实关系。同样,如果一项研究调查了一组青少年的屏幕使用时间和肥胖之间的关系,这一组青少年均有自残史,这将再次表现为条件作用于碰撞器。
2. 利用DAG理解混杂因素——以扑热息痛和喘鸣为例
在DAG的分析语言中,混杂是指暴露和结果之间的共同原因,它是自然存在的而不是由于研究者的影响所导致的。混杂因素如果不被识别和有效的调整,其将会扭曲因果关系。下面以扑热息痛和喘鸣的关系为例说明:
一系列的研究表明在出生第一年服用扑热息痛和后期罹患喘鸣或哮喘有联系,本文利用DAG的方法验证这种因果关系。
事实上,后期喘息风险的增加可能不是由于扑热息痛,而是由于混杂。病毒性呼吸道感染在儿童中很常见,会引发喘息,而这种感染常用扑热息痛类药物治疗,并可能增加日后喘鸣的风险。也就是说,在扑热息痛的使用和喘鸣之间的关系中,病毒感染扮演了混杂的角色(如图fig.2 a)。因此,我们可能判定这两个变量(扑热息痛的使用和喘鸣)是统计上有因果关系。为了确定扑热息痛的使用和后来喘息之间的真正因果关系,我们应该关注病毒感染。一旦我们通过适当的统计调整关闭这个后门路径,并假设没有其他混杂因素存在,我们应该能够识别扑热息痛和喘鸣之间关系的真正的大小。按照此种方法的逻辑进行的研究发现,早期呼吸道感染与后来喘息之间的因果关系减弱,这表明这一因果关系中确实存在混杂因素。
3. 不合理调整的风险:过度调整
未能识别混杂因素可能威胁到研究结果的有效性,相反地,不恰当地将其他变量识别为混杂因素也可能是有问题的。以产前类固醇的使用与支气管肺发育不良(BPD)的结果之间的关系为例。许多研究发现,尽管减少了一些已知的增加罹患BPD风险的因素,但产前服用类固醇与降低患BPD风险无关。这些研究调整了一些变量,如新生儿疾病的严重程度和机械通风设备的使用,其基本原理是这些因素与产前类固醇的使用和增加BPD的风险相关。
然而,这些变量不符合混杂因素的定义(它们不是暴露和结果的原因),而是作为暴露(产前类固醇)和结果(BPD)之间的中介因素(如图fig.3 b)。对中介因素的调节关闭了产前类固醇和BPD之间的一条因果路径,并扭曲了两者之间的整体关系。这在图fig.3 c中表示为两个矩形。对中间产物进行调整会导致过度调整。通过这一过程,消除了通过减少严重疾病或减少机械通风设备的中介作用而导致的的产前类固醇和BPD之间的部分联系。这种调整可以减弱暴露的真正因果效应,甚至逆转结果,导致反直觉的结果。
一系列研究发现,产前类固醇给药与介质(新生儿疾病的严重程度和机械通气的需要)之间呈负相关,而介质与BPD的风险呈正相关。研究者发现当中间因素没有被调整时类固醇对BPD有保护作用,但当它们被调整时则没有(如图fig.3 c)。也就是说,对介质的不适当调节导致了产前类固醇与罹患BPD风险之间的真实关系的扭曲。
4. DAG分析中的选择偏误
在观察性或介入性研究中,当暴露和结果同时影响一个因素是否被纳入分析时,就会出现选择偏差。在DAG分析中,选择偏差是由于对碰撞机上进行不适当的条件作用而产生的。例如,将HLA亚型作为急性淋巴细胞白血病(ALL)发生的原因。最开始的横断面研究发现,在HLA-A2血清型的个体中,所有病例的发病风险均有所增加(如图fig.4 a)。
然而,随后的一项研究对新诊断的患有急性淋巴细胞白血病患者进行了验证,发现这些患者中HLA-A2出现的概率与一般人群相同。在对幸存者进行分型检查时,他们发现HLA-A2出现的概率高于一般人群,而且存活时间似乎与HLA-A2血清型有关。也就是说,HLA-A2并没有增加急性淋巴细胞白血病的患病风险,而是增加了生存的可能性。这是因为之前的研究检验的已经确诊患有急性淋巴细胞白血病者,而不是新诊断的患有急性淋巴细胞白血病患者,即他们检查了HLA-A2和白血病样本之间的关系仅限于幸存者。这说明了之前关于暴露与结果之间错误推断。
这种偏差的来源,被称为Neyman’s偏差,可以被看作是对碰撞机施加条件作用的结果。在这种情况下,暴露和结果都会影响第三个变量,即存活(如图fig.4 b)。如果我们考虑所有的病人,那么这两个变量是没有关联的(路径是封闭的)。条件作用于存活者这一因素,使之成为开放路径,从而增大了所有急性淋巴细胞白血病患者中HLA-A2个体的样本,创建了一种虚假的关联。

第三部分

作者总结了DAG的部分局限性:
第一是其非参数性质:DAG既不指定因果关系的形式,也不描述关联程度的大小,是定性的分析工具。在DAG分析中,不加控制的混淆因素可能会使结果产生偏差,但并没有对此偏差进行定量测度。
第二是DAG只有在背景信息完备时才是有效的:DAG良好的解释力只有当它包含任何两个变量的所有混杂因素时,它才有一个因果解释。
第三个限制是DAG无法描述随机误差。例如,在理想情况下,随机化将已知的和未知的混杂因素平均分配给各组,这在真实世界的随机对照试验中并不总是发生,由于随机差异,混淆可能发生,但是DAG中没有显示出来。
第四,任何图形化方法都可能过度简化研究的复杂现实对象。这是这个原因,DAG方法招致了许多批评,因为DAG方法可能导致因果推理领域的过度简化。然而,DAG本身并不会导致过分简化的分析,只要明确地提出了他们的基本假设。同时还有一些理论观点仍然存在争议,比如选择偏差和混淆之间的确切区别。

Reference: Williams, T.C., Bach, C.C., Matthiesen, N.B. et al. Directed acyclic graphs: a tool for causal studies in paediatrics. Pediatr Res 84, 487–493 (2018). https://doi.org/10.1038/s41390-018-0071-3

下面这些短链接文章属于合集,可以收藏起来阅读,不然以后都找不到了。

2.5年,计量经济圈近1000篇不重类计量文章,

可直接在公众号菜单栏搜索任何计量相关问题,

Econometrics Circle




数据系列空间矩阵 | 工企数据 | PM2.5 | 市场化指数 | CO2数据 |  夜间灯光 | 官员方言  | 微观数据 | 内部数据计量系列匹配方法 | 内生性 | 工具变量 | DID | 面板数据 | 常用TOOL | 中介调节 | 时间序列 | RDD断点 | 合成控制 | 200篇合辑 | 因果识别 | 社会网络 | 空间DID数据处理Stata | R | Python | 缺失值 | CHIP/ CHNS/CHARLS/CFPS/CGSS等 |干货系列能源环境 | 效率研究 | 空间计量 | 国际经贸 | 计量软件 | 商科研究 | 机器学习 | SSCI | CSSCI | SSCI查询 | 名家经验计量经济圈组织了一个计量社群,有如下特征:热情互助最多前沿趋势最多、社科资料最多、社科数据最多、科研牛人最多、海外名校最多。因此,建议积极进取和有强烈研习激情的中青年学者到社群交流探讨,始终坚信优秀是通过感染优秀而互相成就彼此的。

: . Video Mini Program Like ,轻点两下取消赞 Wow ,轻点两下取消在看

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存