什么是鲁宾因果框架 | 集智百科
本词条由集智俱乐部众包生产,难免存在纰漏和问题,欢迎大家留言反馈或者前往对应的百科词条页面进行修改,一经修改,可以获得对应的积分奖励噢!
目录
介绍
鲁宾因果模型是基于潜在结果的想法。例如,如果一个人上过大学,他在 40 岁时会有特定的收入,而如果他没有上过大学,他在 40 岁时会有不同的收入。为了衡量这个人上大学的因果效应,我们需要比较同一个人在两种不同的未来中的结果。由于不可能同时看到两种潜在结果,因此总是缺少其中一种潜在结果。这种困境就是“因果推理的基本问题”。
由于因果推理的根本问题,无法直接观察到单元级别的因果效应。然而,随机实验允许估计人口水平的因果效应。随机实验将人们随机分配到对照组:大学或非大学。由于这种随机分配,各组(平均)相等,40 岁时的收入差异可归因于大学分配,因为这是各组之间的唯一差异。然后可以通过计算处理(上大学)和对照(非上大学)样本之间的平均值差异来获得平均因果效应(也称为平均处理效应)的估计值。
然而,在许多情况下,由于伦理或实际问题,随机实验是不可能的。在这种情况下,存在非随机分配机制。上大学的例子就是这种情况:人们不是随机分配上大学的。相反,人们可能会根据他们的经济状况、父母的教育等来选择上大学。已经开发了许多用于因果推断的统计方法,例如倾向得分匹配。这些方法试图通过寻找类似于处理单元的控制单元来纠正分配机制。
一个扩展案例
鲁宾定义了一个因果效应:
考虑更大的患者样本:
为了使潜在结果有意义,它必须是可能的,至少是先验已知可能的。例如,如果乔在任何情况下都无法获得新药,那么Yt(u)对他来说是不可能的。它永远不会发生。而如果Yt(u)永远无法观察到(即使在理论上),那么对乔的血压的因果效应是不确定的。
没有操纵就没有因果关系
如果永远不可能发生其中一种潜在结果,那么这种因果效应的定义就会变得更加棘手。例如,乔的身高对他的体重有什么因果关系?这似乎与我们的其他示例相似。我们只需要比较两个潜在的结果:Joe 在处理下的体重(处理被定义为高3英寸)和 Joe 在控制下的体重(控制被定义为他当前的身高)。
问题在于:我们无法增加乔的身高。没有办法观察如果乔更高,他的体重会是多少,因为没有办法让他更高。我们无法操纵乔的身高,因此调查身高对体重的因果关系毫无意义。因此有一个口号:没有操纵就没有因果关系。
稳定单元处理值假设 (SUTVA)
在我们的例子中,Joe 的血压不应该取决于 Mary 是否接受了药物。但如果真的发生了呢?假设乔和玛丽住在同一所房子里,玛丽总是做饭。这种药物会导致玛丽渴望咸的食物,所以如果她服用这种药物,她会用比其他情况下更多的盐来烹饪。高盐饮食会增加乔的血压。因此,他的结果将取决于他接受的处理和玛丽接受的处理。
在不满足SUTVA的情况下,因果推断会更加困难。我们可以通过考虑更多的处理来解释相关的观察结果。我们通过考虑 Mary 是否接受处理来创建 4 个处理。
通过以这种方式考虑更多潜在结果,我们可以使SUTVA成立。但是,如果 Joe 以外的任何单位都依赖于 Mary,那么我们必须考虑进一步的潜在结果。依赖单位的数量越多,我们必须考虑的潜在结果就越多,计算也变得越复杂(考虑对不同的20个人进行的实验,每个人的处理状态都会影响其他人的结果)。为了(轻松)估计单一处理相对于对照的因果效应,SUTVA 应该成立。
平均因果效应 Average Causal Effect(ACE)
我们如何测量反馈效应会影响我们得出的推论。假设我们以百分比变化而不是绝对值来测量血压的变化。然后,根据确切的数字,平均因果效应可能是血压升高。例如,假设乔治的血压在控制下为 154,在处理后为 140。因果效应的绝对大小为 -14,但百分比差异(就 140 的处理水平而言)为 -10%。如果莎拉的血压在治疗下为 200,在控制下为 184,那么因果效应的绝对值是 16,而治疗值是 8%。乔治的血压绝对变化较小(-14 对 16)会产生较大的百分比变化(-10% 对 8%)。
因果推理的基本问题
假设我们有以下数据:
分配机制
假设这个数据是真实的:
或者,假设该机制将处理分配给所有男性且仅分配给他们。
完美医生机制 Perfect Doctor Mechanism
基于这些知识,她将进行以下处理分配:
结论
Rubin 因果模型还与工具变量(Angrist、Imbens 和 Rubin,1996 年)和其他因果推断技术相关联。有关 Rubin 因果模型、结构方程建模和其他因果推断统计方法之间联系的更多信息,请参见 Morgan 和 Winship (2007)。
编者推荐
文章推荐:Donald Rubin的因果推断学术贡献:超出统计学范畴的划时代影响
2021年10月11日,Joshua D. Angrist和Guido W. Imbens因“对因果关系分析的方法学贡献”而获得2021年诺贝尔经济学奖。Angrist和Imbens最为知名的工作是其在20世纪90年代将工具变量引入了潜在结果框架,该框架也被称为Rubin因果模型,即本词条介绍内容。这篇文章梳理了Rubin在因果推断方面的主要学术贡献。
Donald B. Rubin教授是美国国家科学院院士,美国科学与艺术学院院士,曾任哈佛大学统计系John L. Loeb讲席教授,现任清华大学丘成桐数学科学中心教授。他获得过统计学领域几乎所有著名奖项,包括著名的 Wilks奖章、Parzen奖、Snedecor奖等,是当今世界最具影响力的统计学泰斗。他对科学的贡献已超出统计学范畴,其统计思想对生物医学、经济学、心理学、教育学、社会学及计算机科学等众多领域产生了划时代的影响,谷歌学术显示其文章和著作引用量已超过35万次。
因果科学读书会第三季启动
“因果”并不是一个新概念,而是一个已经在多个学科中使用了数十年的分析技术。通过前两季的分享,我们主要梳理了因果科学在计算机领域的前沿进展。如要融会贯通,我们需要回顾数十年来在社会学、经济学、医学、生物学等多个领域中,都是使用了什么样的因果模型、以什么样的范式、解决了什么样的问题。我们还要尝试进行对比和创新,看能否以现在的眼光,用其他的模型,为这些研究提供新的解决思路。
由智源社区、集智俱乐部联合举办的因果科学与Causal AI读书会第三季,将主要面向两类人群:如果你从事计算机相关方向研究,希望为不同领域引入新的计算方法,通过大数据、新算法得到新成果,可以通过读书会各个领域的核心因果问题介绍和论文推荐快速入手;如果你从事其他理工科或人文社科领域研究,也可以通过所属领域的因果研究综述介绍和研讨已有工作的示例代码,在自己的研究中快速开始尝试部署结合因果的算法。
第三季因果科学与Causal AI读书会从2021年10月24日开始,每周日上午 10:00-12:00举办。共11-12期,每周一期。持续时间预计 2-3 个月。
报名:(长期有效)
扫码报名
第一步:扫码填写报名信息。
第二步:信息填写之后,进入付款流程,提交保证金299元。(符合退费条件后可退费。)
第三步:添加负责人微信,拉入对应的读书会讨论群。
详情请见:
因果+X:解决多学科领域的因果问题 | 因果科学读书会第三季启动
百科项目志愿者招募
在这里从复杂性知识出发与伙伴同行,同时我们希望有更多志愿者加入这个团队,使百科词条内容得到扩充,并为每位志愿者提供相应奖励与资源,建立个人主页与贡献记录,使其能够继续探索复杂世界。
如果你有意参与更加系统精细的分工,扫描二维码填写报名表,我们期待你的加入!
来源:集智百科
编辑:王建萍
点击“阅读原文”,阅读词条鲁宾因果框架原文与参考文献