因果推断:现代统计的思想飞跃
导语
探求事物的原因,是人类永恒的精神活动之一。从古希腊的哲学到中国先秦的诗歌,都充满了对原因的追问和对因果关系的思考。本文将回顾统计因果推断的历史背景,评述中国因果推断研究的现状,并且大胆推测它未来的发展前景。
集智俱乐部联合智源社区,于2021年3月到7月组织了因果科学系列读书会第二季,从基础和实操角度出发,精读两本因果科学教材,研讨因果科学前沿文献。因果科学读书会持续开放报名中,目前已有超过600位国内外学者加入,详情见文末。
1. 引言
1. 引言
2. 哲学基础:因果推断何以成为可能?
2. 哲学基础:因果推断何以成为可能?
人们常常问关于原因和结果的问题。比如,某人死于肺癌,是不是因为他常常吸烟导致的?比如,我感冒症状减轻了,是不是因为服用了维生素 C 片导致的?比如,大学教育是否能够提高收入水平?类似的问题,充满了我们的日常生活。
大部分西方哲学家都认为因果关系是一条本质的、似乎毋庸置疑的定律。但是,苏格兰哲学家大卫•休谟(David Hume, 1711-1776)曾经抛出了一条惊人的论点。简言之,他认为人类仅仅凭经验,只能认识事物之间恒定的前后相继关系(constant conjunction),并不能认识任何因果关系。很多哲学家都努力回应休谟的质疑,因为若是承认休谟是对的,那么知识何以成为可能?若人类的知识仅仅是经验性的前后相继关系,那么人类似乎没有拥有任何“心智的荣耀”[2]。
3. 统计学中“哥白尼式的革命”:
内曼的“潜在结果”模型
3. 统计学中“哥白尼式的革命”:
内曼的“潜在结果”模型
一个显而易见的估计量是
4. 统计学的拓荒者:
鲁宾关于观察性研究中的因果推断的研究
4. 统计学的拓荒者:
鲁宾关于观察性研究中的因果推断的研究
虽然潜在结果模型成功地数学化了随机化实验中的因果推断,但是它长期并未用于观察性研究——内曼本人是持怀疑态度的,因为缺乏随机化,观察性研究有太多复杂性,比如抽烟的人和不抽烟的人,可能就是两群完全不同的人,不具有可比性。虽然他从未尝试用他的潜在结果模型分析观察性数据,但是他间接地启发了一些更加有冒险精神的学者。其中一人就是鲁宾[6]。
图4 鲁宾教授正在作报告(截屏自https://www.youtube.com/watch?v=N4tQC3elGK4)
: 个体 吸烟与否的指示变量; : 个体 是否得肺癌的指示变量; : 个体 的年龄、性别、教育、收入、家庭病史等等,统计学中称它们为协变量(covariates)。
Rosenbaum 和鲁宾的这篇文章是 Biometrika 这个杂志创刊以来引用率最高的两篇文章之一[7]。在它发表后的三十多年里,引起了很多理论统计学家和应用统计学家的兴趣,他们提出了很多推广的、更加精致的理论和方法,这些理论和方法被用在流行病学、经济学、政治科学等诸多学科的研究中。
图5 费希尔否定吸烟导致肺癌
5. 人工智能的“因果革命”:珀尔对图模型的因果解释
5. 人工智能的“因果革命”:珀尔对图模型的因果解释
图6 一个 DAG 的例子
5.1 后门准则
5.2 前门准则
图7 珀尔和他的畅销书《为什么》
图片来自:https://momentmag.com/author-interview-judea- pearl/
6. 中国因果推断的研究
6. 中国因果推断的研究
从古希腊开始,西方的哲学家似乎就钟情于因果关系的讨论。这种传统一直流传至今。爱因斯坦曾说,西方科学的发展以两个伟大的成就为基础:一是希腊哲学家发明的形式逻辑体系,二是通过系统的实验寻找因果关系。前者集中体现在欧几里得几何学中,后者肇始于文艺复兴时期,以伽利略为代表。
图8 屈原的《天问》反映了中国古人对自然和历史的好奇心(图片来网络)
图9 学术界的“四世同堂”:耿直(右二)、学生郭建华(左二,东北师范大学副校长),学生的学生朱文圣(右一,东北师范大学数学与统计学院副院长),学生的学生的学生王鹏飞(左一,东北财经大学讲师)
6.1 混杂因素
6.2 替代指标悖论和准则、统计和因果关系的传递性
图10替代指标悖论的图模型。此图表示一个随机化实验中,“吃药与否”是随机化的,所以和“未观测的变量”都独立,但是这些“未观测的变量”可能同时影响“替代指标”和“终点指标”。即使“吃药与否”对“终点指标”没有直接的影响,替代指标悖论也会发生:“吃药与否”对“替代指标”有正作用,“替代指标”对“终点指标”有正作用,但是“吃药与否”对“终点指标”的作用却是负的。这个悖论类似于前面提到的 Yule-Simpson 悖论, 它的关键是存在“未观测的变量”同时影响“替代指标”和“终点指标”。如果“吃药与否”对“终点指标”有直接的影响,那情况则更复杂,悖论更加不可以避免。注意,这个图和前面提到的“前门准则”有本质的不同。
6.3 因果图的结构探索
如上面所述,珀尔关于因果作用可识别性的理论依赖一个完整已知的图模型。一个更有挑战性的问题是:如何从数据中学习未知的图模型?耿直提出了分解和局部学习的方法,化繁为简, 有针对性地构建图模型。在数据不能完全确定变量间因果图结构的情况下,他提出了一种实验设计的方法,干预最少的变量,将相关关系的图转变为因果关系的图。这对科学研究中的实验,有指导意义。这一系列文章发表在机器学习领域的顶级期刊 Journal of Machine Learning Research 上[18]。
7. 统计因果推断的未来
7. 统计因果推断的未来
虽然因果推断已经有了一些基础性工作,但是这些工作还不足以回应现实世界向我们发出的挑战。理论上,目前的研究范式还不能完美地应对复杂的实际工作需要。一些学者考虑了因果推断和微分方程的关系,但是这方面的研究还在草创阶段。不管是鲁宾还是珀尔的范式,对于有反馈的因果系统, 都有致命的缺陷,这也是值得思考的问题。另外,现有的工作大多数都是在评估某个给定的原因对某个给定的结果的作用,而科学研究的本质是探索未知的原因。虽然因果图的结构学习对探索原因有帮助,但是这方面的理论还不够丰富。因果推断对整个思想界都有更深刻的意义,它是一种独特的思辨方式,很多层面上是传统的数学和概率论所不具备的。更广地来说,研究因果推断,对于丰富我们的精神世界,大有裨益。
作者简介
丁鹏,2004 年至 2011 年在北京大学数学科学学院获得本科和硕士学位,2015 年获哈佛大学统计学博士学位,2016 年起任教于加州大学伯克利分校统计系,2021 年晋升为副教授。其主要研究方向是因果推断。
注释
1.A. Gelman and A. Vehtari, What are the most important statistical ideas of the past 50 years? 见https://arxiv.org/abs/2012.00174。第一作者曾获得年轻统计学家的最高奖 COPSS 奖章。
2.“[T]he sole end of science is the honor of the human mind.” —— Carl Jacobi(卡尔• 雅可比)
3.内曼的论文是用波兰语写成的。1990 年,D. M. Dabrowska 和 T. P. Speed 将论文翻译成英文,题目是On the Applications of the Theory of Probability to Agricultural Experiments,发表于 Statistical Science。潜在结果的基本想法也许在历史中早就产生了,但是将它数学化、且正式地用于统计学,内曼的文章是首次。内曼是现代统计学的奠基人之一,他对假设检验、置信区间、抽样调查和实验设计等领域的研究,成为现代统计学的标准范式。我国概率论和数理统计学的先驱许宝騄教授是内曼在英国指导的学生之一。
4.这方面的文献综述是:Li, X. and Ding, P. (2017). General forms of finite population central limit theorems with applications to causal inference. Journal of the American Statistical Association,112, 1759-1769。
5.见内曼的传记:C. Reid (1982), Neyman - From Life。注意,哥白尼和内曼都是波兰人。
6.另外一位受内曼影响的是计量经济学家 Trygve Haavelmo。他是在计量经济学中讨论因果推断的先驱。他曾在1989 年诺贝尔经济学奖的获奖感言中谈及内曼对他的影响: https://www.nobelprize.org/prizes/economic-sciences/1989/haavelmo/facts/。
7.文章是 Rosenbaum and Rubin (1983) The central role of the propensity score in observational studies for causal effects, Biometrika, 70, 41-55。在纪念 Biometrika 第一百期的时候,这篇文章的引用数在该杂志排名第二;参看 Titterington (2013) Biometrika highlights from volume 28 onwards, Biometrika, 100, 17-73。截至写作本文的时候,Google Scholar 显示这篇文章已经被引用了28392 次,已经超越了之前引用最高的文章 Liang and Zeger (1986) Longitudinal data analysis using generalized linear models, Biometrika, 73, 13–22(Google Scholar 显示引用了18345 次)。这种改变,反映了近十年来,因果推断的研究在学术界的极端活跃性。另外,Biometrika 创刊于 1901 年,是最早的理论统计杂志之一。
8.第一本是 Rubin (2006) Matched Sampling for Causal Effects。第二本是 Imbens and Rubin (2016) Causal Inference for Statistics, Social, and Biomedical Sciences: An Introduction。两书均由剑桥大学出版社出版。
9.比如 A. P. Dempster 就用一个无向图来表示联合正态分布中的条件独立性:给定其他变量,如果两个变量条件独立, 那么他们之间的边不存在。他的文章是: Dempster, A.P. (1972) Covariance selection. Biometrics, 157-175。
10.珀尔的开创性文章是:Pearl (1995) Causal diagrams for empirical research. Biometrika, 82, 669-688.他的专著是:Pearl (2009) Causality: Models, Reasoning and Inference, 剑桥大学出版社。
11.此书英文原名是 A System of Logic,直接翻译过来是《一个逻辑体系》,严复先生认为“逻辑学”就是中国的“名学”, 这一学派兴起于先秦,代表人物有公孙龙等。这本书在英语世界产生过很深远的影响,其中五条“穆勒方法”总结了归纳推理中,获得因果知识的一些准则。严复先生是北京大学从“京师大学堂”更名后的第一任校长,也曾任复旦大学校长。
12.原书这章的题目是“On observation and experiment”。按照现在的习惯,“experiment”统一翻译成“实验”。前面用到的“临床试验”对应着“clinical trial”。“实验”和“试验”的意思似乎差别不大;中文英文皆如此。
13.Geng (1992) pp. 585-593; Geng and Asano (1993), pp. 741–747; Guo and Geng (1995), pp. 263-267; Geng, Guo and Fung (2002), pp. 3-15; Ma, Xie and Geng (2006), pp. 127-133。3.
14.Prentice 曾获得年轻统计学家的最高奖 COPSS 奖章,终身成就奖“费希尔讲座”,他是美国医学院院士。鲁宾是因果推断的奠基人之一,曾获得终身成就奖“费希尔讲座”,美国科学院院士。Lauritzen 是英国皇家学会院士。
15.Chen, Geng and Jia (2007), pp. 911-932; Ju and Geng (2010), pp. 129-142; Jiang, Ding and Geng (2016) pp. 829-848。
16.文章是 VanderWeele (2013) Surrogate measures and consistent surrogates. Biomet69, 561-565。VanderWeele 曾获COPSS 奖章。
17.https://terrytao.wordpress.com/2014/06/05/when-is-correlation-transitive/
18.Xie and Geng (2008), pp. 459-483; Ma, Xie and Geng (2008), pp. 2847-2880; He and Geng (2008), pp. 2523-2547; Liu et al. (2020)。
19.本希奥的文章 Towards Causal Representation Learning 出现在 https://arxiv.org/abs/2102.11107。
(注释可上下滑动查看)
欢迎加入因果科学社区
欢迎加入因果科学社区
目前因果科学读书会(即因果科学社区),已经有超过600位海内外相关科研工作者以及互联网一线从业人员参与,如果你也对这个主题感兴趣,想要深度地参与,就快加入我们吧!
点击“阅读原文”,即可报名读书会