学术前沿丨机器学习能成为因果推断的“圣杯”吗？

数据Seminar 2021-06-03

The following article is from 经济政策模拟 Author Master22

因果推断的圣杯

“

在反事实因果的框架之下，基于调查数据的社会学定量分析要进行因果推断，难度极大。其主要原因在于，社会学家一旦要证明某个他们所感兴趣的“因”会带来一定的“果”，就必须面对一个永恒挑战: “内生性”问题( endogeneity) 。也即: 如果某个潜在的、无法观测的干扰项，既影响“因”，又影响“果”，那么，利用最小二乘法模型( 简称 OLS 模型) 进行回归分析所得到的估计量就会是有偏误的，而不具有因果推断力。

解决内生性问题的常见方法，主要包括工具变量( instrumental variable，简称IV)、固定效应模型( fixed effects model，简称FE)、倾向值匹配( propensity score matching，简称 PSM)、实验以及准实验( experimentsand quasi-experiments)等等。

在反事实因果分析框架下，实验或准实验方法最切近要义。但社会科学的很多研究主题和领域决定了无法使用实验方法，而其他方法也都具有较大的局限性。如固定效应模型只能消除时间固定的干扰项，倾向值匹配方法则完全依赖于“可观测因素被忽略”的假说。相比较而言，对基于调查数据的定量分析，工具变量方法具有独特优势。不过，工具变量方法在社会学分析中的运用，目前却远远不如它在计量经济学和政治学定量分析中那么广受青睐。

——陈云松.逻辑、想象和诠释: 工具变量在社会科学因果推断中的应用[J].社会学研究,2012(6):192-216.

”

陈云松老师认为：何以说工具变量是定量分析中因果推断的“圣杯”?这是因为，好的工具变量非常难以寻觅，寻找它的逻辑和数据挖掘过程充满艰辛、难以驾驭，甚至往往需要研究者的灵感。但它在模型上的简洁性，它对社会科学想象力、逻辑力和诠释力的要求，既为定量分析提供了因果推断的重要武器，也让分析的过程充满趣味和奇思妙想。

但是根据Susan的研究，IV其实还很弱，ML更应该成为因果推断的圣杯。（关于“Susan是谁”这个问题，小编先打个谜，往下看你就知道了~）

下面推送其一篇力作：估计异质性因果效应的机器学习方法

原文信息：Athey S, Imbens G W. Machine learningmethods for estimating heterogeneous causal effects[J]. stat, 2015, 1050(5).

摘要 本文研究了在实验或观察性研究中, 估计异质性因果效应的问题，并对处理效应的差异大小进行推断。提供了一种数据驱动方法，来确定哪些亚群具有较大或较小的处理效应，并检验关于这些效果差异的假设。实验方法允许研究人员，识别处理效应的异质性，这些处理效应并不是预先分析计划中指定的，不用担心由于多次测试而导致的无效推断。在大多数关于监督机器学习的文献中(例如回归树、随机森林、LASSO等)，目标是建立一个单元属性与观察结果之间关系的模型。交叉验证在这些方法中扮演着重要的角色，它将预测结果与测试样本中的实际结果进行比较，以选择模型的复杂程度，从而提供最优的预测能力。本文的方法是密切相关的，但它的不同之处在于，它是为预测处理的因果效应而定制的，而不是为预测单位结果。挑战在于，因果效应的“基本事实”，并不适用于任何一个独立单位:我们观察处理的单位样本，或没有处理的单位样本，但不是同时观察两者。因此如何使用交叉验证，来确定因果关系是否已被准确预测，还不是很明显。针对这一问题，本文提出了几种新的交叉验证准则，并通过模拟证明了这些准则在处理因果关系问题时，优于标准方法的条件。然后将该方法应用于大规模的现场试验，并基于一个搜索机制，来重新排列结果。

关键词 潜在结果，异质性处理效应，因果推断，监督机器学习，交叉验证

机器学习推断异质性因果效应

在本文中，研究了两个密切相关的问题: 第一，通过实验或观察性研究中的因果效应特征来估计异质性; 第二，对总体中不同子样本集处理效应的差异大小进行推断。Rubin因果模型(Rubin，1976,1978;Imbens和Rubin, 2015)或本文使用的潜在结果框架中的因果效应，是在不同区制(regime)观察到的结果与不同处理(treatment)下反事实结果之间的比较。本文导入的方法，提供了数据驱动方法来选择具有不同平均处理效果的亚群体，并检验不同亚群体中处理效果差异的假设。为了进行实验，本文的方法允许研究人员识别处理效果的异质性，这些处理效果在预先分析计划中没有设定，因此不用考虑由于多重检验而导致的无效推断。

本文方法是为应用而量身定制的，这里相对于观察到的单元数量，一个单元具有许多属性，并且处理效应和单元属性之间关系的函数形式未知。本文从监督机器学习来构建方法(参见Hastie、Tibshirani和Friedman(2011)的综述)。这篇文献提供了多种非常有效的方法来接近相关问题，这个问题是在相似环境中，将预测结果作为协变量的函数。最流行的方法(例如回归树、随机森林、LASSO、支持向量机等)，需要构建属性和结果之间的关系模型，并使用惩罚参数来惩罚模型的复杂性。为了选择复杂性的最优水平(即在没有“过度拟合”的情况下，最大化预测能力)，这些方法依赖于交叉验证。交叉验证方法是对具有不同复杂性惩罚时变值的模型进行比较，并使用均值平方误差(MSE)等标准，来来选择样本外预测与数据最匹配的复杂性参数值。这种方法很好，因为在测试样本中，“基本事实”是已知的: 观察每个单元的结果，就可以很容易地评估模型的性能。

本文的方法与这种方法密切相关，但它的不同之处在于，它是为预测处理因果效应而定制的，而不是为预测一个单位的结果。直接构建的模型，能最好地预测处理效果如何随着单位属性而变化。应用机器学习方法“现成的”的挑战，是“真理”的因果效应，对任意个体单位并没有被观察到：我们观察处理单位，或没有处理的单位，但不是同时观察,Holland (1986)称为“因果推论的根本问题”。因此如何使用交叉验证，来确定因果效应是否已被准确预测，还不是很明显。本文针对这个问题，提出了几种新的交叉验证准则，并通过模拟证明了它们在因果效应问题上，优于标准方法的条件。然后将该方法应用于实践中，包括大规模投票现场实验和搜索引擎上大规模新排序结果的现场实验。虽然目前论文中主要关注回归树方法(Breiman, Friedman,Olshen, and Stone, 1984)，但是这些方法可以扩展到其他方法，如LASSO (Tibshirani, 1996)和支持向量机(Vapnik, 1998, 2010)。

问题和设定

条件平均处理效果估计

直接截图

结论

本文介绍了构造因果效应树的新方法，使我们能够对因果效应进行有效推理。本文的方法将特征空间划分为子空间。该方法的输出是一组针对每个子空间的处理效果和置信区间。将这些方法应用到一个改变搜索查询结果位置的实验数据中，发现这些算法导致了关于位置效果异质性的可信和可解释的结果。

这些技术的一个潜在的重要应用，是在随机实验中进行“数据挖掘”。本文方法可以用来探索任何以前进行的随机对照试验，例如医学研究或发达经济学领域的现场实验。研究人员可以应用本文的方法，发现处理效果低于或高于平均水平的亚群体，并可以报告这些估计的置信区间，而无需担心多重测试。

这就是那棵高高的因果树

SusanAthey关于机器学习(ML)和因果推断的研究论文

ATE/Unconfoundedness(非混淆)

Athey, S., G. Imbens,S. Wager: “Efficient Inference of Average Treatment Effects in High Dimensionsvia Approximate Residual Balancing,” 2016, http://arxiv.org/abs/1604.07125

稳健性与补充分析

Athey, S., &Imbens, G. (2015). “A measure of robustness to misspecification.” The AmericanEconomic Review, 105(5), 476-480. (Canvas: Robustness)

Athey, S., G. Imbens,T. Pham, and S. Wager. Estimating average treatment effects: Supplementaryanalyses and remaining challenges. American Economic Review, 107(5):278{81,2017b.

DID(双重差分)和面板数据

Athey, Bayati,Doudchenko, Imbens, Khosravi (2016), “Matrix Completion Methods for CausalPanel Data Models.”

有效置信区间异质性处理效应子群组分析

Athey, S. and G.Imbens, “Recursive Partitioning for Heterogeneous Effects,” 2016, Proceedingsof the National Academy of Science. http://arxiv.org/abs/1504.01132

异质性处理效应——实验的个体化估计、分混淆设计、工具变量和矩模型的广义方法，具有渐近正态性和置信区间

Wager, S. and S.Athey, “Estimation and Inference for Heterogeneous Treatment Effects UsingRandom Forests,” forthcoming, Journal of the American Statistical Association. http://arxiv.org/abs/1510.04342

Athey, S., J.Tibshirani, and S. Wager. Generalized random forests. arXiv:1610.01271, 2017d. https://arxiv.org/abs/1610.01271

最优政策估计

Athey, S. and S.Wager. Efficient policy estimation. arXiv:1702.02896, 2017. https://arxiv.org/abs/1702.02896

Surrogate，结合实验和观察数据

Athey, S., et al.“Estimating Treatment Effects using Multiple Surrogate: The Role of theSurrogate Score and the Surrogate Index.” arXiv: 1603.09326 (2016).

网络实验中对等效应的检验

Athey, S., D. Eckles,and G. W. Imbens. Exact p-values for network interference. Journal of theAmerican Statistical Association, (just-accepted),2016b

Bandits算法

Athey, S., M.Diamakopoulou, W. Du, G. Imbens, “Contextual Bandits and Causal Inference”

Unsupervised learningfor text analysis

Athey, S., M. Mobius,and J. Pal. The impact of aggregators on internet news consumption. 2017.

大型贝叶斯结构性模型

Athey, S., and D.Nekipelov. “Heterogeneity and Advertiser Preferences in Sponsored SearchAuctions,” in progress.

Athey, S., D. Blei, R.Donnelly, and F. Ruiz. “Counterfactual inference for consumer choice acrossmany product categories.” 2017a.

Athey, S., D. Blei, F.Ruiz, “Item Embeddings for Demand Estimation.”

机器学习与计量经济学的一些参考文献和综述

介绍

Hal Varian, “Big Data:New Tricks for Econometrics,” The Journal of Economic Perspectives, 28 (2),Spring 2014, 3-27. http://people.ischool.berkeley.edu/~hal/Papers/2013/ml.pdf

预测与评估

Mullainathan, Sendhil,and Jann Spiess. "Machine learning: an applied econometric approach."Journal of Economic Perspectives 31.2 (2017): 87-106.

政策预测

Kleinberg, Jon, JensLudwig, Sendhil Mullainathan, and Ziad Obermeyer. “Prediction policy problems.” The AmericanEconomic Review 105, no. 5 (2015): 491-495.

预测与因果推理

S. Athey. Beyondprediction: Using big data for policy problems. Science, 355 (6324):483-485,2017.

A. Belloni, V.Chernozhukov, C. Hansen: “High-Dimensional Methods and Inference on Structuraland Treatment Effects,” Journal of Economic Perspectives, 28 (2), Spring 2014,29-50. https://www.aeaweb.org/articles?id=10.1257/jep.28.2.29

异质性处理效应综述

S. Athey and G. W.Imbens. The state of applied econometrics: Causality and policy evaluation. TheJournal of Economic Perspectives, 31(2): 2017.

AI已经快速渗透在经济学的各个领域

谁都想找到自己的“圣杯”

不知道，机器学习可否助您一程？

声明：文中观点代表原作者的观点，推文只是个人自学的资料整理，仅限于经济学同行之间交流学习，请勿作它途。谢谢！

那么！Susan究竟是谁？！

Susan Athey

斯坦福(Stanford)大学GSB科技经济学教授，微软顾问。

她是第一位获得克拉克奖的女性经济学家，也是《经济学人》最受欢迎的撰稿人之一。

Susan Athey的研究领域包括产业组织、微观经济理论和应用计量经济学。她目前的研究主要集中在拍卖市场设计和互联网经济，主要是在线广告和新闻媒体经济。

研究兴趣：互联网经济学、新媒体经济学、平台市场、在线广告、计量经济学和机器学习、大数据、数字货币、产业组织。