当计量经济学遭遇机器学习（二）

其他

当计量经济学遭遇机器学习（二）

2018-04-01 经管之家

来源：计量经济学及Stata应用

作者：陈强

上期回顾：

当计量经济学遭遇机器学习：揭开机器学习的神秘面纱（一）

计量经济学 vs. 机器学习

计量经济学家对于 Machine Learning 的学习框架似乎并不陌生。纵观计量经济学在过去大几十年的发展史，我们不是也念兹在兹地想估计这么一个函数

吗？但为什么机器学习可以用于 “人工智能”（Artificial Intelligence，简记AI），而计量经济学却无人问津（影响力几乎不出学术界）呢？

主要原因就在于二者的目标不同。计量经济学的主要目标在于 “因果推断”（causal inferences），即推断对的因果作用。

为了识别并便于解释此因果关系，经济学家通常需要对的函数形式作很强的假定，比如线性回归模型。然后，将所有精力集中于得到未知参数的估计量，并针对进行统计推断（点估计、区间估计、假设检验等）。

总之，经济学家关注的重点就是，我们生活在（读为 “ hat”）的世界里。事实上，大多数实证论文只是为了说明，具有统计与经济的显著性。

另一方面，机器学习的主要目标在于 “预测”（prediction），即根据来预测。为了达到此目的，可以使用任何函数，甚至是难以解释的黑箱方法（比如神经网络）；只要预测效果好就行。

对于机器学习而言，即使有，也只是作为预测的中间手段与桥梁而已。机器学习的关注重点就是，几乎完全生活在（读为 “ hat”）的世界里，成功与否就看的预测效果。

计量经济学错过了大数据与ML革命？

在Quora上曾有个帖子，题为 “Why is the study of econometrics isolated from the big data/machine learning revolution”？似乎计量经济学已经错过了大数据与机器学习的革命。

这或许有些言过其实或耸人听闻。但时至今日，大多数计量经济学家与实证研究者对于机器学习依然兴趣不大，或许却是不争的事实。为什么会这样呢？

因果推断与预测：二者关系之紧密超出你的想象

根本原因仍然在于计量经济学的研究目的与机器学习不同。简而言之，计量经济学的主要目的为 “因果推断”（causal inferences）；而机器学习的主要目的为 “预测”（prediction），比如 “监督学习”（supervised learning）。

众所周知，做预测其实仅需要变量之间的相关关系即可，并不一定需要因果关系。比如，你看到街上有些人带伞，就可以预测可能下雨；但人们带伞显然并不导致下雨。

因此，虽然机器学习的预测方法具有很高的商业价值，应用广泛；但经济学家可能认为，“预测得再好，与我有什么关系呢，我只关注因果关系啊？” 尽管因果关系不见得带来商机，但它有学术价值与社会意义，比如研究扶贫政策的效应。即使不赚钱，也有高尚的动机啊……

然而，认为因果推断不需要预测，这其实是一个常见的误解。事实上，因果推断的本质恰恰是在做预测。比如，一个地区 A 实施了扶贫政策，你想评估此政策的效应。此时，A 地区扶贫之后的状态可以度量，但最关键的信息却不可观测，即 A 地区如果没有实施扶贫会怎么样？对于这种反事实的结果（counterfactual outcome），就只能进行估计或预测。这也正是 “鲁宾因果模型”（Rubin's Causal Model）的核心思想。

具体来说，一种可能的方法是找到一个没有实施扶贫的地区 B，它与实施扶贫的地区 A 在各个方面都十分接近，但却由于某种偶然原因而未得到扶贫。此时，就可以使用未扶贫地区 B 的结果来预测扶贫地区 A 如果未扶贫的反事实结果。这就是 “匹配估计量”（Matching Estimator）的基本思想。

不难看出，既然机器学习特别擅长预测，那么计量经济学中的预测问题，在不久的将来会越来越多地使用机器学习的方法，尤其是在 “处理效应”（treatment effects）的领域。

比如，在使用 “倾向得分匹配”时（Propensity Score Matching），其第一阶段为计算倾向得分（即个体得到处理或实施政策的概率），其本质就是一个预测问题，并不涉及因果关系。因此，只要预测精确度高，就可以使用各种 ML 的方法，为何非要使用 Logit 呢？

又比如，在进行二阶段最小二乘法回归时（2SLS），其第一阶段回归在本质上也是一个预测问题，即找到与内生变量最为相关的工具变量组合。因此，也可以在第一阶段回归使用 ML 的方法，尤其当工具变量很多时（参见 MIT 教授 Victor Chernozhukov 等的最新研究）。

有些重要预测也离不开因果推断

看来，机器学习会在未来一定程度上 “入侵” 计量经济学。反之，计量经济学是否也可以对机器学习有所贡献呢？当然可以！

当 Susan Athey 刚到微软当首席经济学家时，微软的机器学习大咖们也并不把她当回事。他们以为，纵然你是著名经济学家，但机器学习的大数据预测，也用不上你的经济理论啊。不久他们就发现错了……有些重要的预测问题还真离不开 Susan 所带来的因果推断方法。

Susan Athey 年初在 MIT 演讲

例如，你想知道某个公司政策的效应，比如将排名第一的搜索结果放到排名第三，预测将会对其点击量有多少影响？此预测其实是在估计该公司政策的因果效应，故单纯基于相关关系的机器学习方法可能无济于事。

又比如，你想预测宾馆房价对入住率的影响。假设从 hotels.com 收集了关于宾馆入住率与房价的大量数据。如果直接根据二者的相关关系进行预测，会发现宾馆入住率与房价显著正相关。但这显然不是因果关系，因为在旅游旺季，宾馆爆满而房价也高；反之，在旅游淡季，宾馆空房而房价也低。显然，若根据机器学习的预测结果，天真地建议宾馆为了增加入住率而提高房价，无疑将南辕北辙。

由此可知，考察公司政策效应的这一类重要预测问题，其本质上是在做因果推断，故必须使用反事实的分析框架（counterfactual framework）才能得到可信的结果。

为此，Susan Athey 将因果推断的方法引入机器学习的决策树（decision tree），建立 “因果树”（causal tree）模型（Athey and Imbens, 2016, PNAS），在学界与业界均引起很大反响。据 Sudan 介绍，美国的那些电商巨头 tech firms 也开始关注因果推断了（中国电商也赶快行动吧）……

高维回归

除了因果推断与处理效应，机器学习将对计量经济学产生重大影响的另一方法为 “高维回归”（high dimension regression），比如 LASSO 系列的惩罚回归方法。这类方法有望在不久的将来渗透到计量经济学的很多领域，将在下期推文中继续介绍。

（未完待续，更多精彩，下期推送）

高级计量经济学与Stata现场班

（含机器学习与高维回归，北京，五一节）

（六天现场班，详情点击底部阅读原文）

www.econometrics-stata.com

转载请注明作者与出处

Our mission is to make econometrics easy, and facilitate convincing empirical works.

反向激励，在加速这个社会的黑化

官媒发声：反对调休的声音不能装聋作哑！这不是放假，是“假放”（五一假期）

别太贪婪，这些技能让你一辈子满足

平安信托深陷“爆雷”旋涡：终于尝到“偏爱”房地产的苦果

刀片电池存设计缺陷，或将导致几十万比亚迪车主自费更换or召回？