因果推断方法应该引入计量经济学教学
来源 |经济资料译丛
作者:赵西亮,清华大学经济学博士学位, 现为厦门大学经济学院副教授
一直以来, 对计量经济学的使用价值存在困扰。很多计量经济学教材中提到:计量经济学模型本身不能回答因果关系的问题, 因果关系必须要用经济理论来进行支持。这实际上是一种偷懒的解释。所谓理论, 都是假说, 对于这些假说, 未有充分证据证明之前, 它们未必揭示了经济变量之间的因果关系。正所谓“十个经济学家有十一种理论” (Hendry, 1980) , 而真正的经济机制应该只有一种;缺乏事实的充分支持, 理论也不一定描述真正的因果机制。
最近二十年来,以随机化实验为基础的计量经济学开始兴起, 有时也称为项目评估计量经济学。与传统计量经济学利用经济理论构建因果关系不同, 它们主要关注某一解释变量, 通常称为干预变量 (treatment) , 关注这一变量对结果的影响, 即干预效应 (treatment effect) 。在这一框架下, 所有的计量经济学识别策略都可以看作是一种 (分层) 随机化实验。
回归并不是简单的将变量不断地放到回归模型中去。放入其他解释变量的目的, 是希望加入这些变量作为控制, 可以使我们关心的变量有因果效应的解释, 或者说, 加入这些控制变量, 使回归模型类似于一个分层随机化实验。因而, 控制变量的引入不是随便放的, 研究中往往应该集中于一个解释变量 (即干预变量) , 而其他的是控制变量, 从而使回归类似于随机化实验。回归作为工具, 与其他策略一样, 无所谓好坏, 就看使用者如何使用, 在好的设计下, 回归可以发挥巨大的威力, 尤其是在大数据的时代!大数据的优点不是样本容量大 (即使有总体也无法回答因果问题) , 而是提供的变量越来越多, 这意味着条件独立性假设 (CIA) 成立的可能性越来越大。因而, 在大数据的情况下, 回归可能是最好的工具。匹配方法和回归方法一样, 识别条件都是条件独立性假设, 都是模拟分层随机化实验, 因而, 都不能解决内生性问题。工具变量法是寻找一个决定干预分配, 但独立于潜在结果的工具变量。工具变量法的本质类似于一个非依从的随机化实验。干预的随机化分配是工具, 而个体实际接受的干预状态是原因变量, 利用干预分配的随机性可识别出受工具变量影响的个体的因果效应, 即局部平均因果效应 (LATE) 。如果有多期的数据, 尤其是面板数据, 可以帮助我们克服不随时间变化的未观测混杂因素的影响, 通过差分或去均值的方法, 使得增量上满足CIA, 因而, 双重差分策略 (DID) 或固定效应方法本质上是增量上的分层随机化实验。断点回归设计 (RDD) 是最接近完全随机化实验的一种识别策略, 主要识别条件是局部随机化假设, 即个体没有精确控制断点的能力, 从而在断点附近左右, 个体具有高度的相似性, 在断点附近, 个体在左还是在右, 完全是由不可控的随机性造成的, 从而干预的分配近似于一个完全随机化实验。RDD策略通过断点来识别因果效应, 识别条件非常清晰, 很容易检验, 研究者个人操纵的可能性较低, 成为最透明和最可信的研究设计, 因而, 成为经济学家最喜欢的识别工具。
随机化实验和潜在结果框架的引入, 使经济学经验研究发生了一场“可信性革命” (Angrist and Pischke, 2010) , 尽管有些计量经济学家不一定完全认同这一说法, 但是“以实验设计为基础的计量经济学”确实提供了很多“基本有用的经验知识” (Rust, 2016) , 从而使经济学经验研究正在经历一场研究范式的转变 (Panhans and Singleton, 2016) ――从统计推断向因果推断转变。越来越多的实证研究开始探讨如何才能科学地识别经济变量之间的因果影响, 而非集中于估计量的统计显著性问题, 统计推断问题往往是相对次要的问题 (second order problem) , 因果推断才是获取知识的首要问题。最近二十多年来, “实验学派”计量经济学方法在经济学经验分析中的影响越来越大, 研究范式的“技术进步”也不断在其他学科中“技术扩散” (Bowen等, 2017) 。但是在经济学教学中, 本科生和研究生所使用的《计量经济学》教材仍然沿用了老的研究范式, 在经济学经验研究文献中广泛采用的因果推断方法仍然没有进入《计量经济学》教科书。
Angrist and Pischke (2017) 指出:传统计量经济学教材中的很多指导是过时的, 比如有关异方差、序列相关等问题的讨论, 这些问题都不会影响因果效应的识别, 而这些问题的解决只需要利用White (1980) 的异方差一致性标准误差或Newey and West (1987) 的序列相关及异方差一致性标准误差进行修正。Angrist and Pischke (2017) 认为:新的研究范式更加有趣、相关性更强、识别结果更加令人满意, 因而, 应该将这一范式引入新的计量经济学教材。
然而, 目前国内计量经济学的训练 (无论是本科生还是研究生) 主要集中于统计推断 (Statistical Inference) , 即如何利用样本信息获得总体信息的估计以及如何进行假设检验以判断估计结果的统计显著性。在经济学实证中, 我们拿到的往往是总体的一个样本, 利用样本信息进行的估计是否能够反映总体, 是实证研究中一个非常重要的问题。但是, 统计推断本身往往很少能够给出因果关系的信息。随着信息技术的发展, 数据获取的成本越来越低, 我们开始进入一个大数据的时代, 这意味着我们可以获得的数据样本容量越来越大, 甚至可以获得总体信息。这样统计推断的作用可能就越来越小, 比如如果拿到了总体数据, 那么传统意义上的统计推断就没有用武之地了。但是, 就算我们有总体数据, 也不能回答因果关系的问题。比如, 假设我们有中国人口普查的数据, 想考察教育如何影响个人收入, 仍然是没有办法获得因果效应的知识的。因而因果效应无关样本大小, 对于因果效应的探讨是更加底层的问题, 是任何科学获得知识的关键。要获得变量之间因果效应的知识, 必须要进行因果推断。
因而, 我国计量经济学教学也应顺应这一潮流, 将因果推断方法引入本科生、研究生的计量经济学教科书中, 以促进经济学经验研究的可信性和科学性。当然, 也不能忽视经济理论在经济学实证中的作用, 科学的发展是一个不断螺旋式上升的过程, “经济理论会不断地提出新的经验问题, 而对这些问题的实证解答又会促进新理论的构建” (Leontief, 1971) , 经济理论 (结构计量经济学) 和实验计量经济学应是一种良性的相互补充、互相促进的关系 (Heckman, 2010;Rust, 2014, 2016) 。
▍参考文献
[]Angrist, J.D.and Pischke, J., 2010, The Credibility Revolution in Empirical Economics:How Better Research Design is Taking the Con out of Econometrics, Journal of Economic Perspectives 24 (2) , 3-30.
[]Angrist, J.D.and Pischke, J., 2017, Undergraduate Econometrics Instruction:Through our Classes, Darkly, Working Paper 23114, National Bureau of Economic Research.
[]Bowen, D.E., Frésard, L.and Taillard, J.P., 2017, What's Your Identification Strategy?Innovation in Corporate Finance Research, Management Science, forthcoming.
[]Heckman, J.J., 2010, Building Bridges Between Structural and Program Evaluation Approaches to Evaluating Policy, Journal of Economic Literature 48 (2) , 356-398.
[]Henry, D.F., 1980, Econometrics-Alchemy or Science?Economica, 47, 387-406.
[]Leontief, W., 1971, Theoretical Assumptions and Nonobserved Facts, American Economic Review 61 (1) , 1-7.
[]Newey, W.K.and West, K.D., 1987, A Simple, Positive Semi-definite, Heteroskedasticity and Autocorrelation Consistent Covariance Matrix, Econometrica 55 (3) , 703-708.
[]Panhans, M.T.and Singleton, J.D., 2016, The Empirical Economist's Toolkit:From Models to Methods, Working Paper, Duke University.
[]Rust, J., 2014, The Limits of Inference with Theory:A Review of Wolpin (2013) , Journal of Economic Literature, 52 (3) , 820-850.
[]Rust, J., 2016, Mostly Useless Econometrics?Assessing the Causal Effect of Econometric Theory, Foundations and Trends in Accounting 10 (2-4) , 125-203.
[]White, H., 1980, A Heteroskedasticity-consistent Covariance Matrix Estimator and a Direct Test for Heteroskedasticity, Econometrica 48 (4) , 817-837.