AER上因果关系确立, 敏感性检验, 异质性分析和跨数据使用经典文章
凡是搞计量经济的,都关注这个号了
邮箱:econometrics666@sina.cn
所有计量经济圈方法论丛的code程序, 宏微观数据库和各种软件都放在社群里.欢迎到计量经济圈社群交流访问.
今天,因果推断研究小组引荐一篇America Economic Review上的文章。主要讲的是欧洲列强瓜分非洲的长期影响。非洲大陆上的国家整体上都比较小,而且国家间的分界线相对笔直,这多少会引起咱们疑问。历史地理学家研究就发现,欧洲列强在还没有真正了解甚至到达非洲时,就把非洲大陆在地图上按照经纬度瓜分为各自的附属殖民地。这样做的后果就是,许多同一种族群体被强制划分到两个不同国家。如果遭受相同待遇倒好,可是这些被分离的种族在其他国家往往受到政治、经济和教育歧视,从而让她们不得不拿起锄头、镰刀甚至枪杆子反对government。看见自己种族的同胞受到不好待遇,生活在另一个国家的胞兄弟们也明里或暗地帮助受难同胞(邻国政府也喜欢“帮忙”),比如助其组建与政府对抗的反government武装。
这篇文章就是研究欧洲这种任意的边界划分所导致的种族分居两国情形,如何影响当下由种族所发起的抗议或政府对该种族打压行为。这篇文章的精彩之处,在于它对因果关系的回答上。本文的被解释变量是种族发起的冲突事件,解释变量是0-1虚拟变量——种族因国界而分离开。鉴于0-1变量,作者只要证明它是随机分配的,那就不存在所谓的selection bias问题了。因此,作者在前面花了不少篇幅验证,欧洲殖民者当年划分国界时并没有去考虑地理、历史和生态等等因素。这就说明了0-1解释变量的随机性(像准自然实验),从而为下文的实证分析增添了因果效应。这之后,通篇文章都看不见作者专门去讨论内生性问题了,但并不妨碍其结论较高的可信度。
除此之外,作者稍稍提及了不可观测遗漏变量问题,使用的方法是“因果推断中遗漏不可观测变量多严重? 通过可观测变量检测”。值得借鉴的地方还包括,作者在前面用文字描述出可能的影响机制,系列异质性分析,非常多的敏感性检验,多种数据的使用等等。通篇读下来最大感受是,发在AER上的文章并不一定需要数理模型,而更强调的是结论稳健可靠。
下面,因果推断研究小组有选择性地展示文章里的一些重要内容并进行说明。
首先,标题、摘要和引言全部展示出来。这让我们能够全面了解这篇文章的Motivation, data, identification, results and conclusions。
其次,作者列出的是相关文献。
最后,是文章结构的展示。
对于国外的文章,背景知识是必不可少的,并且需要花很多笔墨去介绍它。
作者认为有如下这些影响渠道——即为什么同一种族被分在不同国家会导致冲突呢?
作者专门说明是依据什么地图来做这项研究的以及国界划分的随机性。
作者强调国界划分是随机的,在划分国界时,欧洲列强并没有考虑到地理、生态和自然资源等因素。这为因果推断提供了基础,因为这是一个准自然实验。
看看这个回归表格,1-7列相关变量的回归系数大多不显著。
作者开展实证研究,验证他们心中的结论。
敏感性检验。作者做得太多的敏感性检验了,比如把因变量Y的top 5%去掉,再做类似的回归。
异质性分析。作者尽量做一系列异质性分析,主要结果都放在附录里。
作者改变数据来做研究。
作者研究文章前面提到的影响机制。
作者进一步考察,这些被强制分离的种群过得不好,不然他们哪能做这些抗议事情。
下面这些短链接文章属于合集,可以收藏起来阅读,不然以后都找不到了。
2年,计量经济圈公众号近1000篇文章,
Econometrics Circle
数据系列:空间矩阵 | 工企数据 | PM2.5 | 市场化指数 | CO2数据 | 夜间灯光 | 官员方言 | 微观数据 |
计量系列:匹配方法 | 内生性 | 工具变量 | DID | 面板数据 | 常用TOOL | 中介调节 | 时间序列 | RDD断点 | 合成控制 |
数据处理:Stata | R | Python | 缺失值 | CHIP/ CHNS/CHARLS/CFPS/CGSS等 |
干货系列:能源环境 | 效率研究 | 空间计量 | 国际经贸 | 计量软件 | 商科研究 | 机器学习 | SSCI | CSSCI | SSCI查询 |
计量经济圈组织了一个计量社群,有如下特征:热情互助最多、前沿趋势最多、社科资料最多、社科数据最多、科研牛人最多、海外名校最多。因此,建议积极进取和有强烈研习激情的中青年学者到社群交流探讨,始终坚信优秀是通过感染优秀而互相成就彼此的。