查看原文
其他

科举万岁!妙哉工具变量也!

江河JH 功夫计量经济学 2022-12-31
有许多计量经济学者都是因为其使用的工具变量而知名。今天给大家分享的是一篇工具变量的好文《Long Live Keju ! The Persistent Effects of China’s Civil Examination System》,作者是陈婷(香港浸会大学)、龚启圣(香港大学)和马驰骋(香港大学)三位老师。这是去年(2020年10月)发表在EJ上的论文,读完此文,我只想借用《李凭箜篌引》中“昆山玉碎凤凰叫,芙蓉泣露香兰笑”这一句诗来形容这篇论文的妙趣横生。作者使用各府到最近的松木和竹子产地的河流距离作为科举教育水平的工具变量,研究了明清科举教育对当代人力资本的长期影响。毫不夸张地说,我认为这是迄今为止最为漂亮的一个工具变量,大有超过毛咕噜大神殖民时代死亡率和安神出生季度的实力。

原文信息

Ting Chen, James Kai-sing Kung, Chicheng Ma.  Long Live Keju! The Persistent Effects of China’s Civil Examination System[J]. The Economic Journal,  2020,  130 (631) : 2030–2064.

引言

提到古代选拔人才的制度,恐怕大家脑海中首先想到的就是“朝为田舍郎,暮登天子堂”的科举制度。科举制度是世界上最早的精英选拔制度,旨在招募人才为官僚机构服务。进士是科举考试中的最高功名,考中进士就意味着前途一片光明。正因为如此,科举吸引了数以百万计的读书人,由于没有对候选人的社会背景和年龄加以限制,这种竞争可谓是异常激烈,中进士成为了读书人的毕生目标。

朝为田舍郎,暮登天子堂。

将相本无种,男儿当自强。

——高明《琵琶记》

随着时间的推移,科举考试形成了一个独特的本地精英群体,他们对知识和人才极为尊重,这一文化特征在科举制度废除后相当长一段时间内仍然存在。在这篇文章中,作者考察了科举制度对当代人力资本的持续影响。从下图可以看出,明清时期各府在科举考试中的成功率(以明清时期的进士人数衡量)与当代人力资本(以今天的受教育年限衡量)之间存在着很强的正相关关系。那么,这种关系是否是一种因果关系呢?

模型设定

为了实证检验科举制度对当代人力资本的长期影响,作者设定了如下的模型:
其中,表示州府;被解释变量表示当代人力资本,使用2010年人口普查数据各地区平均受教育年限来度量。
核心解释变量表示明清时期各府的科举教育和成绩水平,使用明清时期(1371-1905年)各府每万人的进士数量(进士密度,jinshi density)来度量。
表示一系列控制变量,包括各府2010年的夜间灯光亮度、地理因素(到海岸线的距离和地形崎岖程度)和省份固定效应。
表示一系列历史变量,包括历史经济繁荣程度(人口密度、城市化率和农业生产力)和区域迁徙。

基准结果

OLS的估计结果如下表所示。根据第(3)栏的估计结果,各府每万人中的进士数量(进士密度)增加1倍,将导致今天的平均受教育年限增加6.9%,按今天受教育年限的平均值8.712年进行计算,相当于使得平均受教育年限增加0.6年。

进士是科举考试中的最高荣誉和头衔,应该对今天更高层次的教育具有更大影响。因此,作者根据2020年人口普查数据,计算了未受过教育、接受过小学和初中教育、接受过高中教育和接受过大学教育这四类人群占总人口的比重。第(5)-(8)栏的结果表明,科举教育降低了高中以下学历人群的比重,提高了高中以上学历人群的比重,而对大学教育的影响最强。

因果识别

各府在科举考试中的成功可能与许多复杂的因素有关。尽管作者已经控制了许多可能的混杂因素,但仍然可能存在遗漏变量的问题,这些变量同时与历史上进士密度和今天的受教育年限有关。例如,进士密度可能与未观测到的(自然或遗传)禀赋有关。为了解决这些问题,作者祭出了大招——工具变量。
四书五经是中国科举考试的关键,然而光有教材是不够的,想要成为科举考试的赢家,你还需要一大堆参考书(类似于今天的《五年高考三年模拟》)。在作者考察的278个州府中,只有19个印刷中心,这意味着各府获得参考书的机会大不相同。但是,如果直接使用各府到印刷中心的距离作为工具变量,就会存在着问题,印刷中心的分布可能并没有想象中那么随机,例如更可能坐落在经济繁荣、人口密集的地区,以致于动摇其外生性的根基。
那么,是什么决定了印刷中心的地理位置呢?作者将目光转向了中国传统印刷技术所需的两种主要原料——松和竹。从大约14世纪开始,中国的主流印刷技术主要依靠松木和竹子来生产油墨和纸张,为了节省运输成本,主要印刷中心很可能靠近松木和竹子产地。除此之外,南方地区水系发达、水运便利,生产油墨和纸张所需要的的原料也大多通过水路进行运输。

这样,一条完整的工具变量“路径”就建立起来了:在某种程度上,各府在科举考试中的成功与印刷和获取书籍的便捷性密切相关,而主要印刷中心位于松竹产地附近,印刷所需的原料主要通过水路运输。因此,各府到最近的松木和竹子产地的河流距离是科举教育的一个可行的工具变量。

工具变量的估计结果如上表所示。根据第(5)栏和第(6)栏的结果,第一阶段估计值显著为正,F统计量,表明我们的工具变量不是一个弱工具变量。更重要的是,第二阶段的估计值表明,各府的进士密度对今天各地区的平均受教育年限具有显著的正向影响。IV的估计值(0.085)略大于OLS估计值(0.069),说明我们可能低估了科举教育对当代人力资本的长期影响。具体而言,各府每万人中的进士数量(进士密度)增加1倍,将导致今天的平均受教育年限增加8.5%,按平均值8.712年进行计算,相当于使得今天的平均受教育年限增加0.74年。

除了工具变量极为精彩,这篇文章的机制分析部分也做得相当完备,非常值得学习,有兴趣的朋友可以去看看!


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存