阿西莫格鲁又一篇使用IV做因果推断的经典文献, 拿起小板凳一睹为快!
凡是搞计量经济的,都关注这个号了
稿件:econometrics666@126.com
所有计量经济圈方法论丛的code程序, 宏微观数据库和各种软件都放在社群里.欢迎到计量经济圈社群交流访问.
作者:广东工业大学张艺老师(yizhang2015@hotmail)
究竟是制度还是人力资本促进了经济的发展?
Institutions, Human Capital, and Development
这篇文章起源于Acemoglu et al. (Acemoglu, Johnson, and Robinson 2001)的经典之作- The Colonial Origins of Comparative Development: An Empirical Investigation,该文成了所有探讨制度与经济发展的研究的必引的文献。截至到2018年1月22日,在Google scholar上显示的被引用高达10922次。当然这篇经典之作也受到不少人的批评。最具有代表性的是Glaeser et al (Glaeser et al. 2004) 的Do institutions cause growth? 该文引用率也高达3520次。这篇Institutions, Human Capital, and Development是Acemoglu et al(Acemoglu, Gallego, and Robinson 2014) 发表专门回应Glaeser et al(2004)的Do institutions cause growth对其的批评。
Glaeser et al(2004)对Acemoglu et al.(2001)最主要的批评是说其本末倒置,将制度的马车放在人力资本的马的前面(putting the institutional cart before the human capital horse),与Acemoglu et al 认为制度导致了人力资本积累,从而导致经济发展的因果逻辑链条相反,Glaeser et al认为人力资本,而非制度,导致了后来经济的发展。所以Glaeser et al批评Acemoglu的实证策略事实上是描述的人力资本对长期经济发展的作用而不是制度。
在详细解释他们之间观点的分歧之前。首先,让我们先看看现有两种描述关于制度,人力资本和经济发展之间关系的理论。第一种是(North and Thomas 1973)的研究范式,在他们的著作中,他们区分了西方的经济增长的表面原因和根本原因。他们想论述的主旨就是虽然富裕的国家有更高水平的全要素生产力,更多受良好教育的工人,更多的机器工具和工厂。但这些只是西方国家富裕的表面原因。因为这只是重新描述了一下富裕意味着什么?在他们看来制度才是西方国家经济发展的根本原因。他们将物理资本,人力资本和TFP看作是表面原因。因为这些都是由制度引起的,并且作为制度影响经济增长的渠道。
另一种挑战的理论-现代化的假设(Lipset 1959)认为经济增长以及在这个过程中人力资本的积累(包含教育的扩张,城市化水平的提高和中产阶级的壮大)导致制度的改变。尤其是为民主铺平了道路。他认为制度仅仅是起附属作用或者很大程度上是由于社会中不同的教育和城市化水平而形成的。比如说,(Easterlin 1981)将人力资本的发展看成是各国经济大分歧的核心。他认为人力资本的积累不同并不是来源于制度的不同,而是来源于宗教传统的不一样,比如新教就强调每个人可以阅读圣经的能力。
可以看出,Acemoglu和Glaeser分别持有以上两种不同的观点。他们的文章事实上也是分别给这两种观点提供经验证据。我们用这样一张图来表示Acemoglu实证研究的逻辑链条。Glaeser的逻辑链条就是将human capital 放到institutions的因果链前面。
在标准的经济学理论中,制度常常是作为外生给定的假设。比如说Arrow和Debreu的一般均衡理论中假设一系列特定的制度,用于分配社会中资产初始的所有权,生产要素的私有权决定,个体在经济中的企业的所有权,合约的维护权,以及防止市场的垄断的规定。但在经济实证分析中,缺乏制度如何影响经济发展的经验证据。实证研究的困难在于制度是内生的,并且和其他长期经济表现的决定因素同时发展。所以任何简单的通过检验制度和经济发展的相关性来确定制度对经济发展的作用,或者是把制度简单的放进最小二乘法回归的右端,不可能得到一个可信的结论。
最近,经济学家都希望用不同的策略,将外生决定不同国家制度的差异性因素分离出来。他们通过寻找由历史条件所决定的不同国家制度作为工具变量。最有代表性的工具变量是Acemoglu选择的殖民者在当地的死亡率。因为在近代社会,欧洲人在不同的殖民地设计了两种极端不同的制度。在一个极端上,欧洲人利用强权在殖民地建立了一系列压榨制度用于将殖民地的资源转移至他们自己的国家。为了实现这一目的,他们创造了一系列的经济制度来支撑这种压榨制度。另一个极端上,欧洲人又希望能够复制甚至提高他们的欧洲经济制度。这种包容的制度促进了经济增长。那么这两种极端制度是如何来决定的?根据Acemoglu(2001)的研究,对于欧洲人死亡率越高的在殖民地区,他们越难在当地大规模定居,越倾向采用极端的压榨政策,而对于欧洲人死亡率比较低的在殖民地区,他们可以大规模的向当地移民,越倾向于采用模仿欧洲的包容性的制度。他的逻辑链条是这样的。
欧洲人在殖民地的死亡率->移民定居->两种不同的殖民地制度->现在的制度
对于Acemoglu(2001)的这一套理论最主要的批评就是批评Acemoglu没有区分制度和人力资本对长期发展的作用。其中最重要的文献来自于Glaeser (2004)。他批评Acemoglu的实证分析忽视了人力资本的作用,Glaeser(2004)文章采用了不同的实证策略来证明人力资本才是长期经济发展的驱动力。针对Glaeser的批评,Acemoglu在这篇文章的对他的实证方法一一作出了回击。
第一, Glaeser首先估计横截面OLS,利用1960年到2000年的人均收入增长率作为被解释变量,他们用教育的平均年限的自然对数表示人力资本,加入各种其他的制度测量作为解释变量,他们发现人力资本和制度都是显著的,并且与经济增长正相关。但在Acemoglu看来这个回归里面包含了很多内生的变量,尤其是人力资本和制度都是内生变量。所以Acemoglu认为这个回归并不能表示人力资本或者制度的对经济增长的因果作用(we believe that the estimated coefficients tell us little about the causal effect of either human capital or institutions)。
第二, 为了说明人力资本比制度更能预测经济增长的作用,Glaeser估计了一系列的模型来展示初始的人力资本水平是未来经济增长的一个好的预测变量,人力资本水平比用在执行时受到的限制程度(Constraints on the executive)来衡量的政治制度变量有更好的预测能力。Acemoglu认为Glaeser使用的制度变量和人力资本都有测量误差问题,但是相对而言,人力资本的测量误差会更小一些。由于人力资本跟制度是高度相关的变量。所以,制度的变量不仅受自身的测量误差影响。而且也受人力资本测量误差的影响,最终导致制度的测量误差比人力资本的测量误差大得多,以至于最后只发现人力资本显著,而制度不显著。
第三, Glaeser应用工具变量法来解决内生性问题。Glaeser也认识到了人力资本以及制度变量(Constrants on the executive)是一个内生变量,所以他使用了是否具有法国法律渊源这样一个虚拟变量,和殖民定居者的死亡率或者1500年的人口密度的组合作为人力资本和制度的工具变量。然而Glaeser的识别策略(identification strategy)是不清晰的。他们并没有说清楚为什么法国的法律渊源是人力资本或者制度变量的一个好的工具变量。他甚至没有清晰的说明,他的工具变量到底是代表人力资本的还是制度的。因为这两者是高度相关的,如果不清晰的说明出这个工具变量是代表哪一个内生变量的。那么其后对工具变量的条件的讨论可能是错误。这会导致模型错误的设定(misspecification)。
而且,法国法律渊源这样一个工具变量的外生性也是值得怀疑的,比如说,根据他们的数据,所有的拉丁美洲都被划定为具有法国法律渊源。但事实上这可能并不是因为殖民者强加给当地的法律体系造成的,而是由本国人自发选择,例如墨西哥虽然曾经被法国入侵,但是墨西哥采用拿破仑法典并不是由法国人推行的,而是由他们自己的政权推行的。而且,最重要的是,Acemoglu在控制了殖民者人口死亡率以及1500年的人口密度之后,并没有发现法国法律渊源对制度变量(用执行时受到的限制或者免受政府征用来衡量)有解释力。所以,很难让人相信Glaeser选择这个工具变量是有效的。
第四, 它采用了面板回归的方法。被解释变量是政治制度每5年的变化(用在执行时受到的限制来衡量)。解释变量是一系列水平变量,人均收入。教育受教育年限。在执行时受到的限制的水平变量和国家的固定效应。但是没有时间的固定效应。这里有两个问题,首先没有时间的固定效应,可能会导致一部分由于时间固定效应而导致的制度变化没有被正确的识别出来。其实他们发现。教育年限的水平变量跟制度的每五年变化量显著相关,但是教育年限的变化量并没有跟制度的每五年变化量相关。
这个结论很难理解,因为采用水平量和国家的固定效应来解释制度的变化量,而且没有控制时间的固定效应,是非常罕见的识别策略(specification)。在类似的实证研究中,Acemoglu采用了标准的面板模型,使用水平量对水平量做回归,并且加入的时间和国家的固定效应,并没有发现收入水平或者是教育水平对国家的民主制度有影响。相反。Acemoglu(2014)在另一项研究中倒是发现。国家民主制度对人均收入水平有显著并且稳健的作用。
在对Glaeser的实证方法进行了全面的批判之后。Acemoglu开始一一展示他的发现以及实证检验过程。首先关于殖民开拓过程和人力资本的关系,Glaeser之所以提出是人力资本导致了制度的变化,最终影响了经济的发展,而不是相反,就在于他认为欧洲人在北美和南美的殖民过程中,制度的不一样是由于早期殖民者的人力资本水平不一样所导致的。Glaeser说,我们不清楚在当地建立有限政府的欧洲人带给殖民地什么样的制度?但至少可以说的是他们带来了他们自己以及他们的知识和人力资本(“it is far from clear that what the Europeans brought with them when they settled is limited government. It seems at least as plausible that what they brought with them is themselves, and therefore their know-how and human capital” )。听起来好像很有道理,但事实上Acemoglu证明这种论断是错误的。
因为有历史的证据证明,欧洲征服者在殖民南美洲的过程中,采用的是压榨的殖民制度。但在殖民北美的过程中采用了欧洲国家制度相似的内生性的制度。然而,征服南美的殖民者却比征服北美的殖民者具有更高的教育水平。因为征服南美的西班牙殖民者大部分是贵族家庭出生,他们要么是低级的骑士,或者是无法继承贵族产业的第二或者第三个儿子(hidalgos),他们的教育水平比西班牙的普通民众要高,平均的识别识字率达到76.6%。相反,征服北美的英国殖民者大部分是签订契约的普通工人(indentured labors)。他们的文化水平比西班牙的征服者更低,识字率只有41%左右。历史数据并不支持Glaeser 关于在北美采取更优越的制度是由于殖民者的人力资本水平更高的论点。
Acemoglu采用两个数据集,一个是62个不同国家间的横截面数据(cross-country data),另一个是684个不同地区间的横截面数据(cross-regional data)。两个数据集的主要变量的描述性结果见Table 1。
Note: 如果觉得图片看不清楚,请到文末下载原文对照看。
首先对于国家间横截面数据,主要的被解释变量是人均GDP,采用来自于Penn world Tables的2005年购买力平价(PPP)转换并取自然对数(log GDP per capita in 2005)。
第一个主要的解释变量是人力资本变量,用当年的教育水平(years of schooling),即2005年15岁以上人口的平均受教育年限,来衡量。教育水平的工具变量采用在20世纪早期的新教传教活动(protestant missionary activity)作为工具变量。
另一个主要解释变量是制度,采用2005年法律指数(the rule of law index)来测量,来自于世界银行发布的世界政府治理指数,使用这个指数,是因为它提供了到现在为止最新的关于制度的综合测量的信息。对于制度的工具变量,使用移民定居者的潜在死亡率。取对数并对离群值作截尾处理(capped)。关于将移民死亡率作为制度的一个工具变量的论述可以详见Acemoglu(2001)。
Ordinary Least Squared regressions+Robust standard error
异方差稳健的最小二乘法
Table 2 汇报了普通最小二乘法的结果,为了消除异方差带来的影响,采用了稳健的标准误。Table 2的结果展示经济增长与人力资本以及制度之间的相关关系。Table 2的第1列到第12列,主要是为了展示在控制了一些变量后,人力资本,制度与经济发展之间的关系。第(1)列,当使用教育水平对人均GDP做回归时,发现了正在显著的相关性,并且教育水平前面的系数达到了0.352(SE=0.027)。
它的95%的置信区间远远高于微观数据所得到的0.6-0.1的人力资本的回报率。造成这一结果的原因可能有两点。(1)人力资本有很强的外部性,这种外部性在微观数据的研究中并没有被捕捉到。(2)有很严重的遗漏变量偏差。这个表格的其他部分证明了高估的回报率是由于遗漏变量偏差所导致。在第二点中,我们仅仅使用法律指数对人均GDP做回归,也发现了很强的正的相关性,达到0.93(SE=0.096)。第三列将教育水平和法力指数同时放入对人均GDP做回归。
这两个解释变量依然是显著。但是法律指数的系数明显变小,教育水平前面的系数变化不大。其余的各列依次加入了不同的控制变量,包括,纬度(衡量该国家到赤道之间的距离),非洲、美洲和亚洲的虚拟变量,法国或者英国殖民地的虚拟变量。最终在第12列,控制住了所有的这些变量之后,教育水平前面的系数依然高达0.28,法律指数前面的系数降为0.428。并且,所有的上面的控制变量在5%的显著性水平下都不显著。
这个简单的普通最小二乘法。提示了我们人力资本和制度作为解释变量产生偏误的方向,人力资本前面的系数代表着教育的回报率,这里宏观数据所得到的教育回报率是微观数据得到的五倍。极有可能是由于遗漏变量偏差以及测量误差的原因,导致了其高估了教育的回报率。同时由于。作者认为,人力资本的差别实际上是由制度所导致的,所以人力资本的测量误差会影响到制度的测量误差,导致制度的测量误差更严重。同时当加入人力资本之后,制度前面的回归系数极大的减少,这有可能是由于制度的一部分作用被人力资本所解释,最终导致制度前面的系数被低估。
另一个导致教育水平被高估的原因是由于反向的因果关系,也就是说更高的收入水平可以通过不同的渠道导致更高的教育水平。为了减少测量误差所导致的偏误反向因果关系。所以有必要采用工具变量的方法。
所以在普通最小二乘的回归当中,人力资本和制度的虽然和经济发展水平显著的相关,但是这种相关性并不能解读为因果关系。而且在这种情况下,内生性所导致的人力资本回报率被严重高估,是微观数据的五倍。
Semistructural Models
半结构模型
由于制度和人力资本两个解释变量都是内生的,这里采用半结构模型来重新估计这个回归方程,所谓的半结构模型就是将制度和人力资本中的其中一项看作为内生解释变量,而不同时将这两个解释变量看成内生。当只把其中一项看作是内生解释变量时,需要采用其他的潜在工具变量直接控制另外一个内生的变量。注意这里处理的方式与两阶段回归有些许不同,这里并不是把两个内生解释变量,同时使用工具变量法来做两阶段回归,而是把其中的一个内生变量用工具变量法做两阶段回归,而另一个内生变量直接用其潜在的工具变量作为代理变量放入第二阶段的回归中。这种处理方法和两阶段回归的模型很相像。但是却能够让我们看清楚内生性产生的原因,以及工具变量所适用范围和改善的方向在哪里?
首先把人力资本水平看作是内生变量,对其采用工具变量法,而直接用代理变量的方式来控制制度的影响。这时工具变量采用的是20世纪早期新教传教活动。为什么20世纪早期的新教传教活动可以作为教育水平的工具变量?因为在控制住一些变量之后,新教传教活动对于长期的经济发展除了通过人力资本积累的渠道之外,没有其他的影响渠道。要实现这一点,需要控制住以下一些变量。
第一,因为传教活动的地理位置主要是在教堂附近,所以教堂位置的选择决定了传教活动的范围。第二,传教活动对于英国殖民者和法国殖民者是不一样的。第三,传教活动可能影响制度的发展,包括民主制度和学校的教育体系。第四,传教活动可能通过人群中不同宗教的比例影响长期的发展。所以,如果控制住地理位置的虚拟变量,殖民者来源国,制度,传教活动所在的地方,那么传教活动可能都会由一些不影响经济发展的独特的因素所决定。
Table 3 汇报虚假性检测。分别检验控制了一些变量和不控制这些变量后,20世纪早期的新教传教活动和经济发展之间的关系。虚假性检测是为了证明早期的新教传教活动是人力资本的一个有效的工具变量,它具有排他性的约束。前面论述了在控制住其他的一些变量之后,除了人力资本这一条途径之外,早期的传教活动应该对经济发展没有其他的影响途径。
然而,依然要质疑的就是早期的传教活动有可能是内生的,也就是说它是在人力资本或者说教育水平比较高的地方进行。如果是这样的话,那把早期传教活动作为工具变量依然无法消除人力资本的内生性。为了排除这种可能性,Table 3的虚假性检验就是证明早期的传教活动应该对19世纪的教育没有影响,在Table 3的第1到4列,他们选择了其中24个国家。这24个国家在1870年之后才开始有了传教活动。这个表格展示了将1870年小学入学率和1870年之后的传教士活动之间做回归时,并没有发现显著的相关性。Table 3第5到第8列中。
将1940年的小学入学率和1870年之后的传教士活动之间做回归。也就是说在传教活动进行了几十年之后,传教士活动对当地的教育有没有影响?结果显示的两者之间很强的正相关性。在第8列,控制了纬度,殖民者的属性,以及大陆的虚拟变量后,发现早期传教活动的系数在10%的显著性水平下依然显著。所以这些结果就表明了在1870年到1940年。早期的传教活动开始和人力资本的积累之间产生显著的相关性。
Table 3 的第9到第12列检验了早期的传教活动对2005年的平均年限之间的关系,发现二者之间依然存在显著的相关性。值得注意的是,虽然只有24个样本,但得出的结论却和后期对所有样本使用两阶段回归的第一阶段的结果很类似。所以这一系列的回归支持了工具变量的关键性假设,那就是早期的传教活动并不是选择性的在教育水平更高的地区开展,但是他们对当地的人力资本的投资和积累确实有着长期的影响。
Table 4 是一个半结构方程,将平均受教育年限作为内生变量,同时为了控制制度的内生性,用两个外生的工具变量来代替,即潜在的殖民者死亡率和1500年的人口密度的自然对数。Table 4的下半部分报告了两阶段回归的第一阶段,也就是用人力资本的工具变量--20世纪早期的的新教传教士活动以及1900年的小学入学率,作为现在平均受教育年限的工具变量。在第一列,是最简单的回归方程,除了平均受教育年限和新教传教活动的不同数据来源的虚拟变量,没有包含任何其他的变量,尤其是没有包含关于制度的变量。
所以在表格四的下半部分。可以看到作为工具变量在第一阶段和和教育水平有很强的相关性,F统计量达到了26,所以是强工具变量。在第1列,这个模型报告了平均教育年限对2005年人均GDP的对数的回归系数,这个数字和普通最小二乘法在Table 2中的回归系数0.314非常相似。因为后面的一些模型在第一阶段回归有弱工具变量的问题,所以这里报道95%置信区间下的异方差调整的(heteroscedasticity-adjusted) Anderson-Rubin(AR) 统计量,这个统计量对于弱工具变量的问题,可以有更稳健的表现。可以看出这个异方差调整后的置信期间显著地不等于0。
从第2列到第4列,Table 4加入了同Table 2一样的控制变量,包括纬度,洲的虚拟变量,以及法国和英国殖民者的虚拟变量。这些控制变量加入对于第一阶段和第二阶段基本上没有影响,比如说。当所有的控制变量被加入时,在第4列中。平均受教育年限的回归系数是0.317。和第1列没有控制变量的差别不大。
如果在第1列至第4列的估计确实能反映人力资本对人均GDP的因果效应的话,那么他们比微观数据的估计值大很多。虽然我们使用工具不一样的方法控制了人力资本的内生性,但是这并没有对人力资本过大的估计值作出合理的纠正,很有可能的原因是因为我们并没有控制住制度的作用。因此我们在第5列,先加入制度的工具变量直接作为制度的代理变量,分别是殖民者的潜在死亡率以及1500年的人口密度的自然对数,采用两阶段回归的方法来估计受教育年限对人均GDP自然对数的值。
相比于第1列至第4年没有控制制度的情况下,控制了制度的第5列。平均受教育年限的回报率下降到了0.177。但是95%置信区间下的(heteroscedasticity-adjusted) Anderson-Rubin(AR) 统计量包含了0。也就意味着平均受教育年限前面的系数可能是可能为零。同样的,当我们加入更多的控制变量的时候。第二阶段的回归这是结果和第5列类似,平均受教育年限前面的系数变得更小,但是已经没有统计上的显著性,而且在所有的情况下,平均受教育前面的系数的95%的置信区间包含了微观数据得出的估计量0.06-0.1的范围。
在Table 4的第9-第12列,重新估计了跟第5-第8列是一样的模型,但是使用了Limited-information maximum likelihood (LIML) estimator 的估计方法。这是一个在中位数上无偏的估计方法。对于过度识别的模型,如果存在弱工具变量问题的时候,LIML得到的结论更不会受到第一阶段弱工具变量的影响。结论与使用两阶段最小二乘法2SLS得到的结果相类似,那就是受教育年限的回归系数已经大致包含了微观数据所得到的范围。
所以总的来说。无论是使用2SLS还是考虑到弱工具变量的LIML的方法,在控制了制度的因素之后,人力资本的作用被显著地降低了,并且,人力资本的回报率降低到和微观数据估计结果比较接近的范围。
Table 5是跟Table 4的相对称回归方程,不同点在于这里将制度(法律指数)作为内生变量,使用工具变量法加以控制,同时将人力资本的工具变量作为人力资本的代理变量,直接放入第二阶段的回归。可以看到,法律指数对人均GDP回归系数大约为1.413。
并且过度识别的检验也证实了法律指数的工具变量是有效的。从第2到第4列中加入了跟Table 4 一样的不同控制变量,加入不同控制变量的结果会弱化第一阶段的回归,其成为弱工具变量,但是在第二阶段的回归中得到的结果跟没有控制度的结果非常类似。并且无论如何控制人力资本和其他的控制变量,制度的回归系数依然是稳健的和显著的。
Table 5的每一列所使用的回归方法和控制变量都跟Table 4类似。最终得出的结论是,无论是使用两阶段最小二乘法2SLS还是用限信息最大似然法LIML,都证明制度和人均GDP之间的关系比人力资本和人均GDP之间的关系更加的稳健。并且,控制了制度后,人均资本对GDP的影响会极大的削弱,并且接近微观数据估计的结果。但当控制了人力资本,制度的回归结果却影响不大。这两个半结构回归方程证实了最开始的猜想,那就是人力资本的回归系数由于受到了严重的遗漏变量的影响而高估,而制度的回归系数变低估,在使用工具变量法后,制度的回归系数相当的稳健。
完全两阶段最小二乘法
Full Two-stage least squares models
Table 6使 用完全两阶段最小二乘法,实际上就是将制度和人力资本同时看成是内生变量,并且用两个半结构方程中所使用的历史数据作为工具变量。回归的过程和步骤都和Table 4,5类似,唯一的区别就是这时同时使用四个工具变量处理两个内生变量。
在Table 7 中(此处省略)采用了其他的一些回归方法来检验回归结果的稳健性。第一,舍去了四个新欧洲国家样本,也就是美国,加拿大,澳大利亚和新西兰,因为这几个国家的制度发展可能和其他的国家不一样,第二,控制了疟疾等流行性疾病以消除殖民者死亡率和当地的疾病风险之间的影响,从而殖民者死亡率通过疾病风险影响到经济的发展,第三,控制了一系列气候变量,用来测量湿度和温度,第四,控制1900年人口中不同宗教信仰的比例。第五,使用了完全信息的最大似然法。
最终,在所有的稳健性检验中法律指数的估计系数稳定在1.15到1.49之间,并且一直都显著的不等于0,而平均受教育年限的估计系数,在加入了制度变量之后,就不再显著。虽然在很多的情况下,它的系数也包含了微观数据估计的结果的数据范围。总的来说,无论是使用哪一种估计方法和控制变量以及工具变量法。制度对经济的影响都是稳健的,而人力资本对经济的影响却是有限的。这个结果并不意味着人力资本对人均GDP的作用不稳健。更有可能的结论是,我们的估计结果意味着人力资本的作用没有被精确的估计,但是依然能够和微观数据估计的结论相一致。
人力资本是不同制度的原因吗?就是不同的人力资本是否是是造成不同制度的原因,为了研究这个问题。将制度放到回归方程的左边。而将人力资本放到回归方程的右边。回归方程的控制变量选取和Table 4中类似,Table 8报告了回归的结果。这里不详细介绍Table 8中的每一列,其排列和Table 4,5,6都类似。但是最终的结论说明了虽然人力资本和制度之间是正相关的关系。但是在使用的工具变量控制人力资本基本的内生性之后。人力资本前面的系数就不显著,这也就意味着人力资本并不是产生这种制度变化的原因。
最后一部分,为了提供更多的人力资本对长期经济发展的影响的证据。使用了48个国家中624个地区的数据重新估计。Table 9(省略)首先使用了普通最小二乘法,这里并没有加入制度作为解释变量。被解释变量是人均GDP的对数,所有的回归方程都包含了国家的固定效应。得出平均受教育年限的回归参数和Table 1的结论相类似约为0.282,并且在控制了其他的变量之后,平均受教育年限的回归参数并没有受到显著的影响,估计的结果相当稳健。
Table 10 使用了两阶段最小二乘法。依然是使用是否在20纪早期有新教传教活动作为教育年限的工具变量。第一阶段的回归都通过了强工具变量的检测,第二阶段的回归结果使用了工具变量来消除测量误差和内生性偏误之后。教育水平的平均回报率下降到了0.132。这一回报率在加入了其他的控制变量之后变得不显著。但是估计的大小并没有发生太大的变化。
在前面跨国家数据的回归中,一旦使用工具变量来解决人力资本的内生性问题。同时包含了其他的控制变量。那么人力资本的回报率就下降到了和微观数据相一致的范围。这里使用跨地区的数据得到了类似的结果。在这里并没有控制制度的变量,因为加入了每个国家的固定效应,每个国家的制度也就控制了,所以没有必要再控制制度的变量。
最终的结论是,实证检验的结果证明了North&Thomas(1973)的理论,那就是制度是导致人力资本,物质资本,全要素生产力的不同。而不是如Lipset(1959)的理论所说的,人力资本导致了制度的不同。
当然,这些实证结果并不是要说明人力资本对于长期经济发展不重要,而是要强调人力资本的增长实际上也主要是不同的制度所导致的,一旦控制了制度的影响,人力资本对经济发展的影响将会大大的减少,并且跟微观的数据相吻合。因为高估的人力资本的回归系数中事实上包含制度的解释作用。以上所有的证据可以得出稳健的结论,那就是制度的不一样,而非人力资本的不同,才是影响经济发展的主要原因。
这篇文献解析《究竟是制度还是人力资本促进了经济的发展PDF版本》
Institutions, Human Capital, and Development Daron Acemoglu, Francisco A. Gallego, James A. Robinson Annual Review of Economics 2014 6:1, 875-912
作者:广东工业大学张艺老师(yizhang2015@hotmail)
关于IV工具变量方法
另外,今天逛社群看见群友分享了一篇陆铭老师推荐的DID文章,建议各位群友到社群下载看看。社群里面的资料相当丰富,各位群友要多逛逛,这样才能在学术上才能长更多的见识。
下面这些短链接文章属于合集,可以收藏起来阅读,不然以后都找不到了。
2.5年,计量经济圈近1000篇不重类计量文章,
可直接在公众号菜单栏搜索任何计量相关问题,
Econometrics Circle
数据系列:空间矩阵 | 工企数据 | PM2.5 | 市场化指数 | CO2数据 | 夜间灯光 | 官员方言 | 微观数据 | 内部数据计量系列:匹配方法 | 内生性 | 工具变量 | DID | 面板数据 | 常用TOOL | 中介调节 | 时间序列 | RDD断点 | 合成控制 | 200篇合辑 | 因果识别 | 社会网络 | 空间DID数据处理:Stata | R | Python | 缺失值 | CHIP/ CHNS/CHARLS/CFPS/CGSS等 |干货系列:能源环境 | 效率研究 | 空间计量 | 国际经贸 | 计量软件 | 商科研究 | 机器学习 | SSCI | CSSCI | SSCI查询 | 名家经验计量经济圈组织了一个计量社群,有如下特征:热情互助最多、前沿趋势最多、社科资料最多、社科数据最多、科研牛人最多、海外名校最多。因此,建议积极进取和有强烈研习激情的中青年学者到社群交流探讨,始终坚信优秀是通过感染优秀而互相成就彼此的。