深圳市中级法院爆发大规模群体上访事件

留学生在伦敦街头刷中国核心价值观遭再涂鸦,这事怎样看

中纪委重拳出击!贱卖给日本的中医药企业被收回,紫光董事长被查

最伟大的作品!一幅东伦敦涂鸦竟然让殖人集体癫痫?

烈日下的花

生成图片,分享到微信朋友圈

自由微信安卓APP发布,立即下载! | 提交文章网址
查看原文

7位中青年教授关于应用微观计量应用和实证写作的思考, 奉劝都读一读!

凡是搞计量经济的,都关注这个号了

稿件:econometrics666@126.com

所有计量经济圈方法论丛的code程序, 宏微观数据库和各种软件都放在社群里.欢迎到计量经济圈社群交流访问.

2020年上海“应用微观计量经济学”暑期学校系列学术讲座(上贸大—YES )成功举办。以下几则简报与应用微观计量经济学紧密相关,因此特别汇总给各位学者研读和思考。

Source: IRID区域与产业发展研究中心,微信ID: wx-IRID_Econ

简报(6) 陈钊:经济学与政策制定

2020年8月3日下午,复旦大学陈钊教授为上贸大-YES“应用微观计量经济学”暑期学校做专题报告,主题是“经济学与政策制定”。陈钊教授基于个人的研究体会,和暑期学校学员们分享了什么是好的研究、如何基于中国问题开展研究,并且以住房政策、环境规制和研发激励政策为例,为学员们详细讲解如何做好的中国问题研究。
陈钊教授从选题的取舍、质疑的精神和科学的逻辑三个角度分别阐述如何开展研究。(1)选题的取舍。陈钊教授认为选题的取舍直接决定了一项研究是否具有价值。做一个建设性的批评者可以帮助我们找到中国存在的问题,提出解决和改进的方案,往往具有更大的价值。(2)质疑的精神。他认为很多政策的出台是为了解决当时存在的问题,随着时间推移,政策的合理性和科学性会发生变化,研究者需要保持独立的思想,从不同专业角度发现问题,通过科学的探讨和辩析提出自己的判断。(3)科学的逻辑。陈钊教授认为选题的价值还需要以研究建立在科学的逻辑之上为前提。他认为,总的来说,学者的研究始于学术的猜想,这需要学者拥有“学术独立、思想自由”的精神,而从学术猜想到不断接近事实真相,则依靠的是学者严谨、独立、科学的治学态度。学术界应当倡导自由、独立、开放的争论之风,学者们应当拥有批判的精神、忧患的意识,及时发现和预测问题,体现学术研究的价值。
近年来,中国问题研究在国际上倍受关注,如何定位中国问题的研究,如何找到中国学者的位置也是陈钊教授一直思考的问题。围绕着以下几个方面,陈钊教授跟大家分享了他的一些见解:(1)中国问题可以产生一流研究吗?(2)发表、批示、影响力,哪项才是检验一流研究的标准?(3)一流发表等于国际TOP?(4)中国问题研究有哪些机会?陈钊教授认为,所谓一流研究,就是对重要问题的科学回答。中国具有特殊的制度背景、丰富的政策差异以及大国内部的差异,这些为中国问题研究提供了丰富的素材,因而也能够产生一流的研究。就目前来看,同行学者评价相对来说比较客观,从创新和科学角度来判断,发表仍然是检验一流研究的重要标准。但是一流发表并不等同于国际TOP的发表,因为,对中国重要的问题不一定能够一般化,不一定能得到国际TOP期刊或审稿人的认可。并且,国际TOP期刊上发表的中国问题的研究也需要接受中国读者的检验。
随后,陈钊教授先结合他对中国住房市场与政策的思考向大家展示如何利用经济学逻辑与通俗的语言开展政策讨论,寻找研究问题。接下来,他以两项研究为例,对如何做好的中国政策研究给出具体的指导。
第一,水污染规制政策。如何寻找好的选题呢?陈钊教授认为一些值得研究的选题往往隐藏在令人疑惑的现象背后,比如2005年政府开始严格实行水污染的环境规制,但是长江水质却并没有改善,这就引起了他的关注和思考,并尝试通过总量背后的结构性差异来寻找线索,探究背后的原因,提出学术猜想,给出合理的解释。他的这项合作研究发现,水污染环境规制存在空间差异,河流下游往往是接近入海口的发达地区,因而环境规制更为严格,对污染容忍度更低。于是,这种差异化的环境规制会导致污染产业的生产活动向上游转移,导致总体上来看,下游企业确实降低了污染排放,但是长江流域的水质却并没有改善。
第二,创新激励政策。有了好的研究问题和学术猜想,接下来就是要科学地回答问题,寻找事实的真相。陈钊教授以面向高新技术企业的研发激励政策为例,给学员们讲解如何通过线索和证据寻找真相。他指出从总量数据上看创新激励政策实施后中国研发投入占GDP比重上升非常快,但是,也有研究认为中国研发的效率却低于国际一般水平,这是为什么呢?他认为,中国的企业研发投入很可能有一部分是为了拿政策好处而出现的水分。那么,如何识别这些水分呢?在这项合作研究中,他与合作者们找到一个方法,根据会计准则,研发投入计入管理成本,但其他管理费用占销售收入的比重本身跟研发强度没有必然的关系,但是来自企业的微观数据却显示,当研发强度刚好达到政策要求的临界点时,其他管理费用占销售收入的比重就会明显下降。他们认为,对此现象的惟一合理解释就是,企业为了达到政策对研发强度的最低要求而将其他管理费用记作了研发投入。一旦挤掉这部分水分,我们就能客观地认识研发激励政策的效果和研发投入的真实效率。
陈钊教授在本次讲座中就如何开展学术研究提出了很好的建议,并倡议学者们要保持“学术独立、思想自由”之精神,营造学术界自由辩论之风气,体现学者们的价值,十分鼓舞人心。同时,在一系列研究的基础上,陈钊教授跟学员们分享的中国问题研究的经验,令学员们受益匪浅。

简报(10) 陆方文:随机实地实验——方法和运用

2020年8月4日下午,中国人民大学陆方文教授为上贸大-YES“应用微观计量经济学”暑期学校做专题报告,主题是“随机实地实验——方法和运用”。陆方文教授基于大量文献和自己的研究,为学员们详细介绍了随机实地实验的研究方法及其在世界和中国的应用。
陆方文教授从2019年诺贝尔经济学奖讲起。在Abhijit Banerjee、Esther Duflo和Michael Kremer三位学者因“在减轻全球贫困方面的实验性做法”而获奖之后,随机实地实验立即受到了前所未有的关注和争论。事实上,实地实验在2017年就曾作为“配角”获得过一次诺奖:虽然Richard Thaler的获奖理由更多是由于他对行为经济学的研究贡献,但在其理论的实际应用方面,助推实验是一个很大的亮点。与此同时,也有一些经济学家始终对随机实地实验方法持批判态度,例如2015年因对消费、贫困和福利的分析而获得诺奖的Angus Deaton就是一位批判者。还有学者早先批判随机实地实验方法,但后来又改变了看法,在自己的研究中积极运用这一方法。2000年诺奖得主James Heckman就是一位这样的学者,当前他正在进行有关儿童早期发展的实验研究。因此,我们有必要对随机实地实验的基本原理及应用有一个更加全面的认识和了解。
随机实地实验(Randomized Field Experiment)是在现实社会中运用随机分组方式开展的干预实验。陆方文教授以节能宣传对家庭消费有什么样的影响为例,介绍了随机实地实验的五个步骤:第一步,确定实验对象;第二步,进行随机分组,这是随机实验的核心环节,目的是通过消除实验前不同组别之间的系统性差异以实现可比性;第三步,实施干预措施;第四步,收集结果信息;第五步,进行数据处理分析并得出结论。
随机实地实验方法的优势主要有两个方面,可信性和创新性。可信性主要源于随机分组。实证研究中内生性问题无处不在,而随机分组有助于解决一些其他计量方法受到局限的内生性问题,使研究结果更可信。创新性主要在于如何实施干预措施。无论是其他人没有想到过的措施,还是大家想到过但还没有实施的措施,都可能成为创新的契机。尤其是有一些机制的探讨在现实中很难等到机会,需要设计实验才能进行分析。
陆方文教授在讲座的第二部分介绍了2019年诺奖得主的主要研究。Kremer基于在肯尼亚农村的学校层面上进行的随机干预,进行了一系列关于驱虫项目的研究,包括驱虫项目是否有影响,驱虫项目在完全补贴的第一推动力之后是否有持续效应,以及驱虫的长期影响等。Duflo进行了大量关于扶贫的实验研究,涉及教育、健康、生产等与扶贫有关的各个方面,部分研究是与Banerjee合作的。其中,教育方面的研究包括补课教育、学生分班、教师激励、教育管理等。健康方面的研究包括节能环保炉子、防疫接种、补铁、自来水、HIV与早孕、护士的激励等。生产方面的研究包括化肥的使用、小微信贷等。
此外,这些研究者还将随机实地实验方法应用在很多非扶贫类的研究领域中。Duflo and Saez (2003) 研究了信息和社交对养老储蓄的影响。Duflo et al. (2013) 研究企业自主雇佣的环评是否存在问题,即环评公司和污染企业的勾结问题。Crepon et al. (2013) 分析了就业帮扶的一般均衡效应,不仅检测就业帮扶对直接获得就业帮助的影响,还检测了获得就业帮助比例对其他求职者的影响。
陆方文教授在讲座的第三部分以文献中的一些实验和自己进行的一系列实验研究为例,介绍了随机实地实验在中国的应用。随机实地实验与“中国式试点”的共性是创新——对新措施的尝试和实施,但区别是随机实地实验措施更明确、样本更大、评估更规范。
随机实地实验在中国经济学研究中的应用已有十多年的历史。Cai et al. (2009) 通过大图与注释的菜单实验,发现社会学习是从众行为背后的重要机制。Grant et al. (2012) 基于学校层面的随机安排,发现对校长的奖励措施有助于降低学生的贫血症率。Du et al. (2020) 通过对P2P平台的借款人进行随机分组的实验,发现“正向期待”信息对还款促进作用显著且持续长久,而“负面后果”信息只在短期内对还款有促进作用,其长期效果不明显。
陆方文教授详细地介绍了她运用随机实地实验方法所进行的一系列研究。第一个研究是关于医保,通过随机实地实验分析医生在以药养医的激励之下的行为动机,并通过动机推断福利效应。第二个研究是关于学生的同群效应,通过随机安排座位的实验设计,研究了座位前后同学间的影响这种小微环境下的同群效应。第三个研究是关于学生担任班干部的影响,研究问题非常新颖,但随机安排的实施存在一定的困难。研究中采用的解决方案是先让班主任给每个职位指定两位候选人,然后在老师可接受的人选中二选一,从而估计出了担任班干部对不同学生的影响。第四个研究是关于手机短信干预安全驾驶的效果,有一组文章发表在JEBO、JPubE、JDE等很好的期刊上,通过实验分析了一般性惩罚信息和针对性信息的作用、阶层基础上的社会比较、互动式管理的作用等多个方面的机制。
总的来说,目前随机实地实验在国内经济学研究中的运用还不是很多,但潜力非常巨大。中国有大量的潜在政策试点、大量的新鲜事物,研究机会很多,通过更加便捷的干预方式和数据收集方式可以进行很好的研究。
陆方文教授在讲座的第四部分为学员们介绍了随机实地实验的具体实施方法:
(1)确定研究问题和实地背景。研究问题包括探讨新方法、识别现实和两者混合这三种类型,在实际操作中可以进一步分解为直接影响、影响机制、溢出效应、长期影响和不同干预的交互作用。确定研究问题以后,实地背景的选择非常重要,需综合考虑以下四个问题:研究群体的现状如何;干预措施能否有效实施;干预组和控制组能否有效隔离;数据能否有效收集。
(2)设计实验过程。完整的实验应包含选择样本量、确定随机层次和方式、安排干预和收集数据。样本量可以通过最小可测效果推测;随机层次需要结合考样本量、溢出效应和操作难度等因素来确定;随机方式包括简单随机、分组随机和匹配随机;实验干预可以分为并列的干预和多维度的干预;最终数据同时包括实验前和实验后的样本信息,可以通过直接测量、问卷调查、他人评价以及各种各样的游戏来收集,控制组和干预组的收集方式必须相同。
(3)分析数据。在分析实验结果之前,一般需要提供关于分组是否随机的检验。一种可行的方案是用尽可能多的实验前的样本信息对干预组的虚拟变量做回归,系数不显著则说明随机分组是有效的。在随机分组的基础上,对实验效果的评估相对比较容易进行。此外,陆方文教授还介绍了在出现不完全服从、样本损耗以及多重假设检验问题时的各种应对措施。
(4)实验中的道德问题。陆方文教授强调了实地实验所应遵守的道德规范,包括不能伤害实验对象、避免危害社会、杜绝欺骗行为、严禁强制进行,以及涉及到人体内部的实验需要签订同意书等。
陆方文教授的精彩报告基于丰富的文献和生动的案例,向学员们展示了随机实地实验广阔的应用领域,并细致地讲解了实地实验的具体实施方法,使学员们对这一研究方法有了更加清晰和全面的了解。

简报(11) 方颖:宏观社会经济政策评估的方法与应用

2020年8月6日上午,厦门大学方颖教授为上贸大—YES“应用微观计量经济学”暑期学校做专题报告,主题是“宏观社会经济政策评估的方法与应用”。方颖教授通过严谨细致的理论模型,并结合自己和团队所做的具体研究,向暑期学校的学员们分享了评估宏观经济政策的理论方法和应用。
首先,方颖教授详细介绍了鲁宾因果模型的基本框架,梳理了潜在结果、观察到的结果,以及平均处理效应ATE、处理组平均处理效应ATT、分位数处理效应QTE等基本概念和参数。方颖教授指出,估计处理效应的最大挑战是Y(1)和Y(0)只能观测到一个,因此政策识别需要满足条件独立性假设,即:给定能观察到的变量,决定谁来接受处理的分组是随机的。然而,在对现实社会经济政策的评估中,分组可能受到同时影响潜在结果和分组的不可观测因素的影响。
如果分组满足条件独立假设或是条件均值独立假设,可以通过基于回归的方法、逆概率加权方法(IPW)、双重稳健估计方法、匹配估计方法、分位数处理估计方法估计出因果效应。当条件独立假设不成立时,则可以通过双重差分法(DID)、工具变量法(IV)、Heckman两步法(Heckit)等方法估计出因果效应。但这些方法虽然能在一定程度上处理条件独立假设不成立的问题,也有其相应的代价,例如需要额外的条件才能识别,估计时会受到某些条件的限制,或者识别出来的结果的可解释性会受到一定的影响等。例如IV方法只能识别顺从者的局部平均处理效应,而非所有样本的平均处理效应。
接下来,方颖教授具体介绍了如何用计量方法对宏观经济政策进行评估。评估宏观政策通常使用时间序列数据,因此方颖教授对鲁宾因果模型框架进行了动态化扩展,将潜在结果、平均处理效应和条件独立假设分别扩展为动态潜在结果、动态平均处理效应和动态条件独立假设。这样,在满足动态条件独立假设时,可以用逆概率加权、双重稳健估计等方法来估计动态因果效应。
动态化的鲁宾模型的一个重要特点是模型中的概念可以和如DSGE的传统宏观模型的经济概念对应起来,这样就为利用计量评估方法分析宏观经济政策奠定了基础。传统宏观模型是通过在t期施加一个外生冲击,用得到的对各变量的脉冲响应函数来评估宏观政策,方颖教授通过对两种方法的推导结果的比较,展示了计量评估方法中的动态处理效应和传统宏观模型中的脉冲响应函数存在一一对应的关系。
与传统宏观模型相比,宏观经济政策计量评估方法还有两个方面的好处。好处之一是可以提高模型的稳健性。传统宏观模型对建模要求较高,需要同时对政策决定和产出进行建模,只要有一个建模过程出现误设问题,就可能出现不可靠的结果。与之相比,宏观经济政策计量评估模型不需要对产出建模,只需要对政策决定建模,模型依赖性大大减少。
宏观经济政策计量评估方法的好处之二是可以评估政策建模的效果。由于政策决定模型的建模好坏可以反映为条件独立性是否成立,因此,可以形成自我检验的闭环:通过找到一组和政策变量Dt独立的辅助变量Zt,检验条件独立性是否得到满足,来验证建模的好坏。
最后,方颖教授分享了两个具体的评估宏观政策的例子。一是使用单一时间序列数据。方颖教授及其合作者采用宏观经济政策计量方法评估了货币政策与宏观审慎政策对金融稳定的效应。为了量化政策效应,他们构建了金融稳定指数、货币政策指数、宏观审慎指数三个指标,并分析了各种宽松和紧缩政策的选择组合的实际效应;在对政策决策的倾向得分估计上,他们选取了158个宏观经济变量的月度数据,用多元惩罚逻辑回归模型对货币政策和宏观审慎政策的决策机制进行了分析。文章得到了与DSGE等传统模型分析效果一致但更加稳健的结果。
第二个例子是使用面板数据对政策进行评估。萧政教授在2012年提出了一种利用面板之间在横截面的相关性做政策评估的方法。应用这个方法,方颖教授及其团队评估了激进的经济政策对三年自然灾害期间的农业产出的影响。由于农业产出同时受到了自然气候冲击和激进政策的影响,他们利用日照、降水等因素构建了气候相似矩,用日本面临相似气候冲击的各县的产出数据来进行匹配,预测出未受激进政策影响的农业产出,从而估计出激进政策对农业产出的影响。
方颖教授在本次讲座中简洁而又清晰地讲解了评估宏观经济政策采用的理论方法,并以自己做的两个研究为例介绍了方法的精彩应用,讲座内容充实,逻辑严谨,令学员们受益匪浅。本次讲座圆满结束。

简报(12)刘瑞明:“何处寻求大智慧:漫谈经济学研究选题的原则与方式”

2020年8月6日下午,中国人民大学刘瑞明教授为上贸大-YES“应用微观计量经济学”暑期学校做专题报告,主题是“何处寻求大智慧:漫谈经济学研究选题的原则与方式”。刘教授此次讲座讨论的问题是很多学者和学生的普遍痛点:即使充分掌握了经济学的知识与方法,但是仍然不知如何下手和选题。刘瑞明教授强调,一个好的选题几乎是成功的全部,好的选题是1,其它都是0,但是很多青年学者和学生普遍没有在选题上投入足够的功夫。刘教授在接下来的讲座中分八个部分层层推进,又生动有趣的介绍了一个好的选题的标准、原则和策略方法。
首先,刘瑞明教授指出了一个好的选题的重要性。选题直接决定了论文的成败和层次,但是选题是非常有难度的一件事情:选题的背后是问问题,问题的背后是思维方式、品味和境界。当今学界在理论与方法以及现代经济学前沿的普及方面已经取得卓越的成效,但是选题却是绝大部分研究者的短板。这是因为,如何进行选题是默会知识,默会知识不同于显性知识,仅仅依靠阅读别人的论文和成果很难融会贯通成为自己的本领。
接下来,刘瑞明教授详细介绍了一个好的研究选题应该符合的八个I原则(“Eight I”),即研究的创新性(Innovative)、问题的重要性(Important)、话题的趣味性(Interesting)、识别的科学性(Identifiable)、洞见的深刻性(Insightful and Informative)、认知的一般性(International)、联想的丰富性(Imaginative)以及文章的可行性(Implementation)。第一、研究的创新性,具体而言,可以从理论、方法、领域以及素材这四个方面作出创新。第二、问题的重要性,涉及理论的重要性以及现实的重要性,这两者本质上并不冲突,只是要学会区分、平衡和转化。第三、研究的话题一定要有趣味性,否则会减少阅读和研究的欲望。但是,追求趣味性切忌东施效颦,真正的有趣应该建立在重要性和创新性的基础上,而不是刻意的有趣。第四、好的研究必须要满足识别的科学性这个基本要求,特别是对于实证文章而言,研究设计是文章的灵魂和核心,实证研究通常围绕着“无偏”“有效”“一致”展开,而其中最重要的就是要有科学的识别。第五、好的研究还应该具有深刻性;应以小见大,见微知著,洞见深刻,富有启发,在理解论文相关的问题后还能让人得到其它更深刻的认知。第六、好的研究应具有一般性和延拓性。研究的解释力是检验理论有效性的重要法则,好的理论应当具有普世性,能够解释足够广的现象,带来一般的启示。当然,一般性的理论也要结合具体情况,特别是应用的时候也要注重特殊性。第七、好的研究应给读者带来丰富的联想力,充足的启示性,激发读者更多的思考和大量后续研究,而不是仅仅局限于某一个具体问题。好的研究应回味悠长,常读常新。第八、文章的可行性是论文最基本的要求,失去了可行性,一切工作都没有意义。而一个好的选题决定了这八个方面,因此一个好的选题几乎意味着一切。
而一个好的选题从哪里来呢?刘瑞明教授分享了好的选题的四大来源:文献启发、学术交流、实地调研以及生活体悟。第一、文献启发,这种方式可以帮助学生和研究者了解热门的话题,并且成本低,速度快,但与此同时,也往往容易导致新意不足,使思维局限于作者的思路,或者出现简单套用外国文献到本国情况而产生的“东施效颦”的问题。第二、学术讨论,通过思想火花的碰撞,可以帮助自己想到自己看不到的问题,但这就要求勇于“不耻上问”,主动不停的向高手和同行请教,进行思想碰撞。第三、实践调研,实践调研得出的问题真实、重要、有趣,但这要求对理论以及方法论掌握得足够好。第四、生活体悟,生活即学问,学问即生活,从生活中体悟是高境界,但这种方式对个人智慧要求极高,如果对真实经济社会运行的理解不足,则很难把真实世界中的观察上升到理论高度。这四种方法并不冲突、互为补充,但都要求对相关方法与理论掌握熟练。
在第四部分中,刘瑞明教授进一步提出了选出一个好的选题的关键:观察能力,抽象能力和提炼能力。选题首先需要观察,观察到问题是第一步。其次需要是抽象和提炼能力,而这需要基于对理论与模型的理解,如果理解和抽象不到位,就可能造成模型繁杂,或者对于所提炼元素的关键与否的把握有所偏差。而这也是一个默会知识,单纯阅读文献只能看到最后的成品,无法得知研究背后的过程,也就很难真正的得到能力的提升。此外,抽象和提炼的内容需要根据研究目标而定。刘教授根据构建地图的例子讲述了如何从现实提炼成模型。模型作为对现实世界的抽象和理解现实世界的“地图”,其好坏不能简单以是否符合现实来评判,而是需要针对具体的分析目的来评判。
在第五部分中,刘瑞明教授通过模拟了一个学生与老师讨论实证选题的场景的案例生动的讲解了好的选题的九重境界。从最开始学生可能问了一个错的问题,到问了一个不错但难以识别的问题,再到问了一个可识别的但不干净的问题……到最后第九重境界:干净的识别策略、丰富的机制检验、合理的异质性、机会成本思维、最重要的问题以及最深情的关怀。最高的境界,即回到经济学的经世济民的本质,通过用理论阐释世界,来回答怎样让人类从贫穷走向富裕,让世界变得更好的问题,这也是古往今来做出经典理论贡献的经济学家们的初心和深层驱动力。
之后,刘瑞明教授以一系列具体文章为例,通过对经典文献的一一解读以及对本人的研究经验的总结,介绍了什么是好的选题和研究。
在第七部分中,刘瑞明教授指出了有关选题的一些实用策略与误区。首先,论文选题前要有充足的知识储备,细观察,勤推理。对于中国问题而言,更要着重观察“特征性事实”。而对于选题中常见的几种典型问题,刘瑞明教授也给出了几种解决办法。此外,刘瑞明教授还指出了有关选题的几大误区,比如不重视基础理论、不认真阅读文献、不进行学术交流、不去了解现实世界、凑热闹追热点、缺少对问题的品味、根据预设结论硬凑结果、为了创新而“创新”等。
最后,刘瑞明教授总结了经典文献的特点:绝妙的想法、宏大的叙事、精巧的识别、严谨的分析、精彩的辩护和优美的语言。而如果要学会选题,其中简单而有效的道理就是“孰能生巧”及“不耻上问”,以开放的心态学习,取得最快的进步。
讲座结束之后,刘瑞明教授耐心解答了学员们对于选题和论文写作的各种困难和疑惑。论文选题是个永恒的问题,刘瑞明教授用个人的观察及经验为暑期学校的学员们带来了一场内容丰富且发人深思的讲座,学员们反响热烈,受益匪浅。本次讲座圆满结束。

简报(14)马光荣:应用微观计量的一个基本问题及其解决方案

2020年8月7日下午,中国人民大学马光荣教授为上贸大-YES“应用微观计量经济学”暑期学校学员做了一场题为“应用微观计量的一个基本问题及其解决方案”的学术讲座。本次讲座围绕“显著性”这一实证研究中不可回避的关键词展开,讨论了研究者面对相关问题时应该如何处理和反思。
马教授首先以估计教育回报率为例简要介绍了如何判断显著性。在回归分析中,可以通过计算t统计量,即解释变量(受教育年限)系数点估计值和标准误的比值,判断点估计值是否统计上显著异于0。基于t统计量,不显著源于点估计值太小或者标准误太大。前者可能因为研究问题经济意义不足或者存在内生性问题。后者可能因为样本量太小、解释变量方差太小或者扰动项方差太大。
接下来,马教授从数据、研究设计和结果报告等视角给出了合理追求显著性的若干提示:
提示1:使用大样本数据。根据大数定律,样本量不够大对回归结果的影响可能有三个方面:第一,估计结果不能反映总体特征;第二,标准误太大,统计显著性不过关;最后,离群值对估计值的干扰过大。使用大样本数据,不仅可以有效缓解上述问题,还能向审稿人发送工作量扎实的信号。
提示2:解释变量的变异要足够多。这是实证研究的必要起点。只有变异足够大,估计结果才会精准。此外,变异应该是外生的,才能避免内生性问题。
提示3:避免拟合太差,一定要清洗数据、描述数据。在应用数据进行计量分析之前,应首先详细描述相关变量,检查是否有错误或者离群值。
提示4:使用干净的度量指标。如果被解释变量有测量误差,且误差和解释变量不相关,那么系数估计值是一致的,但标准误会变大。如果解释变量有测量误差,系数估计值会不一致,存在衰减性偏误。
提示5:控制变量对显著性的影响。如果控制变量与被解释变量和解释变量都相关,不加入会导致遗漏变量问题,使得回归系数有偏,当然也会影响统计显著性。但是,如果控制变量是解释变量影响被解释变量的中间机制,则不应该加入回归。
提示6:标准误通常要聚类(cluster)。仅仅使用稳健标准误,回归结果的显著性仍有可能是虚伪的,因为稳健标准误假设标准误是独立的,但现实中不存在完全独立的个体。此时,应使用聚类标准误。通常情况下,聚类的层级越高,标准误越大。实际操作中,基于面板数据的研究应至少将标准误聚类到个体层面,基于横截面数据的研究应将标准误聚类到比个体更高的层面。如果解释变量和被解释变量不在同一层面,标准误应聚类到更高的层面。
提示7:既看统计显著性,又看经济显著性。两者都是实证研究中必须关注的问题。一般情况下,经济显著性越高,即点估计值的绝对值越大,统计显著性也越大。但例外也可能存在。当样本非常大时,点估计值的标准误可能很小,使得回归结果经济不显著但统计显著,反之,如果样本非常小、存在离群值或者解释变量变异较小,标准误可能很大,导致经济显著但统计不显著。两种情形下,对回归结果的描述都应慎重,不能简单地根据统计显著性下结论。
提示8:怎样判断经济显著性?没有明确的标准,可以将点估计值与被解释变量的均值对比,也可以考察解释变量变动一个标准差会导致被解释变量变动几个标准差。
此外,马教授还讨论了显著性与R平方之间的关系、加入交互项时显著性的判断以及工具变量方法当中的显著性问题。
最后,马教授表达对学员们未来研究工作的祝福。马教授的讲座层次分明,旁征博引,既直面了学员们研究中最关注的问题,又启发了学员们的深层思考。

简报(15)聂辉华:想象力、侦探与经济学:以矿难研究为例

2020年8月9日上午,中国人民大学聂辉华教授为上海“应用微观计量经济学”研究生暑期学校做专题报告。聂辉华教授提出经济学研究需要丰富的想象力,也需要向侦探学习“大胆假设、小心求证”的科学精神。以矿难研究为例,聂教授向与会学员分享了自己是如何将这一理念运用到经济学研究中的。
讲座伊始,聂教授指出,除了精妙的模型、扎实的计量、丰富的数据以外,想象力也是让经济学研究更加精彩的重要因素,却往往被传统的教学和实践所忽视。事实上,想象力不仅造就了《西游记》、《权力的游戏》、《三体》等精彩绝伦的文学作品,也让经济学家能够涉足一些无法亲临现场的研究,从而一定程度上打破“没有调查就没法有发言权”的枷锁。例如,已成往事的经济史研究(西方世界兴起、官债荐举、大饥荒等),难以涉足、更不可能开展田野实验的风险研究(贩毒、矿难、食品安全等),无法亲身观察当事人动机和行为的政治经济学研究(官员晋升、腐败、政企关系等),这些都需要经济学家根据史料或现象展开想象,“大胆假设,小心求证”。而能够做到这一点,还需要研究者破除观念里的条条框框,虚心接受新观点并加以思考。
“大胆假设”是开展研究的第一步,“小心求证”则是使研究落地的关键。经济学家的“小心求证”,实际上就是因果推断。聂教授指出,经济学家要向优秀的侦探学习,成为因果推断的高手。从重视逻辑关联、追求行为人利益最大化以及善于进行成本收益分析的角度,经济学研究与刑事调查本身就很相似。然而侦探可以根据行为动机、犯罪时间等形成“硬核”证据链,经济学家在因果推断中却往往难以排除其他所有可能。尽管如此,优秀的侦探仍有诸多值得经济学家借鉴之处。例如,侦探往往十分强调行为人的动机,经济学家也可以更多地关注行为主体的不同动机及其形成背景,而不要过多地被同质偏好的假设所束缚;侦探通常会提出多种可能再通过“不在场证据”一一排除或证实,经济学家也应该思考各种竞争性假说,并通过实证方法一一检验,虽不能穷举,也尽可能地排除其他可能。聂教授强调,经济学研究虽不如侦探“硬核”,却不能放弃对“硬核”的追求。
最后,聂教授以矿难研究为例,阐述了他在研究工作中对上述理念的运用。聂教授受电影《盲井》启发,又结合中国矿难发生率和死亡率远高于世界平均水平的现实,形成了对矿难发生原因的研究兴趣。已有研究提出的投入不足论、中小煤矿论、产权模糊论和工人素质论等解释均有与现实不完全契合之处,聂教授大胆假设,提出了“政企合谋”的解释。具体而言,地方政府为了追求GDP,默认乃至鼓励企业采取不安全、不环保、不干净的技术进行生产,从而埋下了矿难隐患。然而这一观点在“小心求证”时存在一定的困难——我们并不能直接观察政企合谋的行为。对此,聂教授以主管安全的副省长是否本地人作为合谋成本的代理,提出了两条待检验假说:(1)在分权条件下,合谋更容易发生,从而矿难死亡率更高;(2)在分权条件下,合谋成本越低,合谋越容易发生,从而矿难死亡率越高。最后,聂教授利用省级面板数据检验了上述假说,并回应了数据造假、反向因果、遗漏变量、测度误差等质疑,完成了“小心求证”的工作。
聂教授以其丰富的经济学素养和严谨的经济学思维,向与会学员展示了经济学研究也可以如此富有生机和活力。通过本次讲座,与会学员从新的角度加深了对经济学的理解——学习经济学,要有想象力和质疑精神,也要学习侦探的因果推断方法小心验证。

简报(16-1)江艇:因果推断方法系列讲座(1)——被控制的艺术

2020年8月9日下午,中国人民大学江艇老师为上贸大-YES“应用微观计量经济学”暑期学校作因果推断方法专题系列的第一场报告,主题为“被控制的艺术”,主要讲解在各种实证方法中的控制选择,为后续讲座奠定基础。
在第一部分,江艇老师讲解了在随机试验中的控制。首先,江老师以使用电脑是否有损学习成绩一文(Carter et.al, 2017, EER)为例,说明了控制变量与核心解释变量不相关,但因为可观测且能直接影响被解释变量,因而加入方程能提高回归的整体拟合度,减少核心解释变量系数估计的标准误,从而提高统计显著性。其次,江老师以治疗传染病以提高教育参与率一文(Miguel & Kremer, 2004, ECMA)为例,阐述了控制变量能提高随机试验中因果识别的可信度。
在第二部分,江艇老师讲解了在观测性研究中的控制,内容涉及到固定效应、匹配、工具变量、双重差分以及回归断点设计中的控制等。江老师特别阐述了匹配方法与包含控制变量的线性回归方法之间的联系与差异。匹配方法是指:观测在X相同的子样本内的组间均值差异从而得到子样本内的平均因果效应,再根据不同子样本的规模将平均因果效应加权,得到整个样本的平均因果效应。包含控制变量的线性回归方法是指:先假定E(Y|D=1,X)和E(Y|D=0,X)的函数形式,再使用线性回归分别对处理组和控制组进行估计并计算条件期望的差异。尽管属于不同的控制策略,但两种方法具有相同的识别假设,即给定可观测变量后,近似看作随机试验,即残余扰动项与核心解释变量不相关。江老师在这一小节总结了两点启示:首先,对研究情景的充分认识和对控制变量的妥善选择,优先于条件策略的选择;其次,要把握匹配的思想,即找到相似的控制组个体,其实质依旧是“良好的控制”。
之后,江老师阐述了在IV、DID以及RD方法中的控制。
首先是工具变量方法中的控制。工具变量方法通过考察非所带来D的变化来研究“保持ε不变,D由0变到1”的因果效应,并需要满足相关性、外生性以及排斥性约束等三个条件。江艇老师以奴隶贸易与人际信任(Nunn & Wantchekon, 2011, AER)一文为例,说明了工具变量方法中的控制变量能够使排斥性约束更容易满足。为研究种族历史上奴隶贸易情况对个人信任程度的影响,作者将种族离海岸线的距离作为核心被解释变量的工具变量。为了尽可能满足排斥性约束,作者控制了殖民统治、农业生产方式、离古贸易网络距离等可能影响途径,使识别结果更为可信。
其次是双重差分方法中的控制。为得到处理组个体在接受处理后的平均因果效应,通常采用反事实趋势插值的方法,这就需要假设控制组的趋势与处理组假若未接受处理的反事实趋势平行。然而,现实中我们只能通过两组在接受处理前的趋势平行来进行间接检验,但控制变量能够使识别更不易受到混淆性时间趋势的影响。
最后,江老师讲述了回归断点设计中的控制。一方面,通过控制驱动变量,我们能够更加清晰地识别完全或部分受到驱动变量影响的核心解释变量对被解释变量的因果效应。另一方面,通过控制可观测变量,被解释变量的跳跃完全是由核心解释变量造成的假设可以更好的满足。
江艇老师在本次讲座中以丰富的研究实例和简洁明了的数理模型讲解了因果识别中控制变量选择的重要性及方法,使学员重新认识了控制变量这一基本但却重要的工具。
下面这些短链接文章属于合集,可以收藏起来阅读,不然以后都找不到了。

2.5年,计量经济圈近1000篇不重类计量文章,

可直接在公众号菜单栏搜索任何计量相关问题,

Econometrics Circle




数据系列空间矩阵 | 工企数据 | PM2.5 | 市场化指数 | CO2数据 |  夜间灯光 | 官员方言  | 微观数据 | 内部数据计量系列匹配方法 | 内生性 | 工具变量 | DID | 面板数据 | 常用TOOL | 中介调节 | 时间序列 | RDD断点 | 合成控制 | 200篇合辑 | 因果识别 | 社会网络 | 空间DID数据处理Stata | R | Python | 缺失值 | CHIP/ CHNS/CHARLS/CFPS/CGSS等 |干货系列能源环境 | 效率研究 | 空间计量 | 国际经贸 | 计量软件 | 商科研究 | 机器学习 | SSCI | CSSCI | SSCI查询 | 名家经验

文章有问题?点此查看未经处理的缓存