功夫计量经济学

其他

PCA降维大法 | 如何使用主成分分析方法构建综合指标?

在经济学领域,已有不少论文使用了主成分分析方法来构建综合指标,诸如经济高质量发展水平、普惠金融发展水平等等。主成分分析作为构建综合指标的一种常用方法,其具体做法究竟是怎么样的呢?本期将为大家揭开其神秘面纱!PCA思想主成分分析(
2023年7月25日
其他

最食人间烟火色:哪里会提供经济学论文可供复制的数据和代码?

有时候,我们看到一篇很好的paper,可能就很想用数据和代码复制出结果。我记得我们学院有不止一位老师说过,论文写作不是教出来的,学习和模仿TOP期刊的论文就是最好的方法,在此基础上,我们再谈自己的创新之处。可能有很多朋友都在学习DID、RDD和IV等这些主流的微观计量方法,我个人认为最好的学习方式就是找到一篇TOP期刊论文的数据和代码,从头到尾实现一遍。之前跟大家分享过一些获取论文的数据和代码的途径,我在那篇推文的基础上进行了一些修改和补充,今天发出来,希望能帮助到大家!一、期刊官网国外经济学TOP期刊基本上都会要求作者提供论文的原始数据和代码,既能约束学术不端行为,帮助现有的研究不断进步,也能保护作者的知识产权。我知道的就有如下这些经济学TOP期刊:American
2023年5月11日
其他

非同寻常:连续DID的识别策略

在标准DID模型中,政策分组变量是一个二值虚拟变量,这种设定仅仅体现的是个体实行政策与未实行政策的区别,无法体现出程度的变化。有些情况下,不同个体受政策影响的程度是不同的,也就是说地区(个体)维度的变化并不是从0到1的变化,而是一种连续型的变化。根据这一思想,「我们其实可以将地区(个体)维度的政策分组虚拟变量替换为一个连续型变量,用以反映程度的变化」,从而也就衍生出了一种扩展的(准)DID模型——连续型DID。如果你只知标准DID,不知连续DID,那么你在使用DID模型进行政策(事件)效应评估时就会非常受限,世界上哪儿有那么多非黑即白、非0即1的事情,像开发区设立、高铁开通这种0-1类型的简单政策大家都已经做的很多了,并且机制都已经很清楚了,想要做出创新实在太难了。我们可以把眼光放在一些复杂的事件和政策上,如传染病(新冠疫情)、大饥荒、知青下乡等,这种类型的事件(政策)相当多,「其特点是全域普遍受到影响,各地受影响的程度不同,我们无法找到“绝对的”实验组和控制组」,因而不太适合使用标准DID模型进行政策(事件)效应评估,这时候就该连续DID“粉墨登场”了。当然,你可以以某一标准“一刀切下去”,划分出“相对的”实验组和控制组,只是这样就全然不如使用连续DID的识别策略合适了。之前给大家推荐过一些top期刊上发表的DID论文,其中很多篇都使用了连续DID的识别策略,阅读之后你就会发现这些论文都不是简单的差分,都是针对事件(政策)进行了非常独特的研究设计,故事与方法相得益彰,阅读它们就像在观摩一件精妙绝伦的艺术品一样。❝「推荐论文」[1]Chen
2022年11月16日
其他

“明星”指标TFP:如何测算企业全要素生产率?

如果使用中国工业企业数据库计算企业TFP的话,那么一般是使用如下几个指标:变量指标产出Y工业增加值劳动L从业人员规模/工资、雇员补贴和失业保险的总额资本K固定资产净值中间投入M中间投入合计
2022年10月16日
其他

三寸不烂之舌:如何说明工具变量的合理性?

工具变量法(IV)是解决内生性问题的一种经典方法,规范地对工具变量的合理性进行说明是一篇IV论文至关重要的部分。不过,我也看到了很多没有对工具变量的合理性进行说明的论文,有些还是发表在所谓的“CSSCI”上面,看破不说破,大家应当明白这是什么情况。工具变量需要满足两个条件:(1)工具变量的相关性:工具变量需要与内生解释变量相关。(2)工具变量的外生性:工具变量不能与扰动项相关。换言之,除去内生解释变量这个唯一的途径,工具变量不会直接或间接地影响被解释变量。相关性其实很好说明,不过外生性就很难说清了。如果存在两个以上工具变量,我们可以采取“过度识别检验”来验证这些工具变量是否符合外生性假设,但是在“恰度识别”(
2022年6月16日
其他

今日份二选一:关于DID平行趋势检验基准组的选择

在普通DID平行趋势检验时,我们需要生成年份虚拟变量与处理组虚拟变量的交互项,然后将这些交互项作为解释变量进行回归。这时特别要注意一点,我们需要丢掉一期,作为基准组。很多朋友一直都不理解为什么要这么做,今天就想跟大家专门解释一下。为什么需要基准组?关于这个问题,你可能看到最多的回答是,从实际软件操作层面来看,不剔除一期作为基准组,就会存在共线性问题,就无法往下做了。但是这一回答还没有触及到问题的“灵魂”上来,我们首先需要明白平行趋势检验是在干嘛。说起来其实很简单,平行趋势检验是在检验处理组和控制组在政策前的时间趋势是否存在差异(DID允许处理组和控制组存在差异,但是二者的时间趋势需要一致),我们需要有一期作为“标杆”(基准组),然后将其他各期与这一“标杆”进行对比,从而判断处理组与控制组的差异是否随时间发生了显著变化,如果没有一个“标杆”,那可能就是“关公战秦琼”,无从比较了。基期还是-1期?关于基准组的选择,我个人比较推荐的是选择第1期(基期,最开始的一期)或者-1期(政策时点前1期),注意不要选政策当期,因为政策当期已经受到政策影响了,政策后的各期那就更不能选了。❝「使用基期的论文举例」[1]Nathan
2022年6月4日
其他

知否知否?——双重差分法(DID)“大家族”的成员们

双重差分法(DID)是近年来的“学术明星”,常用于各种经济政策的评估。只要有一个政策外生冲击使得我们的被解释变量y在两个维度发生变化,其实就可以考虑双重差分法(DID)。当然,这两个维度一般都是时间维度和地区维度,所以DID常见于面板数据。不过,双重差分法(DID)是一个大家族,除了标准DID模型之外,还存在多种扩展的(准)DID模型,今天咱们就来总结和梳理一下“DID大家族”的成员信息。标准DID标准DID是“DID大家族”的基础,也是最容易理解和学习的一种DID模型。双重差分顾名思义,就是要做两次差分,一次是时间维度上的,一次是地区(个体)维度上的,在回归中我们可以通过交互项实现时间和地区维度的两次差分。标准DID模型的形式如下所示:其中,是政策分组变量,处理组取值为1,控制组取值为0;是政策时间变量,政策时点后取值为1,政策时点之前取值为0。交互项的系数反映的就是经过两次差分后得到的“纯净”的政策效应。推荐阅读论文David
2022年5月24日
其他

PSM与DID的结合是一段“孽缘”

许久以来,很多朋友都希望我出一期有关双重差分倾向得分匹配方法(PSM-DID)的内容,但我一直迟迟没有动笔。事实上,我个人并不喜欢这一方法,也并不推荐大家使用这一方法,因为PSM-DID压根就不是什么“灵丹妙药”,在应用中问题颇多。也许你在一些top期刊上经常看到PSM-DID的身影,但这并不意味着它就没有问题。双重差分倾向得分匹配方法(PSM-DID)是倾向得分匹配(PSM)与双重差分法(DID)的有机结合(DID是主,PSM是次),但是这一结合事实上就是一段“孽缘”。我们的理想很美好,PSM模型负责寻找与处理组尽可能相似的控制组(根据倾向得分),DID模型负责评估政策带来的影响。图片来源:谢申祥等(2021)论文《传统PSM-DID
2022年2月12日
其他

政策评估『绣春刀』:合成控制法(SCM)的Stata操作

合成控制法是一种数据驱动的方法,适用于评估“试点”较少的政策。它的核心思想是虽然难以在其他没有试点的地区找到合适的反事实参照组,但是通常可以对其他没有试点的地区进行适当的线性组合,构造出一个合成的反事实参照组。Abadie
2022年1月28日
其他

固定效应+聚类标准误是面板数据标配吗?

是的,没错,固定效应+聚类稳健的标准误是面板数据的标配。但是,固定效应和聚类稳健标准误是两回事,二者针对的问题是不一样的,固定效应针对的是遗漏变量问题(个体、时间等异质性),而聚类稳健的标准误则针对的是扰动项聚类(集群)相关的问题。何谓固定效应?固定效应是扰动项中比较特殊的一部分,是代表个体(时间)异质性的截距项,并且固定效应模型假设这一特殊的截距项与解释变量相关。个体固定效应是不随时间变化但随个体而变的的无法观测的因素(个体异质性),而时间固定效应不随个体而变但随时间而变的无法观测的因素(时间异质性)。固定效应无法观测到,但又是面板数据模型必须考虑的东西,计量经济学家的智慧在这里体现无疑,我们可以使用组内均值法通过离差变换将其消去,然后再使用OLS进行估计。对于面板数据,我们通常都会使用双向固定效应模型,个体固定效应解决了不随时间而变但随个体而变的遗漏变量问题,时间固定效应解决了不随个体而变但随时间而变的遗漏变量问题。但是,还存在既随个体而变又随时间而变的遗漏变量问题,所以我们常说面板数据只能在一定程度上解决部分内生性问题,想要“一劳永逸”,还是要使用工具变量方法。具体而言,对于城市面板数据,我们一般都会控制城市固定效应和年份固定效应;对于企业面板数据,我们一般都会控制企业固定效应和年份固定效应,有时还会将企业固定效应放宽为行业固定效应和地区固定效应进行分析。物以类聚?众所周知,异方差稳健的标准误解决的是扰动项存在异方差的问题,而聚类稳健的标准误解决的是扰动项存在聚类(集群)相关的问题。在面板数据中,每个个体不同时期的所有观测值即构成一个聚类(集群)。这样,样本观测值可以分为不同的聚类(集群),比如你使用的是企业面板数据,那么每一个企业就是一个聚类(集群),而聚类(集群)相关指的就是集群内部样本观测点的扰动项存在相关。这一问题是面板数据与生俱来的问题,面板数据相当于是横截面乘以时间序列,所以面板数据既会有横截面数据的问题(异方差),也会有时间序列数据的问题(自相关),同一聚类个体的扰动项天生就有可能自相关。如果存在聚类(集群)相关的问题,那么就会使得OLS估计量的标准误是有偏的,因而我们需要对标准误进行修正。此外,由于聚类稳健的标准误在推导过程中并没有用到同方差假定,所以聚类稳健标准误都是异方差稳健的。当我们使用聚类到企业层面的稳健标准误时,我们施加的假设就是——同一企业不同年份的扰动项之间相关,而不同企业的扰动项之间不相关。这一假设部分符合现实情况,因为影响一家企业经营的干扰因素具有连续性,因而扰动项会存在聚类内部的自相关。但是,同一地区不同企业的扰动项可能是相关的,因为身处同一地区,企业难免会受到相同的干扰因素的影响,所以为了说明估计结果的稳健性,我们通常都会尝试聚类到更高层级,比如县级、地级市层级,让审稿人无法质疑金光闪闪的三星结果。
2022年1月10日
其他

双重差分法(DID)安慰剂检验的做法:随机抽取500次?

“安慰剂”(placebo)一词来自医学上的随机实验,比如要检验某种新药的疗效。此时,可将参加实验的人群随机分为两组,其中一组为实验组,服用真药;而另一组为控制组,服用安慰剂(比如,无用的糖丸),并且不让参与者知道自己服用的究竟是真药还是安慰剂,以避免由于主观心理作用而影响实验效果。双重差分法(DID)安慰剂检验的核心思想就是虚构处理组或者虚构政策时间进行估计,如果虚构情况下“伪政策虚拟变量”的系数依然显著,那么就说明原来的估计结果很有可能出现了偏误,我们的被解释变量y的变动很有可能是受到了其他政策或者随机性因素的影响。说到虚构,那么自然是可以随机虚构,也可以不随机虚构(作者自己设定)。当然,我更推荐的还是随机虚构处理组或者是政策时间的方法。由于我们使用的数据基本都是“大N小T”型的短面板数据,所以随机虚构政策时间没什么意义,文献一般做法都是将政策年份统一提前2年或3年重新进行回归,看看政策虚拟变量系数是否依然显著。我们更多地还是随机虚构处理组,具体做法就是随机选取个体作为处理组,重复500次或者1000次,看看“伪政策虚拟变量”的系数是否显著。数据来源石大千等(2018)发表在《中国工业经济》的论文《智慧城市建设能否降低环境污染》使用DID方法评估了智慧城市建设对城市环境污染的影响,《中国工业经济》期刊官网公布了这篇论文使用的数据和代码。接下来,我就使用这篇论文的数据,给大家分享一下双重差分法(DID)安慰剂检验中随机虚构处理组这种方法的Stata操作。原文信息石大千,丁海,卫平,刘建江.智慧城市建设能否降低环境污染[J].中国工业经济,2018(06):117-135.随机虚构处理组的Stata操作双重差分法(DID)安慰剂检验的一般做法就是随机选取个体作为处理组,重复500次或者1000次,看看“伪政策虚拟变量”的系数是否显著。在石大千等(2018)这篇论文中,处理组有32个城市,控制组有165个城市,所以我们需要从197个城市中随机选取32个城市作为“伪处理组”,假设这32个城市是智慧城市试点,其他城市为控制组,然后生成“伪政策虚拟变量”(交互项)进行回归。重复进行500次,我们就会得到500次回归结果(包含“伪政策虚拟变量”估计系数、标准误和p值),最后我们可以绘制出500个“伪政策虚拟变量”估计系数的分布及相应的p值,直观展示安慰剂检验的结果。说起来很简单,但操作起来还是蛮困难的,我们要解决如下两个关键问题:(1)如何从197个城市中随机选取32个城市作为“伪处理组”,然后生成“伪政策虚拟变量”?因为是面板数据,所以我们首先只保留一期数据,然后使用sample命令从中随机抽取32个样本,保留所抽取样本的id编号,与原数据进行匹配,最终匹配上的就是我们的“伪处理组”样本,未匹配上的就是控制组样本。(2)如何存储500次回归中的估计系数、标准误和p值?在Stata中,我们可以生成三个500行1列的矩阵(矩阵中的元素初始值为0),来分别存储500个“伪政策虚拟变量”的估计系数、标准误和p值。每回归一次,就将估计系数、标准误和p值分别存储到三个矩阵的对应位置。最终代码*-安慰剂检验-虚构处理组mat
2021年12月20日
其他

屡见不鲜的一类Wrong工具变量——组均值

在一些国内外期刊上,我们都能经常看到一些作者在处理内生性问题时,使用组均值(不包含个体)作为变量的工具变量。其中,表示组,表示第组样本数量。这样做的理由是:(1)组内个体的特征会受到组内其他个体的平均值或加总特征影响,即满足工具变量的相关性条件。(2)组内其他个体的平均或加总特征不直接影响个体的结果,即满足工具变量的外生性条件。两个例子:本文选取相同行业同年度内其他公司的社会责任报告净正面语调的均值TONE_meant
2021年11月22日
其他

双重差分法(DID)平行趋势检验绘图的相关操作

DID是近年来的“学术明星”,常用于政策评估领域。DID有一个重要的前提假设——平行趋势假定,规范地对平行趋势假定进行检验是一篇DID论文中至关重要的部分,很多人都不重视这一检验,或者对平行趋势假定有些错误的认识(诸如PSM之后就不用做平行趋势检验)。平行趋势检验的一般做法借鉴的是事件研究法的思想,我们首先需要生成年份虚拟变量与处理组虚拟变量的交互项,将这些交互项作为解释变量进行回归(特别注意要丢掉一期,作为基准组)。交互项的系数反映的就是特定年份处理组和控制组之间的差异(与基准组相比),我们特别希望看到的就是政策时点前的虚拟变量与处理组虚拟变量的交互项的系数不显著,这样才说明在政策时点前处理组和控制组不存在异质性的时间趋势。关于这一部分的更详细内容大家可以去看“中国式DID:不做平行趋势检验的DID不是好DID”和“DID大法:如何用Stata做平行趋势检验”这两篇推文。当然,直接看回归系数可能不够直观,所以我们一般都会根据回归结果绘制出回归系数的取值和置信区间,对政策在不同年份的动态经济效应进行呈现,今天想跟大家分享的就是DID平行趋势检验绘图的Stata操作。数据来源Nathan
2021年11月8日
自由知乎 自由微博
其他

双重差分法(DID)平行趋势检验的Stata操作

双重差分法(DID)有一个重要的前提假设——平行趋势假定,即处理组如果没有受到政策干预,其时间趋势应与控制组一样。很多人不重视平行趋势检验,认为随便跑几个DID回归就完事了,事实上,平行趋势检验是DID的规定动作,规范地对平行趋势假定进行检验是一篇DID论文中至关重要的部分。如果不满足平行趋势假定,那么两次差分得出的政策效应就不完全是真实的政策效应,其中有一部分是由处理组和控制组本身的差异所带来的。数据来源石大千老师等(2018)发表在《中国工业经济》的论文《智慧城市建设能否降低环境污染》使用DID方法评估了智慧城市建设对城市环境污染的影响,《中国工业经济》期刊官网公布了这篇论文使用的数据和代码。接下来,我就使用这篇论文的数据,给大家分享一下双重差分法(DID)平行趋势检验的Stata操作。原文信息石大千,丁海,卫平,刘建江.智慧城市建设能否降低环境污染[J].中国工业经济,2018(06):117-135.时间趋势图平行趋势检验的第一种方法是绘制时间趋势图。通过绘制处理组和控制组的被解释变量随时间变化的平均值,我们可以粗糙地判断处理组和控制组的时间趋势是否存在差异。egen
2021年6月19日
其他

“众里寻他千百度”——工具变量法(IV)的Stata操作

工具变量法是经济学家的神奇创造,是一味解决内生性问题的良药,但事实上,想要找到一个合适的工具变量是相当困难的,工具变量法不需要你有多么高超的计量分析技术,它需要的是丰富的知识结构和突发奇想的艺术创造力。经历王国维先生所说“悬思”和“苦索”两境之后,你才有可能达到“顿悟”之境(众里寻他千百度,蓦然回首,那人却在,灯火阑珊处),找到“她”的身影。之前跟大家介绍过一些经典的、有趣的工具变量以及找寻工具变量的思路,今天咱们来瞅瞅工具变量法的Stata操作,让我们看一个经典的案例!数据说明陈婷、龚启圣和马驰骋三位老师(2020)发表在《The
2021年4月1日
其他

殖民的遗产:通商口岸给近现代中国带来了什么?

正如秦观《鹊桥仙》所言“金风玉露一相逢,便胜却人间无数”,因果推断计量方法与量化历史研究的结合,就是一次美妙的结合。今天跟大家分享的是贾瑞雪老师(2014)年发表在《Review
2021年3月21日
其他

科举万岁!妙哉工具变量也!

有许多计量经济学者都是因为其使用的工具变量而知名。今天给大家分享的是一篇工具变量的好文《Long
2021年3月15日
其他

“电动车”还是“自行车”?| 关于DID平行趋势检验绘图的相关操作(2.0版本)

DID是近年来的“学术明星”,常用于政策评估领域。DID有一个重要的前提假设——平行趋势假定,规范地对平行趋势假定进行检验是一篇DID论文中至关重要的部分,很多人都不重视这一检验,或者对平行趋势假定有些错误的认识(诸如PSM之后就不用做平行趋势检验)。平行趋势检验的一般做法借鉴的是事件研究法的思想,我们首先需要生成年份虚拟变量与处理组虚拟变量的交互项,将这些交互项作为解释变量进行回归(特别注意要丢掉一期,作为基准组)。交互项的系数反映的就是特定年份处理组和控制组之间的差异(与基准组相比),我们特别希望看到的就是政策时点前的虚拟变量与处理组虚拟变量的交互项的系数不显著,这样才说明在政策时点前处理组和控制组不存在异质性的时间趋势。关于这一部分的更详细内容大家可以去看“中国式DID:不做平行趋势检验的DID不是好DID”和“DID大法:如何用Stata做平行趋势检验”这两篇推文。当然,直接看回归系数可能不够直观,所以我们一般都会根据回归结果绘制出回归系数的取值和置信区间,对政策在不同年份的动态经济效应进行呈现,今天想跟大家分享的就是DID平行趋势检验绘图的Stata操作,之前已经发布过一个版本了,今天的是2.0版本,在原来基础上修改和增加了一些内容。数据来源Nathan
2021年3月9日
其他

土豆的魔力:土豆对旧大陆人口增长和城市化进程的贡献

说起土豆,大家都不陌生,土豆作为一种重要的粮食作物,深受老百姓喜爱,土豆丝、土豆饼、土豆泥和狼牙土豆等,都是人民群众喜闻乐见的做法。不过,当你正在思考土豆做法的时候,有人已经发了QJE了。今天给大家分享的是一篇有关土豆的经典DID论文《The
2021年3月2日
其他

DID大法:如何在Stata中实现队列DID操作?

region1990)---------------------------------------------------------------------------------------
2021年2月21日
其他

Cohort DID新作:知识青年上山下乡推动了中国农村教育的发展吗?

DID也有两个维度的变异,通常而言,一个维度是地区,另一个维度是出生(年龄)队列,如果感觉难以理解的话,其实只需把出生队列这个维度理解为时间就好了。今天给大家分享的是一篇Cohort
2021年2月19日
其他

始终如一 | 虚拟变量与美丽的“虚拟变量陷阱”

在研究过程中,我们通常会遇到定性信息,如性别、民族、婚姻状况等。这个时候,就该我们的虚拟变量“粉墨登场”了。虚拟变量可谓是计量经济学中浓墨重彩的一笔,伍老头子《计量经济学导论》专门有一章讲解虚拟变量,微观计量中的
2020年12月12日
其他

使用环境词汇去度量地方政府环境治理:政府工作报告能告诉我们什么信息?

5这些关键词。-在统计完与环境相关词汇出现的频次后,我将每年政府工作报告中这些与环境相关的词汇及其出现频次保存在了excel中。kungfu点击阅读原文即可留言学好计量功夫,练就一身绝技!功夫计量
2020年6月30日
其他

Python词频词云分析:今年的政府工作报告有哪些关键词?

open(r'D:\爬虫下载\2020年政府工作报告.txt','r',encoding='utf-8')content
2020年5月23日
其他

DID大法:多期DID如何做平行趋势检验?

点击蓝字关注我们多期DID中不同个体的政策实施时点不同,所以绘制时间趋势图不是特别方便,加上时间趋势图本身就只是一种较为粗糙的平行趋势检验方法,所以事件研究法(Event
2020年4月29日
其他

DID大法:如何用Stata做平行趋势检验

点击蓝字关注我们昨天给大家推送了DID平行趋势检验的知识,但是光会理论知识不会软件操作也是不行的,计量经济学是一门要与软件结合起来学习的课程,所以,今天就跟大家分享一下在Stata中做DID的平行趋势检验的操作。本来想从中国工业经济上找一篇DID的论文,用他的代码和数据给大家实现一下,但是,中国工业经济上的数据和代码质量良莠不齐,之前提到的那篇智慧城市试点的论文,作者提供的数据和代码就完全对不上,真的不想再说什么了。被逼无奈,就只能使用借用普林斯顿大学构造出来的DID数据来介绍一下平行趋势检验的基本思路。数据中,A、B、C、D、E、F和G是非常相似的7个地区,E、F和G三地在1994年实行了一项新政策,而A、B、C和D则没有实行。如果想要评估这项政策的实施效果,那么使用DID是再合适不过了。不过,想要使用DID就要满足平行趋势假设,因为只有当处理组和控制组在政策前足够相似才能够保证DID估计出的是政策的因果效应。第一种方法就是绘制处理组和控制组的时间趋势图。从图中可以看出,在政策时点之前,处理组和控制组还是具有那么一丢丢的相似性,y都保持着相似的增长趋势,当然这种趋势也只能说有一点相似不能说相同,可能是构造出来的数据的效果不是特别好。总之,这种方法仅凭肉眼观察较为粗糙,想要得到更为准确、科学的结论还是应该使用事件研究法。egen
2020年4月27日
其他

中国式DID:不做平行趋势检验的DID不是好DID

点击蓝字关注我们很多人不重视平行趋势检验,认为随便跑几个回归就完事了,事实上,平行趋势检验是DID的规定动作,这种不做平行趋势检验的DID也常被戏称为“中国式DID”。所谓平行趋势或者共同趋势,也就是说,处理组和控制组在政策实施之前必须具有相同的发展趋势。如果不满足这一条件,那么两次差分得出的政策效应β_3就不完全是真实的政策效应,其中有一部分是由处理组和控制组本身的差异所带来的。平行趋势检验一般有画时间趋势图和事件研究法两种方法。如果平行趋势假设成立,那么在政策时点之前,处理组和控制组应该不存在显著差异。一、时间趋势图画时间趋势图其实是一种比较粗糙的办法,具体做法就是绘制处理组和控制组的y的均值的时间趋势,这种方法简单直观,但是仅能通过肉眼判断处理组和控制组是否存在显著差异,不能在统计意义上准确地判断处理组和控制组是否存在显著差异。使用这种方法的论文相当多。例如,余泳泽和张少辉(2017)在研究限购政策对技术创新的影响时,就绘制了处理组和控制组(即限购城市和非限购城市)的人均发明专利授权量时间趋势图,从图中可以看出,在限购政策实施之前,处理组和控制组(即限购城市和非限购城市)的人均发明专利授权量大致保持相同增长趋势,所以符合平行趋势假设的前提条件。余明桂等研究产业政策对企业技术创新的影响时,也采用的是这种平行趋势检验方法。我们可以发现,在产业政策调整前,控制组和实验组的发明专利大致保持相同增长趋势,而在产业政策调整后,实验组和控制组发明专利和专利总量的增长趋势出现明显地变化。二、事件研究法事件研究法相比画平行趋势图更为准确、更为科学,是更值得推荐使用的平行趋势检验方法。具体做法就是生成年份虚拟变量YEAR与处理组虚拟变量treat的交互项,加入模型中进行回归(M、N分别表示政策前和政策后的期数),那么交互项treat_i×YEAR_j的系数δ_j衡量的就是第j期处理组和控制组之间的差异。在这里还是用智慧城市试点的实例,智慧城市试点是一个单期DID的实例,多期DID做法类似。智慧城市试点是在2012年,作者使用的数据是2005-2015年的地级市面板数据,那么政策时点前有7期,政策时点后有3期。我们就要分别生成2005年、2006年、2007年……2015年与处理组虚拟变量treat的交互项(一共11个),交互项的系数衡量的就是特定年份处理组和控制组之间的差异。具体来说,δ_0为政策当期的效果,δ_(-7)到δ_(-1)为政策之前1-7期的效果,δ_1到δ_3为政策之后1-3期的效果。当然,我们并不是把11个交互项全部放入模型中回归,我们需要选择一期作为参照组,否则会有完全共线性问题,我们一般选择的是政策之前的第1期作为模型的基准组。如果δ_(-7)到δ_(-2)显著为0,那么就说明政策之前第2-7期处理组和控制组之间不存在显著差异,也就是平行趋势假设成立,这当然就是我们最期望得到的。接下来就是进一步通过直观图形方式,对政策在不同年份之间的动态经济效应进行呈现。罗知等(2015)在研究国有企业改制对长期投资的影响时,就是采用的事件研究法进行平行趋势检验,这是一篇标准的DID范文,不存在“中国式DID”的问题。从下图可以看出,系数β_(-6)到β_(-2)在统计上并不显著异于0(95%的置信区间包含了0值),表明国有企业改制前处理组和控制组之间不存在显著差异。这就说明平行趋势假设是成立的,即处理组和控制组在企业改制之前第可比的。参考资料[1]余泳泽,张少辉.城市房价、限购政策与技术创新[J].中国工业经济,2017(06):98-116.[2]余明桂,范蕊,钟慧洁.中国产业政策与企业技术创新[J].中国工业经济,2016(12):5-22.[3]石大千,丁海,卫平,刘建江.智慧城市建设能否降低环境污染[J].中国工业经济,2018(06):117-135.[4]罗知,赵奇伟,严兵.约束机制和激励机制对国有企业长期投资的影响[J].中国工业经济,2015(10):69-84.点击阅读原文即可留言学好计量功夫,练就一身绝技!功夫计量
2020年4月26日
其他

截面DID的玩法:大饥荒影响了人们的储蓄行为吗?

点击蓝字关注我们DID是近些年相当火的计量模型,广泛应用于政策评估领域,大部分人都认为只有面板数据才能使用DID模型,其实不然,截面数据也可以通过巧妙的构造使用DID。程令国和张晔(2011)就使用跨地区和出生队列的变异来构造了截面数据的双重差分模型,估计了1959-1961大饥荒对人们的储蓄行为的影响,从一个新的角度解释了中国家庭储蓄率高企的现象。图片来源:baike.baidu.com(如有侵权,请联系我删除)原文信息:程令国,张晔.早年的饥荒经历影响了人们的储蓄行为吗?——对我国居民高储蓄率的一个新解释[J].经济研究,2011,46(08):119-132.一、引言为什么中国人偏爱储蓄?基于传统的储蓄动机理论、金融发展水平和文化传统等视角均不能完全解释这一现象,与已有文献不同,作者提出了对我国居民高储蓄率的一个新解释。作者认为,人们的消费—储蓄行为不仅受制于预算和商品价格本身,还受制于以往的生活经验和行为模式,我国居民偏爱储蓄的特性很可能与经济起飞前人们遭受长期物质匮乏的经历有关。二、历史背景与理论假设中国历史上一直是个饥荒频仍的国家。而最近一次全国性的严重饥荒出现在1959-1961年,发生大饥荒的原因主要是自然灾害、苏联索债和政策失误。饥荒几乎涉及了中国所有的省份和地区,目前大约年龄在49岁以上的成年人都经历过这次大饥荒。大饥荒造成了深重的灾难,导致死亡率急剧上升。作者推测在这种情况下,大饥荒对幸存者的储蓄行为可能造成了两方面的长期影响:(1)在饥荒中度过童年时期的幸存人群形成了节俭的消费习惯。(2)大饥荒的惨烈记忆,给人们留下了永恒的心理创伤,造成了非理性的预防性心理动机。图片来源:www.rensheng2.com(如有侵权,请联系我删除)三、模型设定在1959—1961
2020年4月10日
其他

吾日三省吾身:内生性问题及其解决方案

点击蓝字关注我们内生性问题具体指的是在回归分析中,解释变量和误差项存在相关关系。内生性问题会使用样本估计的参数偏离总体的真实参数,我们无法得到变量之间真实的因果效应。内生性问题是计量经济学中必须重视无法回避的问题,贯穿计量经济学体系的始终,也是审稿人最容易质疑的问题。我们每天都在与内生性问题作斗争,古有孔夫子“吾日三省吾身”,今天我们同样需要三省,我们的paper或者他人的paper是否存在内生性问题?具体是哪种内生性问题?应该选用什么方法来解决内生性问题?一、内生性问题的来源(1)遗漏变量偏差遗漏变量偏差是指模型设定中遗漏了某个或某些解释变量,并且遗漏的变量还与模型中的解释变量相关而导致的误差。比如在教育回报率的OLS估计中,遗漏了不可观测的能力,能力会影响个体的教育选择,也会影响个体的收入水平。这样,在劳动力市场上观察到的教育对收入的正向影响(即一般OLS估计的结果),很可能包含能力因素(而不能完全归于教育)的影响。遗漏变量是不可避免的问题,因为我们不可能找到所有会影响被解释变量的因素,但只要遗漏的变量与解释变量不相关就万事大吉,因为这种情形不会导致估计不一致。(2)双向因果关系双向因果是指解释变量与被解释变量互为因果,这样也会使解释变量与误差项相关,造成内生性问题。设想我们设定了如下的线性回归模型:但被解释变量y_i也会反过来会影响解释变量x_i:联立两个方程,我们就能得到:这样,第一个方程中的解释变量x_i与误差项u_i相关,因此存在内生性问题。双向因果关系的实例很多。例如,经济萧条可能引起内战,但内战也会导致经济停滞。再例如,地价影响房价,房价也会影响地价。(3)测量误差偏差测量误差是指由于对变量测量不准确而导致的误差,比如我们要测量的自变量的真实值为x_i,结果测量存在误差,导致测量值为x_i^*,测量值除了包含真实值x_i外,还包含一个误差项v_i。这样也会使解释变量与误差项相关,造成内生性问题。假设真实的回归模型是:由于原方程变为整理得到这样,由于测量值x_i^*与误差项v_i相关,上式中解释变量x_i^*与复合误差项(u_i-β_1
2020年4月9日