查看原文
其他

2019 Stata 寒假班 DAY 6

stata连享会 Stata连享会 2020-02-10

2019 Stata 寒假研讨高级班第三天

上午 —— RDD 与合成控制法初步
  • RDD 模型

    • 参数估计

    • RDD 的假设条件

    • 假设检验

    • 模糊断点

  • 合成控制法

    • 基本原理

在上午的课程中,连老师首先总结了 RDD 模型的本质。断点回归模型实际上就是在 OLS 估计中,通过引入虚拟变量来判断政策效果是否存在。在实际对 RDD 模型的估计中,主要有全局多项式与局部多项式回归两种方法。在全部样本中,通过引入变量的高阶项进行参数估计的称为全局多项式;仅利用某个带宽中的样本进行估计的方法称为局部多项式回归。

  1. * 全局多项式  举例

  2. reg y1 T xc xc2 xc3 xc4 xc5 xc6 z


  3. * 局部多项式  举例

  4. reg y1 T xc xc2 xc3 if xc >= -0.2 & xc <= 0.2

上述命令中,y 为我们感兴趣的结果变量,xc 为减去间断点的解释变量(例如在上大学是否对收入有影响的例子中,y 就是收入,xc就为高考成绩减去学校分数线),xc2 至 xc6 是 xc 的高阶项。由于局部多项式利用的是间断点附近的样本,所以不需要加入更高阶数的变量。

那么究竟需要加入多少高阶项?连老师指出可以利用信息准则来判断,分别估计含有各高阶项的模型,再对比这些模型的 AIC 与 BIC 的值。在 Stata 中可以利用  estat ic  来查看这两个值。

RDD 的假设条件有两个,一是局部的平滑性假设,二是分布函数条件连续假设。直观上理解,如果没有 treatment,在间断点处 y 应该是 x 的连续函数。这个假设难以直接检验,只能通过以下的间接方式进行检验。第一,检验结果变量除了间断点意外的其他位置是否连续;第二,检验驱动变量本身在间断点是否连续;第三,除结果变量外,其他影响变量在间断点两侧是否存在跳跃。

平滑性检验

如果间断点是模糊的就应该采用模糊 RDD (Fuzzy RDD)的方法进行估计。在退休的例子中,官方规定55岁就要退休。但事实上,可能存在有些人不到55岁就提前退休了,有些人又可能超过55岁还在工作。这时55岁就不是是否退休的一个明确间断点。此时就要通过两阶段方法进行估计,详细的方法可以参考 Jacob et al.(2012) 的文章。

随后,连老师以 Lee(2008)关于美国参议员选举的论文讲解了 RDD 模型在研究中的实际应用。同时连老师也说明了 RDD 模型存在的问题,RDD 的结论只在间断点附近成立,而对于全体样本未必成立。

上午课程中的另一个重要内容就是合成控制法的模型。这个模型多应用于只有一个实验组的政策评估中。该方法的核心在于利用其他未受干预的样本加权合成出一个虚拟的控制组,再比较控制组于干预组的差异。整体思路与 DID 是相似的,但 DID 方法需要有多个样本才能进行统计推断,不适用只有一个政策干预对象的情景。

下午 —— 合成控制法与写作
  • 合成控制法

    • 假设检验

  • 文献搜集与整理

  • 论文写作与投稿

  • 标书写作

在下午的课程中,连老师继续利用 Abadie et al.(2010) 关于美国加州控烟的政策讲解合成控制法。由于合成控制法中,干预组只有一个样本,所以就难以进行统计推断。在这篇文中中利用安慰剂的方法来进行统计推断。文章的作者将合成控制法应用在每一个省份中,随后对比各州的香烟销售变动。如果我们发现加州的变动与其他没有控烟法案州的变动非常相似,那么我们就不能认为控烟法案导致了加州吸烟率下降。反之,就可以认为加州的控烟是有效的。具体内容请仔细阅读第一篇参考文献。

合成控制法

结束了计量模型的学习后,连老师给我们分享了文献搜集与整理和论文写作中的经验。在搜集文献的过程中,我们可以利用 EndNote 来管理我们阅读的文献,这个软件可以将我们阅读过的文献分类保存。同时,在实际写作中,我们可以在 EndNote 中设定好参考文献的样式,再一键插入到 Word 中。即使要更改文中的参考文献样式,EndNote 也能很方便地一键更改。

在论文的写作中,连老师告诉我们选题可以多关于新闻与行业研究报告,通过不断深挖形成自己的研究点。也可以通过阅读 working paper 来发现新的 idea。现在很多大学老师也有自己的主页与博客,上面也有他们最近的研究以及研究中用到的数据与程序。这都能为自己的选题提供帮助。

讲到课题申请的问题,连老师强调要重视前期的准备工作,在申请课题前就要开始做相关的研究。在申请书的写作上,要将申请书中的各个研究问题联系在一起,说清楚他们之间的关系。

课后答疑

在最后一天的答疑中,除了上课讲的计量问题,来听课的老师同学们还就自己的研究学习中的问题对连老师提问,连老师都一 一回答,给了大家很多研究与学习生活中的建议。

为期三天的高级班课程也结束了,还是希望大家能够花几个月时间把这几天的内容好好消化吸收。

参考文献

Abadie, Alberto, Diamond, Alexis and Hainmueller, Jens, (2010), Synthetic Control Methods for Comparative Case Studies: Estimating the Effect of California's Tobacco Control Program, Journal of the American Statistical Association, 105, issue 490, p. 493-505.

Jacob R , Zhu P , Somers, MarieAndrée, et al. A Practical Guide to Regression Discontinuity.[J]. Mdrc, 2012.

Lee D S . Randomized experiments from non-random selection in U.S. House elections[J]. Journal of Econometrics, 2008, 142(2):675-697.

往期精彩推文

欢迎加入Stata连享会(公众号: StataChina)


    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存