查看原文
其他

基本无害 | 使回归有意义——异质性和非线性(3)

基本无害的 数据Seminar 2022-12-31

基本无害的计量经济学

——实证研究者指南

(重译本)

李井奎 译


第三章 使回归有意义第三节 异质性和非线性


正文共3989个字,预计阅读时间10分钟。感谢阅读!

原文:3.3.3

温馨提示:左右滑动可查看完整公式!


3.3.1 回归与匹配

3.3.2 使用倾向评分控制协变量

3.3.3 倾向评分方法与回归

倾向评分方法将注意力从对的估计转到了对倾向评分的估计上。后者因更容易建模或推导在应用中很有吸引力。例如,Ashenfelter(1978)指出,政府资助培训项目的参与者通常在培训前存在着收入显著下降现象,这一范例在后来的许多研究中都有发现。如果这种下降是唯一让受训者与众不同的因素,那么我们可以通过控制过去的收入动态来估计培训对收入的因果影响。然而,在实践中,很难在收入动态上进行匹配,因为收入历史既连续又多维。Dehejia和Wahba(1999)认为,在这种情况下,通过以倾向评分为条件,而不是以收入历史本身为条件,可以更好地估计培训项目的因果效应。
Dehejia和Wahba报告的倾向评分估计值与构成其基准的随机试验的估计值非常接近。尽管如此,我们仍相信回归应该是大多数实证项目的起点。这还不是一个定理;毫无疑问,在某些情况下,倾向评分匹配可以提供更可靠的平均因果效应估计。我们发现自己没有加入倾向评分时尚大潮的第一个原因来自实证环节,即:在实施倾向评分匹配时,有许多细节需要推敲,例如如何对评分进行建模以及如何进行推理;这些细节尚未标准化。因此,不同的研究人员可能会得出非常不同的结论,即使使用相同的数据和协变量,亦是如此。此外,正如我们在Horvitz-Thompson被估量中看到的,回归和倾向评分加权之间的理论界限并不是那么泾渭分明。如果协变量的回归模型相当灵活,比如接近饱和,那么回归可以被视为一种倾向评分加权,因此差异主要在于实施过程。在实践中,你可能远远没有达到饱和模型的程度,但有了正确的协变量,这应该无关紧要。
在这里,以Dehejia和Wahba(1999)使用的同一个国家支持工作示范项目(NSW)样本为特色进行回归和倾向评分匹配之间的对比。[1] NSW是一个1970年代中期的项目,为身为弱势短期零工的接受者提供工作经验。NSW是在一项随机试验中做出的评估,这在当时颇不寻常。Lalonde(1986)的开创性分析将NSW随机试验研究的结果与来自PSID和CPS的非实验对照组的计量经济学结果进行了比较。因为看似合理的非实验方法产生了泛泛的结果,而且其中许多结果与实验估计值相去甚远,他颇为悲观地放弃了这个研究。此外,Lalonde认为,一名对于随机试验结果所知不多的客观的研究者,不太可能选到最佳的计量经济学设定和观测对照组。
Dehejia和Wahba(1999)对Lalonde(1986)的发现进行了引人注目的二次研究,他们发现,通过将NSW处理组与使用倾向评分选择的观测对照组相匹配,他们的结论是接近NSW的实验结果的。他们用不同的对照组证明了这一点。继Dehejia和Wahba(1999)之后,我们再次考察了两个CPS对照组,第一个是基本上未经选择的样本(CPS-1),再一个是从最近失业的人群中选择的一个更窄的对照组(CPS-3)。
表 3.3.2(第 1-4 列是对 Dehejia 和 Wahba(1999) 中表 1 的复制)报告了 NSW 处理组、随机选择的 NSW 对照组和我们的两个观测对照组的描述性统计数据。与 CPS-1 样本所代表的一般总体相比,NSW处理组和随机选择的NSW对照组更年轻、受教育程度更低、更有可能是非白人,并且收入要低得多。CPS-3 样本与NSW处理组更接近,但仍显示出一些差异,特别是在种族和培训前收入方面。

表3.3.2  NSW中的协变量均值和观测对照样本组

注:改编自Dehejia 和 Wahba(1999)中的表1。前四列中的样本如Dehejia 和 Wahba(1999)所描述。最后两列中的样本仅限于倾向评分在0.1到0.9之间的对照组观测值。倾向评分估计值使用了表中列出的所有协变量。

表3.3.3报告了NSW处理效应的估计值。因变量是1978年的年收入,即处理(培训)后的一两年。表中的行显示了可选控制变量集的结果:无控制变量;表3.3.2给出的所有人口统计学变量;滞后(1975年)收入;人口统计数据加上滞后的收入;人口统计和滞后两期的收入。所有估计值均来自1978年的收入对处理虚拟变量加上控制变量的回归(初始的处理-控制组差异显示在第一行)。
第1列中报告的利用实验对照组得到的估计值约为1600-1800美元。毫不奇怪,这些估计值在不同的设定中几乎没有差异。相比之下,NSW参与者和CPS-1样本(参见第2列)之间的原初收入差距约为-8500美元,这表明此类比较受到选择性偏差的严重影响。

表3.3.3 使用不同控制变量的NSW培训效果的回归估计值

注:该表使用Dehejia-Wahba(1999)数据和其他控制变量集报告了培训效果的回归估计值。人口统计控制因素包括年龄、受教育年限、黑人、西班牙裔、高中辍学者和是否已婚。标准误报告在圆括号内。观察计数报告在方括号内[处理/对照组]。在区间[0.1,0 .9]只使用1975年的收入作为CPS-1数据的协变量,没有具有所估计的倾向评分的观测值。

人口统计学控制变量和滞后收入项的加入,大大缩小了这一差距;最后一行估计出的处理效应达到(正)800美元。第3列的结果甚至更好,它使用了更窄的CPS-3对照组。这一群体的特征与NSW参与者的特征更接近;与此相一致的是,原初收入差异只有- 635美元。最后一行报告的控制所有协变量的估计值,该值接近1400美元,离实验处理效应不远。
从CPS-1到CPS-3这一过程的缺点是,用于构建更小、更仔细选择的CPS-3比较组的规则显得特意化。CPS-3的选择标准可以由NSW项目规则推导出,该规则偏向于低收入者和弱势短期零工,但在实践中,有许多方法可以解决这一问题。因此,我们希望有一个更系统的方法来进行前期筛选。在最近的一篇论文中,Crump、Hotz、Imbens和Mitnik(2009)建议将倾向评分用于系统样本选择,作为回归估计的前导。这与我们之前讨论的倾向评分作为估计的基础形成了对比。
我们实施了Crump等人(2009)的建议,首先估计混同了NSW-处理和观测-比较的样本进行倾向评分,然后只选取那些的观测值。换句话说,这一估计样本仅限于处理预测概率至少等于10%但不超过90%的观测值。这确保了回归在一个仅包括至少同时有若干处理组观测值和控制组观测值的协变量分组的样本中估计。因此,使用筛选样本所作的估计不需要外推到没有“共同支撑”的分组——换句话说,也不需要外推到处理组和对照组之间协变量分布不存在重叠的分组。表3.3.2的最后两列显示了对评分筛选样本的描述性统计(使用表中列出的整组协变量进行估计)。已筛选的CPS-1和CPS-3样本的协变量均值比未筛选样本的协变量均值更接近第一列中的NSW均值。
我们使用可选的协变量集进一步探究了共同支撑筛选器(common support screener),但在每次迭代中都使用相同的协变量进行筛选和估计处理效应。所得出的估计值显示在表3.3.3的最后两列。单独控制人口统计变量或滞后收入项,这些结果与列2和列3的差异不大。然而,在人口统计变量和收入滞后项作为对照的情况下,经过筛选的CPS-1估计值比未经筛选的结果更接近于实验估计值。经过筛选的CPS-1中有滞后两期收入项的估计值也接近实验基准。另一方面,共同支撑筛选器单独加入滞后一期收入项后对CPS-3结果略微改善,而加入滞后两期收入项结果反而倒退。
这番探究增强了我们对回归(已经很强)的信心。尽管在CPS-1样本中存在巨大的基线差距(baseline gap),但对选择了正确协变量的回归控制在消除选择性偏差方面做得相当好。利用我们对该培训项目录取标准的了解来限制样本,使用CPS-3可以产生更好的回归估计值,几乎与Dehejia和Wahba(1999)具有两期收入滞后项的倾向评分匹配结果一样好。CPS-1是一个较大的粗选的初始样本,加强共同支撑的系统性预筛选,似乎是一个对CPS-1回归估计的有用的辅助。经过筛选的CPS-1和未经过筛选的CPS-3中的估计值一样好。然而,我们注意到,使用倾向评分筛选样本所得估计值的标准误差并未被调整,以反映我们在评分估计值中的抽样方差。如同从CPS-1到CPS-3的步骤一样,利用先验的信息进行预筛选的一个优点就是不需要作这种调整。



注释

[1]

在Smith和Todd(2005)以及Dehejia(2005)之间的交锋中出现了更广泛的与倾向得分的对比。





本专栏主理人简介

企研数据学术顾问 · 李井奎


李井奎,1978年1月生,浙江工商大学经济学院教授、博士生导师,哈佛大学访问学者,以教书育人和传播学问为己任,曾获浙江省“高校优秀教师”称号。除学术论文写作之外,还著有《大侦探经济学:现代经济学的因果推断革命》等科普著作。




星标⭐我们不迷路!想要文章及时到,文末“在看”少不了!

往期推荐


基本无害 | 第三章第二节(全)——回归和因果关系

基本无害 | 使回归有意义——异质性和非线性(1)

基本无害 | 使回归有意义——异质性和非线性(2)

数据治理 | 工企地址清洗——Python的妙用

数据治理 | 根据地址获取经纬度及行政区划——API的妙用

数据治理 | 从“今天中午吃什么”中学习Python文本相似度计算




数据Seminar




这里是大数据、分析技术与学术研究的三叉路口


文 | 《基本无害的计量经济学——实证研究者指南(重译本)》

翻译 | 李井奎

校对 | 陈泽 王锐

排版 | 李木子


    欢迎扫描👇二维码添加关注    


点击下方“阅读全文”了解更多

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存