人口统计学控制变量和滞后收入项的加入,大大缩小了这一差距;最后一行估计出的处理效应达到(正)800美元。第3列的结果甚至更好,它使用了更窄的CPS-3对照组。这一群体的特征与NSW参与者的特征更接近;与此相一致的是,原初收入差异只有- 635美元。最后一行报告的控制所有协变量的估计值,该值接近1400美元,离实验处理效应不远。从CPS-1到CPS-3这一过程的缺点是,用于构建更小、更仔细选择的CPS-3比较组的规则显得特意化。CPS-3的选择标准可以由NSW项目规则推导出,该规则偏向于低收入者和弱势短期零工,但在实践中,有许多方法可以解决这一问题。因此,我们希望有一个更系统的方法来进行前期筛选。在最近的一篇论文中,Crump、Hotz、Imbens和Mitnik(2009)建议将倾向评分用于系统样本选择,作为回归估计的前导。这与我们之前讨论的倾向评分作为估计的基础形成了对比。我们实施了Crump等人(2009)的建议,首先估计混同了NSW-处理和观测-比较的样本进行倾向评分,然后只选取那些的观测值。换句话说,这一估计样本仅限于处理预测概率至少等于10%但不超过90%的观测值。这确保了回归在一个仅包括至少同时有若干处理组观测值和控制组观测值的协变量分组的样本中估计。因此,使用筛选样本所作的估计不需要外推到没有“共同支撑”的分组——换句话说,也不需要外推到处理组和对照组之间协变量分布不存在重叠的分组。表3.3.2的最后两列显示了对评分筛选样本的描述性统计(使用表中列出的整组协变量进行估计)。已筛选的CPS-1和CPS-3样本的协变量均值比未筛选样本的协变量均值更接近第一列中的NSW均值。我们使用可选的协变量集进一步探究了共同支撑筛选器(common support screener),但在每次迭代中都使用相同的协变量进行筛选和估计处理效应。所得出的估计值显示在表3.3.3的最后两列。单独控制人口统计变量或滞后收入项,这些结果与列2和列3的差异不大。然而,在人口统计变量和收入滞后项作为对照的情况下,经过筛选的CPS-1估计值比未经筛选的结果更接近于实验估计值。经过筛选的CPS-1中有滞后两期收入项的估计值也接近实验基准。另一方面,共同支撑筛选器单独加入滞后一期收入项后对CPS-3结果略微改善,而加入滞后两期收入项结果反而倒退。这番探究增强了我们对回归(已经很强)的信心。尽管在CPS-1样本中存在巨大的基线差距(baseline gap),但对选择了正确协变量的回归控制在消除选择性偏差方面做得相当好。利用我们对该培训项目录取标准的了解来限制样本,使用CPS-3可以产生更好的回归估计值,几乎与Dehejia和Wahba(1999)具有两期收入滞后项的倾向评分匹配结果一样好。CPS-1是一个较大的粗选的初始样本,加强共同支撑的系统性预筛选,似乎是一个对CPS-1回归估计的有用的辅助。经过筛选的CPS-1和未经过筛选的CPS-3中的估计值一样好。然而,我们注意到,使用倾向评分筛选样本所得估计值的标准误差并未被调整,以反映我们在评分估计值中的抽样方差。如同从CPS-1到CPS-3的步骤一样,利用先验的信息进行预筛选的一个优点就是不需要作这种调整。