学术前沿 | 行政大数据的政策研究价值
(1)大量的观测值;
(2)固有的纵贯数据结构;
(3)行政文件中包含更高质量的数据;
(4)更深(deep coverage)的地区覆盖率;
(5)做新颖研究设计的机会。
第一个例子是Chetty, et al.(2011),该文将有关班级规模和教师质量对K-3rd年级学生测试成绩影响的实验(数据)与税收申报行政数据链接,这使得他们可以跟踪这部分学生到成年。他们发现幼儿园的课堂特征会显著影响大学入学率和出勤率,以及成年后的收入。他们的发现表明,“学校质量的差异会使收入不平等长期存在”,因此班级的规模、教师的质量具有很高的社会价值。如果没有能够与实验数据连接的行政记录,是不可能有这种发现的。
第二个例子是对补充营养援助计划(Supplemental Nutrition Assistance Program ,SNAP)中合格家庭参与的评估(Newman and Scherpf, 2013)。研究者将由美国人口普查局在2009年收集的美国社区调查(American Community Survey, ACS)与来自田纳西SNAP文档(files)2008-09的行政数据匹配起来,后者涵盖了田纳西所有SNAP接受者。了解那些具有合法资格的个体中接受了SNAP资助和没有接受SNAP者的人口特征,对评估和改进项目绩效来说很重要。研究者发现,具有合法资格的个体中参与率因年龄、种族和其他人口特征而具有很大差异,如果没有连接行政记录是无法获得未参与该项目合法个体的人口特征的,从而不可能得到这一发现。
最后一个例子,在证明两个行政数据集之间的联系强弱时,Sullivan和von Wachter(2009)得出了有力的结论,即失业会提高死亡率。他们将宾夕法尼亚州失业保险中个人收入和就业的数据和社保局所记录的行政数据中的死亡日期进行了匹配。匹配后的数据提供了对死亡率变化的长期跟踪随访,使得研究人员可以观察到失业对于死亡率的短期和长期影响。大数量级样本使得可以对变量之间的关系进行更准确的测量,提高结果的可信度。他们的这个研究让行政数据有了成为可用数据的可能性,可以对影响工人收入水平和收入差异的失业补偿和教育政策提供有效建议。
(1)税务记录以及可用于研究收入、贫困和其他的社保记录(由美国国税局Internal Revenue Service提供)
(2)用于公共卫生研究和卫生保健评估的医疗保险和医疗补助记录
(3)住房和城市发展公共住房援助计划的相关数据
(4)卫生和公共服务向贫困家庭提供的临时援助记录
(5)联邦学生贷款计划的相关数据
(6)其他用于评估福利或福利改革的数据
►往期推荐
回复【Python】👉简单有用易上手
回复【学术前沿】👉机器学习丨大数据
回复【数据资源】👉公开数据
回复【可视化】👉你心心念念的数据呈现
回复【老姚专栏】👉老姚趣谈值得一看
►一周热文
工具&技巧丨能够融合Stata、Python和R的神器——Jupyter Notebook
工具&技巧 | 经济学圈特供 小刘帮你画专业社会网络图(二)
数据Seminar
这里是大数据、分析技术与学术研究的三叉路口
欢迎扫描👇二维码添加关注