查看原文
其他

父母为什么要买学区房? Top经济学家告诉你背后原因!

计量经济圈 计量经济圈 2022-05-11

凡是搞计量经济的,都关注这个号了

稿件:econometrics666@126.com

所有计量经济圈方法论丛的code程序, 宏微观数据库和各种软件都放在社群里.欢迎到计量经济圈社群交流访问.

计量免费课程、文章、数据和代码,参看 1.面板数据方法免费课程, 文章, 数据和代码全在这里, 优秀学人好好收藏学习!2.双重差分DID方法免费课程, 文章, 数据和代码全在这里, 优秀学人必须收藏学习!3.工具变量IV估计免费课程, 文章, 数据和代码全在这里, 不学习可不要后悔!4.各种匹配方法免费课程, 文章, 数据和代码全在这里, 掌握匹配方法不是梦!5.断点回归RD和合成控制法SCM免费课程, 文章, 数据和代码全在这里, 有必要认真研究学习!6.空间计量免费课程, 文章, 数据和代码全在这里, 空间相关学者注意查收!7.Stata, R和Python视频课程, 文章, 数据和代码全在这里, 真的受用无穷!

正文

关于下方文字内容,作者:杨青清,湖南大学经济与管理研究中心经济所,通信邮箱:mikiyqq@163.com

作者之前的文章:中国博导要求掌握的RDD方法实证运用范文(配程序code), 不然就不要用RDD做实证研究!火了! 携程网梁建章Top5上的文章在COVID-19期间火遍欧美学术界!

Raj Chetty, Nathaniel Hendren, The Impacts of Neighborhoods on Intergenerational Mobility I: Childhood Exposure Effects, The Quarterly Journal of Economics, Volume 133, Issue 3, August 2018, Pages 1107–1162, https://doi.org/10.1093/qje/qjy007
We show that the neighborhoods in which children grow up shape their earnings, college attendance rates, and fertility and marriage patterns by studying more than 7 million families who move across commuting zones and counties in the United States. Exploiting variation in the age of children when families move, we find that neighborhoods have significant childhood exposure effects: the outcomes of children whose families move to a better neighborhood—as measured by the outcomes of children already living there—improve linearly in proportion to the amount of time they spend growing up in that area, at a rate of approximately 4% per year of exposure. We distinguish the causal effects of neighborhoods from confounding factors by comparing the outcomes of siblings within families, studying moves triggered by displacement shocks, and exploiting sharp variation in predicted place effects across birth cohorts, genders, and quantiles to implement overidentification tests. The findings show that neighborhoods affect intergenerational mobility primarily through childhood exposure, helping reconcile conflicting results in the prior literature.
本文通过研究超过700万个在美国通勤区县之间迁移的家庭,表明儿童成长所在的社区影响了他们的收入、大学升学率、生育率以及婚姻。利用家庭迁移时孩子年龄的变化,作者发现邻里对儿童具有显著的暴露效应(exposure effect):迁往更好社区家庭的儿童的成果与孩子在该地区成长的时间线性正相关,每年的接触率约为4%。另外,本文还通过比较家庭中兄弟姐妹的成果、研究流离失所冲击所引发的迁移、以及探讨利用出生队列、性别和分位数所预测的位置效应(place effects)的急剧变化,来区分邻里的因果效应与混杂因素。研究结果表明,邻里通过影响童年时期的接触进而影响代际流动(intergenerational mobility)。
I. INTRODUCTION
对于儿童的经济机会在多大程度上是由他们成长的社区塑造的这一问题,尽管已经进行了广泛的研究,但这个问题的答案仍然存在争议。本文利用涵盖美国人口的未确认的税收记录,提出了关于邻里对代际流动影响的新的准实验证据,这些证据调和了先前工作中相互矛盾的发现,并阐明了邻里影响儿童成果的机制。
代际流动的地理差异可能由两种来源驱动。一种可能性是,邻里对经济流动性具有因果关系,即让一个孩子搬到另一个社区会改变他或她的成果。另一种可能性是,可观测的地理差异是由于每个地区的人口类型存在系统性差异,例如人口统计或财富差异。因为迁移是一种内生的选择,所以如果将那些搬到不同地区孩子的结局进行简单比较,就会将地点的因果效应与选择效应(不可观察的差异)混为一谈。因此,作者通过探讨儿童跨区域移动时间的变化来解决这一识别问题,他们比较了在不同年龄迁移到更好(或更差)地区的孩子的成果,以确定迁移儿童与永久居民的成果趋同的比率。另外,本文拥有一个很强的识别假设:当家庭发生流动时,选择效应与迁移时孩子的年龄无关。
在基准分析中,作者关注的是有1980年至1988年出生的孩子的家庭,这些家庭在1997年至2010年之间更改过一次通勤区。结果发现,平均而言,如果一个通勤区永久居民孩子的平均收入水平比给定的父母收入水平高一个百分位,那么在该社区每多生活一年时间,孩子成年后的收入排名便会提高约0.04个百分位。也就是说,迁移儿童的收入以每年4%的童年暴露率收敛至目的地永久居民的收入。因此,在本文所研究的年龄范围内(9岁至23岁),迁移儿童的成果与目的地永久居民的成果呈线性收敛。对于童年时期发生不止一次流动的孩子,作者发现他们的收入与他们在一个地区度过的时间成比例变化,而非他们在那个地区居住时的具体年龄。通过以上结果,作者进一步提出,每年的暴露效应(exposure effect)几乎是不变的,而这种效应会一直持续至孩子20岁出头。作者也在其他方面发现了这一暴露效应,包括大学的升学率、结婚率和青少年出生率。不仅如此,当家庭跨县迁移时,作者也发现了类似的暴露效应。
对于本文基于的识别假设,作者使用四种方法以评估这一假设的有效性:控制可观测的固定家庭特征、控制时变的可观测特征、剔除由流离失所冲击而引起的合理的外生迁移、以及实施一组基于成果的安慰剂试验。对于第一种方法,作者通过两个搬到新地区兄弟姐妹之间的收入差异是否与他们的年龄差异(与目的地永久居民的成果交互)成比例关系,来识别暴露效应,而估计结果与基本结果是相似的(约4%)。在第二种方法中,作者考虑了收入和婚姻状况这两个时变的因素,将他们与迁移时儿童的年龄进行交互,发现对暴露效应没有影响。在第三种方法中,作者探讨了不可观测因素产生的混淆,关注更可能由于外生冲击而导致的迁移(自然灾害或当地工厂倒闭),对这一部分子样本重复进行基准分析,比较不同年龄迁移至不同地方儿童的成果,并得到了与之前相似的估计结果,进而解决了与内生选择相关的偏差问题。尽管前三种方法均有力的支持了识别假设的有效性,但每种方法均依赖于可能违背的假设,因此作者又进行了一组安慰剂(过度识别)检验,以探讨子群体中永久居民成果的异质性。
在异质性分析中,首先,作者考虑了出生队列,通过多元回归发现搬到新地区的孩子的成果向自己出生队列中目的地永久居民的结局收敛,但与之前和之后的出生队列的成果无关;并利用跨地区成果分布的差异来实施类似的安慰剂测试(举了波士顿与旧金山的例子)。作者还发现了特定分位数的收敛:在控制平均收入的情况下,儿童的收入与暴露时间成比例地与整个分布范围中的目的地的预期收入收敛,每年约4%。其次,作者探讨了不同性别永久居民成果的差异,发现尽管收入与性别高度相关,但有些地方男孩的表现比女孩差(例如,贫困集中地区),反之亦然。
最后,作者得到了三个结论:地点对代际流动至关重要,而非居民特征;地点问题在很大程度上是由于儿童时期环境的差异,而不是因为先前研究中备受关注的劳动力市场条件的差异;每年的童年暴露效应都差不多,并没有“临界年龄”。
(作者在这一部分也指出了先前文献的不足以及本文结论与部分先前文献的一致性,这里将不作赘述。)
II. DATA
II.A. Sample Definitions
关于儿童的基础数据集,包括满足(i)具有有效社会安全编号或个人纳税人识别号,(ii)出生于1980-1988年之间,(iii)截至2013年为美国公民这三个条件的所有人。孩子的父母是第一批纳税申报人(1996年至2012年之间),他们承认孩子为受抚养人,并且在孩子出生时年龄在15至40岁之间。为简单起见,无论父母的婚姻状况或子女的从属权之后发生什么变化,作者都将每个孩子永久分配给(一个或多个)父母。如果父母从未提交纳税申报表,作者也没有将其链接到他们的孩子。本文的全部分析样本包含了基础数据集中所有属于1980–1988出生队列、可以确定父母且父母在1996至2000年间平均收入是严格为正的儿童。作者将整个样本分为两个部分:永久居民(或滞留者)和迁移者,其中永久居民被定义为在样本的所有年份(1996-2000)中一直住在单一通勤区的父母,迁移者则为样本中的非永久居民。基准分析样本中大约有2460万儿童,作者观察了其在24岁以后的结局,其中1,950万是永久居民的孩子。
II.B. Variable Definitions and Summary Statistics
这部分作者主要定义了在估计中所涉及到的关键变量。关于父母的变量有收入与地点,其中收入按照父母是否提交纳税申请表有不同的计算方法,但基本的衡量标准为家庭一级的税前总收入;而地点根据的是父母提交纳税申报表的邮政编码,如果婚姻状态发生变化,作者选择跟踪母亲的地理位置。另外,关于衡量孩子成果的变量包括收入、就业、大学升学、青少年生育以及婚姻状况。其中收入的计算方法同父母收入的计算方法,作者还统计了个人收入作为稳健性检验;就业率的计算是从16岁开始;青少年生育则被定义为有一个13至19岁的孩子。Table 1为主要变量的描述性统计。

III. EMPIRICAL FRAMEWORK
III.A. Geographical Variation in Outcomes of Permanent Residents
作者将邻里效应(neighborhood effects)归纳为不同地理区域的地点效应之和,包括通勤区、县,邮政编码和人口普查区域,但在本文中只重点介绍通勤区的变化。通勤区是基于Tolbert和Sizer(1996)在1990年人口普查中的通勤模式得出的县的集合。另外,作者通过关注那些永久居民的子女,刻画了那些在单一通勤区度过了整个童年的孩子,因为他们的父母在1996-2012年始终在相同的通勤区。需要注意的是,由于儿童在长大后可能会改变通勤区,因此这里的永久居民针对的是父母,而非孩子。
由于位置效应因为父母收入水平和时间而有所不同,作者分别以每个通勤区和出生队列的父母收入为条件来体现孩子的平均成果,且使用百分位等级(而非美元水平)作为衡量手段。他们将孩子i的百分位等级定义为,孩子相对其出生队列的其他人,其所在地在全国分布中的收入水平。类似的,父母的百分位等级p(i)也是基于孩子i出生队列中父母的收入在全国范围的分布情况。代表了出生队列s中、在通勤区c、父母收入的百分位为p的孩子的平均收入等级。Figure 1描述了作者如何估算1980年出生的芝加哥永久居民孩子的。该图绘制了父母收入分布的每个百分位对应的30岁子女的平均收入等级,我们会清楚的发现,两者呈线性关系。

接着作者对每个通勤区c和出生队列s中孩子的收入等级与父母的收入等级进行回归,

接着作者使用上述回归的拟合值估算

Figure 2 则分别展示了各通勤区25%和75%的父母收入等级所对应的孩子在30岁时的平均收入等级。在这里,作者重点研究这些地图中的变化是由地点的因果关系还是住在不同地方居民的异质性所导致的。

III.B. Definition of Exposure Effects
作者试图确定如果一个孩子所住地的永久居民的成果提升1个百分位时,这个孩子的潜在成果平均会提升多少。他们选择通过研究跨地区迁移的孩子来回答这个问题,以估计童年暴露效应(childhood exposure effects)。作者将m岁的暴露效应定义为,孩子在永久居民的成果提升1个百分位的区域度过m岁这一年所受到的影响。
假设随机将孩子从m岁分配至新的社区d直至度过他们剩下的童年,那些关于孩子结局的最佳线性预测值可以定义为


III.C. Estimating Exposure Effects in Observational Data

IV. BASELINE ESTIMATES OF CHILDHOOD EXPOSURE EFFECTS
IV.A. Semiparametric Estimates


IV.B. Parametric Estimates
事实上,方程(5)包含超过200,000种固定效应,因此难以在较小的样本中进行估算,并且难以引入其他控制变量,例如家庭固定效应。因此在这部分,作者又建立了一个模型,对由固定效应捕获的两个关键因素进行参数控制:(i)原始社区的质量,将原始社区中父母收入百分位的永久居民的预测成果与出生队列的固定效应进行交互;(ii)迁移的干扰费用可能随迁移年龄和父母收入而变化,在该模型中作者使用迁移年龄的固定效应与父母收入百分位数进行交互,最终得到了以下模型:


Table II 中列(1)至(5)展示了不同情况下暴露效应的估计结果,可以发现,γ均在0.04左右,是比较稳健的。

IV.C. Mechanisms
在这一小节,作者对邻里影响儿童成果的机制进行分析。首先,作者根据由跨区域的劳动力市场条件与当地生活成本变化引起的差异来区分童年成长环境的作用。从Table II的列(6)可知,在考虑孩子在24岁所住的通勤区的固定效应后,暴露效应为0.031,这说明在给定劳动力市场条件的情况下,暴露效应主要由在一个更好的童年环境成长的差异导致的,换言之,在进入劳动力市场之前(例如,20岁出头的人)搬到永久居民收入较高的地区对收入影响不大。其次,作者查验了不同子样本下暴露效应的异质性,发现搬到更好的社区会改善最后的成果,而搬到更差的社区则不会;把童年的一部分时间花在一个好的社区,并不能使一个孩子免受之后社区环境恶化的影响;中等偏上收入家庭的儿童相对于中等偏下收入家庭儿童的暴露效应更大。最后,作者对暴露效应与临界年龄效应(critical age effects)进行区分。临界年龄模型(critical age model)预测了迁移至不同社区的影响因儿童年龄而异(例如Lynch& Smith ,2005),但并没有强调持续时间。因此,临界年龄的观点要求改善儿童在某些关键年龄段的环境,而暴露效应的观点则要求在整个儿童时期持续改善生活环境。
V. VALIDATION OF BASELINE DESIGN
由于之前的分析都依赖于作者所提出的假设(即儿童不管搬到更好或更差的社区,其潜在成果都不会随着他们迁移时的年龄而改变),因此这一章作者对这一假设的有效性进行论证。他们将不可观测的误差项具体分为两个部分:一是固定的家庭投入因素,如父母的基因、教育等;另一部分则为时变的家庭因素,如父母的职业等。
V.A. Sibling Comparisons

V.B. Controls for Time-Varying Observables
其次,作者控制了父母收入和婚姻状况的变化,以解决因时变家庭因素而带来的偏差。将迁移前后一年的父母收入等级变化与迁移时孩子的年龄进行交互,并且将迁移前后一年间母亲的婚姻状况与迁移时孩子的年龄进行交互,然后再对方程(6)进行估计,得到了Figure V中的Panel B与Table II中列(9)的结果。从图表中可以发现,暴露效应与未控制前相似。因此,收入和家庭结构的变化并不是估计偏差的重要来源。
V.C. Displacement Shocks

V.D. Outcome-Based Placebo Tests
最后,作者从三个方面进行了安慰剂检验:出生队列,收入分布百分位以及子女性别。对于出生队列而言,作者以所属出生队列为基准,估计了前后队列的暴露效应,Figure VII中的红线为估计结果,其中垂直虚线处的红色三角点代表了基本回归结果——0.04。而蓝线则展示了同时包含孩子出生队列前四年到后四年的所有特定队列所预测的暴露效应。
接着,作者进行了特定分位数收敛检验。首先预测了每个通勤区c永久居民的孩子在24岁时收入分布在上尾或下尾的可能性;再使用类似式(1)的方程,用父母的收入等级p对处在前10%的孩子或未就业的孩子进行回归;最后使用回归的拟合值计算出未就业以及在第90百分位以上的概率。Table III中便展示了使用分布的预测值所得到的暴露效应。
在子女性别方面,除了根据性别将样本进行划分,估计方法与之前基本相同,具体结果从Table IV中可以看到,暴露效应大致在0.03左右,列(7)的结果是基于将样本限制在至少有一个男孩和一个女孩的家庭。
总而言之,尽管对于基本估计进行各种改进,暴露效应基本在0.04左右。另外,可能的遗漏变量必须满足(i)与暴露时间成比例地在家庭中产生影响,(ii)与父母收入和婚姻状况的变化正交,(iii)在流离失所冲击引起的迁移中持续存在影响,(iv)根据出生队列、分位数和性别精确复制与暴露时间成比例的永久居民的成果。但作者认为可能的遗漏变量不太可能具有这些的属性,因此认为关于暴露效应的估计为无偏估计。

VI. OTHER OUTCOMES
在这一章节,作者进一步估计了邻里对除收入外其他方面的成果的影响,包括大学升学、婚姻、青少年出生以及青少年就业等方面,具体结果如Figure VIII 所示。不难发现,更早搬入大学升学率较高的社区增加了孩子进入大学的概率;类似地,更早搬入结婚率较高的社区会增加孩子结婚的概率(暴露效应分别为0.037和0.025)。对于青少年出生率,即拥有13-19岁孩子的比率,作者也发现了明显的童年暴露效应。另外,从Panel D可知,邻里对于青少年就业的影响是不连续的。作者认为,邻里效应可能部分是由童年不同时期的不同经历所引起的,例如在特定的区域内,某些年龄可以进行夏季工作。

VII. CONCLUSION
本文表明,儿童经济流动的机会是由他们成长的社区决定的。邻里通过影响童年的暴露效应来影响儿童的长期成果——在永久居民收入较高的地区每多生活一年,孩子未来的收入便会提高,并且直到23岁,会以每年4%的暴露率向永久居民的水平收敛。这些结论激励了通过关注地点来改善经济流动性的想法,例如在经济流动性较低的地方进行投资以改善成果,或帮助家庭搬到机会更多的地区。不过,如果要确定具体的政策,就需要确定每个社区的因果关系,并了解是什么使某些社区产生了比其他社区更好的结果。作者也将在这一系列的下一篇论文中对这些问题进行更加详细的分析。
下面这些短链接文章属于合集,可以收藏起来阅读,不然以后都找不到了。

2.5年,计量经济圈近1000篇不重类计量文章,

可直接在公众号菜单栏搜索任何计量相关问题,

Econometrics Circle




数据系列空间矩阵 | 工企数据 | PM2.5 | 市场化指数 | CO2数据 |  夜间灯光 | 官员方言  | 微观数据 | 内部数据计量系列匹配方法 | 内生性 | 工具变量 | DID | 面板数据 | 常用TOOL | 中介调节 | 时间序列 | RDD断点 | 合成控制 | 200篇合辑 | 因果识别 | 社会网络 | 空间DID数据处理Stata | R | Python | 缺失值 | CHIP/ CHNS/CHARLS/CFPS/CGSS等 |干货系列能源环境 | 效率研究 | 空间计量 | 国际经贸 | 计量软件 | 商科研究 | 机器学习 | SSCI | CSSCI | SSCI查询 | 名家经验计量经济圈组织了一个计量社群,有如下特征:热情互助最多前沿趋势最多、社科资料最多、社科数据最多、科研牛人最多、海外名校最多。因此,建议积极进取和有强烈研习激情的中青年学者到社群交流探讨,始终坚信优秀是通过感染优秀而互相成就彼此的。

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存