查看原文
其他

对出生数据的一点梳理

Rick笔记 Rick笔记 2023-06-06

2022年经济数据中,比较引人关注的是人口总量比上年末减少85万人。人口是经济中非常重要又容易被忽视的变量,我们做一点分析。

一、关于出生人口的口径

国家统计局每年发布的出生人口数据,来源于《全国人口变动情况抽样调查》,样本量约占总人口的千分之一,在非普查年份每年进行一次。抽样调查的时点是每年11月1日0点,全年的出生和死亡人口是推算的。

统计局的出生人口数据,是最常用的人口数据,但是在过去的一段时间里,该数据会有修订。我们用年度出生人口数,与小学招生数和人口普查数进行对比。

从结果来看,自1993年-2005年,年度出生人口出现了持续的高估,而2006年-2014年,年度出生人口又出现了持续的低估。2015年以来,年度出生人口非常准确。

2015年之后数据准确的原因可能是,国家卫健委搭建了互联互通出生人口监测数据库,该数据库2015年正式开始系统上报,国家统计局会根据该数据库对人口抽样数据进行校准。

数据的偏差可能影响部分决策,1993年-2005年的出生人口可能被高估,而90后是现在的购房主力群体,如果开发商以90后人口数作为房地产需求测算的依据,是否高估了房地产需求?另一个例子,2006年-2014年的出生人口可能被低估,而这部分群体正在读书,如果教育部门以此核算学位需求,是否会低估学位并造成入学紧张?

二、出生人口抽样的偏差

为什么人口抽样数据与普查数据出现了偏差,我们不太清楚,不过一个视角可能是出生性别比(当年出生的男孩与女孩的比例)。

从生物学的角度看,由于男婴存活率略低于女婴,因此从生理学的角度上看,男女出生性别比会略高于100%,在102-107%之间。从2020年的七普数据看,1988年之前,出生性别比基本在105%左右波动,基本符合生物学规律(由于男性的预期寿命小于女性,因此年龄越大,男性越少,人口普查是时点普查,1975年及以前出生的人群(45岁以上),男性开始相对减少,时间越早越明显)。

但是自1989年之后,出生性别比开始失真,出生男婴数量明显高于女婴,最高点在2003年达到了116.9%,近年来有所回落,2020年为111.2%,但仍高于正常水平。

我们提供一个更微观的视角,每次人口普查都提供普查当年的分性别、孩次的出生人口。从数据来看,2000年和2010年的出生性别比整体上明显高于2020年,而且呈现倒U型,多孩的性别比高于第一孩,比如2000年第二孩的性别比为151.9%,即二胎的男婴比女婴多了一半。根据生物学规律,不同孩次出生的性别是独立的,不应该有显著差异。而2000年和2010年的出生性别比的曲线形态,显示可能有人为筛选的迹象。

而2020年则呈现出不一样的现象,2020年的第一孩性别比为113.2%,仍然偏高,但是第二孩性别比为106.8%,已经接近生物学规律,显示2020年,人们对于婴儿性别的选择性偏好出现了较大变化。

出生性别比的异常上升,与人口抽样偏差的时点接近,两者是否存在相关性?

出生性别比的失衡,也会衍生出别的问题,比如根据七普时间,90后男性一共9356万人,90后女性一共8464万人,男性比女性多了892万人,90后现在是适婚适育年龄,男女比例失衡,是否与现在媒体上报道的高彩礼有相关性?

三、新冠疫情对出生人数的影响

由于“怀胎十月”,外部因素对出生人数的影响有滞后性。从国家卫健委互联互通出生人口监测数据来看,以2015年1-12月的各月出生数量为参照,2020年的月出生人口降幅加大,尤其是11和12月受年初疫情影响,出生人口数量比2015年同期减少45%以上,显示出疫情对出生人口的滞后冲击。

从这个角度上看,2021年出生人数体现了2020年疫情的影响,而2021年作为疫后恢复的一年,其人口出生情况应该主要体现在2022年。但是2022年出生人数956万人,较2021年下降106万,没有体现出2021年的疫后人口反弹。另一方面,2022年疫情对出生人数的负面影响会更明显的体现在2023年。

四、关于出生人口下降的背后原因

影响出生人口的不仅仅是疫情。衡量出生人口有三个常用的指标,分别是出生人口的绝对数量、出生率和总和生育率。

我们最常用的是出生人口的绝对数量,但是这受到人口基数的影响。出生率剔除了人口基数的扰动,但是受到人口年龄结构的影响,比如育龄女性的占比。而总和生育率:如果所有妇女都活到育龄期未并根据每个年龄段给定的生育率生育孩子,则每名妇女将生育的平均子女数。总和生育率可以更直接地衡量生育水平。

国际上通常以总和生育率2.1作为人口世代更替水平,我们观察几个主要经济体总和生育率低于2.0的起始年份,并对齐,来观察各经济体总和生育率的变化。

美、英、日、德、法的总和生育率低于2.0的时点都在上世纪70年代,韩国是1984年,中国是1991年。从总和生育率的变动上看,美、英、法一直维持在较高水平,日本和德国回落较快,但是近期有所恢复,尤其是德国回升明显。

中国的总和生育率一开始保持稳定,但是在2017年后快速回落,2022年为1.18,是图中几个经济体下降速度最快的。从最近的数据看,2015年后韩国的总和生育率大幅下降,2022年为0.84。

为什么出现生育率的下降?我们来看一下育龄妇女分年龄、孩次的生育状况,首先来看总体生育情况。从过去三轮的人口普查数据看,2020年的最高生育年龄出现了明显的推后,2000年和2010年的最高生育年龄都是24岁,2020年是27岁。

如果分孩次来看,一孩的生育率曲线表现出明显的峰值降低、年龄后移的特征,从一孩的高峰生育年龄来看,2000年是23岁,生育率是126.66‰,2010年是24岁,生育率是78.46‰,2020年是26岁,生育率是60.8‰。

而二孩生育率曲线则明显不同,2010年相比于2000年,高峰生育率接近,但是呈现出厚尾的特征。而2020年的二孩生育率,在各年龄段都更高。

从最近5年的生育率来看,2020年一孩生育率出现了右移,高峰年龄大了2岁左右,但是高峰生育率变化不明显。2016年开始实施全面两孩政策之后,二孩生育率出现了全面抬升,2017年最高,但是随后持续回落,2020年已经回落至跟2016年持平。

从过去三次人口普查的数据看,一孩生育推迟、高峰下降,这可能与育龄女性受教育程度提高等因素有关,二孩政策放开后,二孩生育率先升后降。由于二孩生育依赖于一孩,因此只靠生育政策放开,治标不治本。近几年出生人口的快速回落,也与二胎政策基本释放有关。

最近很多文章在讨论人口下降对经济的影响,笔者认为,经济与人口的关系是相互的,生育率的下降,也反映了经济内部的结构性困难。

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存