查看原文
其他

[搬运工] 数据迷思4:谈谈生命表和“预期寿命”

拍老师 拍帮主的后花园 2022-12-17

前言

各位早上好上午好中午好下午好晚上好~为了配合大号那边关于美帝人均预期寿命的讨论,这边特地转大佬曹天元老师关于预期寿命的硬核科普文一篇,还请大家给曹老师多多捧场。


第一部分:

首先,很多人说在计算超额死亡时,要考虑人口老龄化之类的影响。毫无疑问,这是再显然不过的,事实上,任何人在研究相关问题时,首要的目标必然应该是考虑这个。但之前明明说了,我们计算的时候已经按照生命表调整过数字,为什么还有很多人在上面纠结呢?使用生命表还能有什么原因?最主要的目的,当然就是为了要消除年龄结构变动所带来的影响啊。所以,似乎还有不少人没弄懂到底什么是“超额死亡”的标准。它并不是看死亡的“绝对数字”,而是看各个年龄层面临的“相对风险”,或者说“死亡概率”的大小。
比方说,在“正常”情况下,一个70岁的男性,每年死亡的概率为百分之2.23,那么,只要这个概率没有发生明显变动,我们就不认为发生了“超额死亡”。换一个角度,你也可以这样想。如果一个国家里有100万70岁男性,那么每年应该“正常死亡”22300人。但是,如果未来的某一天,因为老龄化的缘故,这个国家里70岁男性数量慢慢达到了200万,那么对应来说,该群体每年就应该“正常死亡”44600人才对,这是很简单直接的推论,完全不值得大惊小怪。
虽然绝对死亡数字增加了一倍,但只要做一个除法,我们就可以发现,平均到每个个体,该年龄的死亡概率并没有发生明显变化,仍属于“正常情况”。
而反过来,只要死亡概率提升,哪怕绝对数量没有变化,这也是“不正常”的。比方说,如果哪天70岁男性减少到了原来的一半,只剩下50万了,但每年却仍然要死两万多个人,这就很蹊跷,相当于每个人的风险都翻倍了。
在这种情况下,我们就会认为该年龄层在当年出现了100%的“额外风险”,也就是两万多人里面有一半是“超额”死亡的。
不过,现实告诉我们,各个年龄层的“死亡概率”,在一般情况下都是基本保持稳定的,并不会大起大落。事实上,每个国家的统计局都会编纂“人口生命表”,这个表里面就列出了各个年龄和性别分别对应的“死亡概率”,大家有兴趣的话可以去查一查。在这里,我随便列举一个美国最新版的生命表,它长得像这个样子:这其中,年龄(Age)之后的第一栏,写作qx的,就是“每年死亡概率”。比方说对应0-1岁的qx是0.005045,说明每一百万个刚出生的婴儿,大概在出生的当年会死亡5045人。
之所以拿这个概率作为判断标准,是因为它是一个很好的参照对象。通常来说,如果环境没有发生急剧变化,各年龄层的qx就会基本保持稳定。当然,长期来看,随着经济发展和科技医疗的进步,它会随着时间逐渐降低,但那是一个相当缓慢的趋势。如果我们仅仅关注几年或者十几年的区间的话,基本上可以近似认为qx是不变的。
如果你对此还有怀疑的话,可以想想人寿保险。基本上,保险公司就是靠生命表来赚钱的,而且这钱赚得相当稳定。如果最基本的死亡风险概率居然上蹿下跳,大起大落,那每年可就不知要倒闭多少保险公司了。
理解了死亡概率之后,我们就能明白,所谓的“老龄化”跟我们判断超额死亡没有任何关系。老龄化指的是年龄结构分布的变化,比方说,美国2022年人口结构是这个样子:我们可以看到,在这个“人口金字塔”图上,有两个凸起,上面那波对应着60-70岁区间,也就是所谓战后出生的“婴儿潮”一代,而下面那波20-30岁的,则是他们的后代。
因为这两个区间的人数特别多,所以每年,他们占的死亡人数也就会相对多一些。而随着“婴儿潮”一代走进老年,他们的绝对死亡数量还会迅速增加,很快将占据总死亡人数的大部分。 

不过,绝对数量的增加并不意味着他们的“死亡风险”变高了。事实上,疫情之前,每一个年龄层每年的死亡比例仍然符合生命表中的数据,而对于任何一个单独的个体来说,每年的“死亡概率”也并没有大幅提升。
因此,未来的死亡数量究竟是增是减,乃至具体增加多少,其实都可以通过模型精确地预测并模拟出来,这也是人口研究中最基本的常识和工作(事实上,为了避免年龄结构造成的影响,我们时常还会采用“标准死亡率”的概念,不过这里就不多说了)。

当然了,计算人口的时候,还会牵涉到一些其他因素,比方说出生率,还有外来移民等等。但我们可以做一些假设,比方说假定美国每年的生育率下降1%,然后每年还会补充80万左右的外来移民,这些变量都定下来之后,在生命表数字的基础上,我们就可以通过计算机很精确地模拟美国总人口的变化。
比方说,因为老龄化的缘故,可以预期美国每年的死亡人数将一路直线上升,从2022年的311万左右, 到2030年上升到365万。这是因为“婴儿潮”一代已经快到自然死亡阶段,而这种死亡数字的上升是预料之中,毫不奇怪的。
顺便说一句,虽然死亡数字在增加,但至少在一段时间之内,每年的出生人数仍然将大于死亡数,加上还有移民的补充,所以美国的总人口仍将缓慢上升,直到2030年之后才会陷入停滞。
通过模拟,我们甚至还能准确预言未来美国人口结构的变化,比方说,下面就是2030年美国各年龄层的“改变”。可以看到两波婴儿潮的高峰随着慢慢老去,逐渐上移,而年轻人则会在很长一段时间里持续减少。但是,这里又要再次强调,以上无论是死亡数字的增加,还是人口结构的变动,都丝毫没有改变各年龄层相对应的qx,也就是死亡概率。要知道概率是一种“比例”,只要每百万人口中,每年的死亡比例不改变,那qx就是稳定的,死的人再多,也属于“正常”情况。而我们说的“超额”是什么呢?是qx本身发生了剧烈变化,“死亡概率”大幅提升了。这正是疫情造成的结果。

比方说2020年,我们预测当年应该“正常死亡”298万,这个数字比2019年要多,因为本来就已经考虑了老龄化的因素。而2021年,这个“正常死亡”的预测进一步上升到了304万,今年是2022年,本来“正常”应该是死亡311万,这些都是可以通过生命表精确预测出来的,前提是qx不变。
但疫情造成的结果是:在已经考虑正常老龄化的前提下,仍然叠加了更多死亡,这部分才是多出来的“超额死亡”。2020年,美国总体的死亡概率qx上升了15.1%,2021年进一步上升了13.33%(其中高龄老人降低了,但青壮年却大幅提升),今年前9个礼拜,如果换算到全年,整体qx还在升高,又继续提升了27.1%!
这才是我们说的“超额”的意思,它的意思不是死亡绝对数量在增加,而是死亡的“风险概率”在增加!实际上,这个“死亡概率的变化”,对应着大家可能更加熟悉的另一个概念,也就是所谓的“预期寿命”。
当然了,很多人对“预期寿命”也存在很大的误解,不少人把它理解成“平均年龄”,或者死亡时的平均岁数,所以经常会看到网上有人说什么香港的预期寿命是85,而因新冠死亡年龄的中位数也不过86云云。但其实,这是两个毫不相关的概念,并不能拿来互相比较,它们甚至连单位都不一样!
“预期寿命”的单位是“年”,而不是“岁”,它代表什么意思呢?其实指的是在某个特定的年龄下,一个人“平均”还能享有多少存活时间。一般来说,如果我们不加特别的定语,通常指的是一个刚出生的0岁婴儿,在目前死亡风险不变的情况下,平均还能存活多少年。
可能你还是没听出这跟“平均年龄”有啥区别,那我们这样说吧。其实任何年龄的人,都有自己特定的“预期寿命”。以香港为例,如果一个0岁婴儿的预期寿命是85,那一个90岁老人呢?难道他的预期寿命是-5岁?这当然是不可能的。既然这个老人还没有去世,那么,我们自然会“预期”他将存活更多的年数,而这个预期无论如何也不可能是负数。事实上,我们查香港的人口生命表就知道,一个婴儿的预期寿命是85年,一个20岁青年的预期寿命是66年,而一个84岁的老人,则还有9.35年的预期寿命。
所以大家可以发现,这个所谓的预期寿命,他指的是“剩下还可以活”的年数,所以年龄越高,预期寿命越短。但是,如果你把它跟某人本身的年龄叠加起来,“总存活时间”却始终在增加。比方说一个婴儿0岁,意味着他平均还能活85年,而一个青年已经活到20岁,再加上66年的预期寿命,就是说平均可以活到86岁,看,比婴儿多活一年!最后,一个84岁的老人“已经”活了84年,再叠加9年的预期寿命,于是平均可以活到93岁多,能比婴儿“预期多活”8年。
为什么会是这样呢?其实简单地想想就能明白。因为在任何年龄段,不管怎么年轻,都始终会有一定的“死亡风险”。我们前面提到,一个刚出生的婴儿,当年会有千分之5的概率死亡。而接下来,一岁,两岁……每年都会有一个特定的死亡概率qx,你需要一定的“运气”,才能跨过那道坎,活到下一年。
所以,综合来看,其实一个刚出生的婴儿,他的人生“风险”才是最大的。因为他即将要面临每一个年龄段qx的“死亡考验”。虽然概率不大,但总归有一个可能性,比方说在5岁,或者18岁,或者任何一年不小心挂掉了。因此计算下来,这些可能性就“拉低”了他平均还能存活的时间。
而一个20岁的青年,他还要面对21岁、22岁……乃至40,50,60岁等等风险,这些未来的qx都是固定的,跟婴儿相比,不多也不少。但好在,我们至少能肯定一点,就是这位年轻人既然已经活到了20岁,那至少前20年的风险,他算是“迈过去”了。绝不可能再发生因为3岁的qx,而重新导致他死亡这种事情。
而一位90岁的老人呢?他已经成功地迈过人生中绝大多数的“坎”,先后逃过了90个不同年份qx的死亡考验,因此,随着每一次“成功闯关”,他的“总预期寿命”也永远在增加,哪怕活到200岁,他剩下的“预期寿命”也仍然是正数,毕竟没人可以把时间倒转,“回到过去”之后再死。人生就像一道道关卡,总有一扇门后会等来死神……
所以,请大家不要再把婴儿的预期寿命跟老人的死亡年龄放到一起比较,因为根本就没有可比性。婴儿的预期寿命其实是“最低”的,而一位已经活到85岁的老人,他的预期寿命加上年龄本身,自然肯定要超过85。实际上,任何人只要死亡,哪怕他已经活了100岁,也照样会拉低整体的“预期寿命”,因为没有人的“预期”会是负数。而反过来,任何人“多活了一年”,就会提升预期寿命,至于总体是上升还是下降,那就要看双方的比例了。
但是不要忘记,我们前面还提到,预期寿命指的是“在目前死亡风险不变的情况下”计算出来的结果。简单地说,他假设目前各个年龄段的qx都是不变的。当然从长期来看,随着医疗水平,营养水平的不断增加,qx肯定会逐渐降低,也就意味着预期寿命将不断提高。
比方说我国的十四五规划当中就提出,要在五年之内,争取把平均预期寿命再提高一年。但通常来说,因为qx很难急剧变化,所以这个提高的过程一般也是缓慢的,无法一蹴而就的。


第二部分:

然而,新冠疫情发生之后,产生了大量的“超额死亡”,注意,我们上面说了,这个“超额”的意思是,连带死亡概率qx也大幅提高了!因此,它带来的后果就是,所有美国人面临的“死亡风险”都提高了,“继续存活”将遇到更大的困难。因此计算下来,美国的平均预期寿命就发生了大幅的跳水。
大家可能在新闻上也都看到过,2020年,美国的预期寿命从78.86直接下降到76.99,降幅高达将近2年!这使得它的预期寿命已经低于中国。而2021年,这个数字竟然还在进一步下降,很可能要降到76.5年以下,回到上个世纪的水平。不过,我在这里提到这件事,是因为预期寿命这个指标,其实可以粗略地看做“超额死亡率”提升幅度的一个考量。如果你自己动笔计算一下,就能知道,决定0岁婴儿“预期”寿命的,实际上就是所有年龄段的qx“累积”下来的风险程度。风险越大,预期寿命越低(计算其实很简单,无非加减乘除而已,关键是要理解概念)。
所以,2020年美国预期寿命大幅降低,正说明当年发生了大量的“超额”死亡。注意,只有超额死亡,才能导致预期寿命下降,正常的老龄化死亡,不会改变风险概率,也就不会影响到预期寿命
而2021年,美国预期寿命进一步下降,这是为什么?如果超额风险保持不变,那预期寿命最多就是维持在低位徘徊,不会变化。继续下降,说明虽然表面数字看上去差不多,但2021年的超额风险其实是在进一步提升!这就是我上次说的,因为前一年有大量“超死”留下的坑,所以叠加到次年,哪怕看上去数字没变,但其实背后隐藏了更多的超额死亡,没有显露出来而已,然而,这些情况依然会反映到预期寿命这个指标上。它告诉我们:其实所有人面临的风险仍然在进一步提升。
当然了,预期寿命只是一个临时数字,它只能反映“当前”的风险状况,所以也无需将其看得太重。如果有一天,疫情缓解,就像我们之前说的,那意味着未来必将迎来一波“缺额死亡”,以填补之前留下的大窟窿。到那时,因为风险反而“低于”平时,美国的预期寿命自然也会重新大幅反弹,甚至还会高于疫情之前,这是绝对可以预料到的,既不值得吹嘘,也没有什么值得大惊小怪的地方。
总而言之,如果当下存在“超额”死亡风险,那预期寿命就会降低,而如果“缺额”了,那它就会升高。只不过从目前的情况来看,美国必然还处在“超额”的状态,这就是为什么我们说这波疫情绝对还未过去的原因。
原作者:曹天元老师发布于 2022-05-23 08:35


以上,多谢曹老师授权,请大家为曹老师鼓掌!各位有空的话,不妨移步曹老师的知乎专栏给他捧场。另,咱这边之前还转过曹老师《数据迷思》系列的其他几集,
详见:《数据迷思1:新冠只对老年人有害吗?》
《数据迷思3:“超额死亡”背后的真相》


本人知识星球暂时下线~
预计9月24日恢复。
如需留言评论,请移步后花园:


以及,本人微博(终于)重开


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存