其他
[授权转载] Pat老师谈台湾和新加坡超额死亡
前言
今天转载这篇来自知乎老铁 @Pat老师(格式有微调),原文传送门:zhihu.com/question/542634159/answer/2572238920大伙儿觉得不错的话,不妨移步知乎去给他捧个场呗~(评论区尤其精彩哦!)
Pat老师:关于超额死亡,各个机构采用的算法不一样。WHO花了不少力气做的超额死亡分析,结果还是闹得一地鸡毛。想要用复杂的模型计算,当然可以有很多办法。
不过所有办法的核心假设都一样,那就是:一个国家/地区在一定时间内的全因死亡数字,应该是有一个预期值的。并且这个预期值符合某种分布。
上述分布可以通过研究一定时期内的历史数据获得。而所谓超额死亡,就是超出分布范围的奇异值。某些复杂算法产生的“问题”,事实上可以用通过用更简单更没有偏向性的方法来解决。这个办法就是做最简单的回归和做简单的分布。WMD采用的就是这个方法。这样问题就简单多了。剩下的就是如何合理地分析数据了。
拍老师的画外音:所谓的WMD,就是World Mortality Database,具体的方法论见这里:elifesciences.org/articles/6933
Pat老师:既然处理实际数据,就避免不了分析信噪。一般来说,全因死亡有以年为单位的周期性。
所以,横向逐周或逐月比较是非常难的。在跨年的纵向比较则相对容易。时间跨度越长,噪音越小。比如,如果以年为单位进行分析,很多国家的全因死亡将呈线性增加。
——以新加坡为例:
——细分到逐月的全因死亡:
下面要做的是确定一个标准,如何界定特异值。一般来说,将数据逐月纵向转换为分布比较容易看清:
比较难以判断的是2020年1月,2021年7月、8月和12月。用同样的方式计算,这几个月分别超出2.2,5.1,3.0和2.2个标差。其实直观地看图,这四个月份超出分布的距离似乎差不多。但分布本身的偏差值决定了统计是否具有意义。此外,2020年4月和2021年4月分别超出3.8和4.2个标差。
在上图不明显,因为图上的分布被这两个点拉长了。
新加坡这五年内没有其它因素导致大量超额死亡,因此这个界限并不是很明确。我用来界定超额死亡的标准是3个标差。这是一个分析台湾地区数字的经验界限,后面会更详细地解释。
这样,可以确定存在超额死亡的月份为:2020年4月,2021年4月、7月、8月、9月、10月、11月,2022年2月和3月。接下来要做的就是看能否对超额死亡做出解释。既然这段时间完全出现在新冠疫情期间,那么疫情的走势应该可以对应超额死亡:
绿色箭头和紫色箭头显示去年年底和今年年初两波较大的新冠疫情中的损失。 最左侧的红色箭头和蓝色圈标识出较为轻微的疫情损失。 中间的红色箭头即2021年4月,新加坡官方没有报导大规模疫情,但产生了超过4.2标差的死亡数字。
之所以用了这么大篇幅来分析新加坡的疫情,是因为他们的数据相对“干净”。很多其它国家和地区的数据没有那么好的回归性,但用分布的方式来分析基本是可行的。
一、超额死亡只是估算,是半量化指标,并不是确切数字,没有过度追究细节的必要。二、估算超额死亡应尽可能避免偏向性,对统计数据应尽可能多的包容,以获得接近真实的范围。这就意味着以特定年份为基础的估算几乎无法避免偏差。
——好,那么下面看看台湾地区的数据:
这里想特别指出的是,之前每月最多死亡人数的记录来自新冠前。2016年3月H1N1流感爆发,产生了超额死亡。当时不过3.1个标差。这也是“3个标差“”这一经验界限的来源。没有原因的波动幅度,大概可以达到2.5个标差。
这里我想说(复制之前的内容):
台湾2021年在几乎没有疫苗屏障的情况下经历了Alpha疫情。从超额死亡的最完全角度,6月产生了三千人的超额死亡(下图中绿色箭头),7月虽然有一定的死亡,但压在历年的浮动范围上限; 2021年11月两剂疫苗的接种率勉强达到50%的情况下经历Delta疫情,11月产生了两千人的超额死亡(下图中蓝色箭头);12月压在浮动上限; 2022年4月两剂疫苗的接种率达到80%,还有超过一半的三剂接种的情况下经历Omicron疫情,省疫情指挥中心决定采取共存策略,不再尝试以清零为目标,5月产生了三千余人的超额死亡(下图中红色箭头); 然而疫情没有在一个月内结束,6月更产生了七千余人的超额死亡。这就是被称为大号流感的新冠,尤其是Omicron; 作为对比,2016年台湾H1N1流感爆发,3月产生了两千五百余人的超额死亡。这还是在常规措施,没有疫苗屏障,没有任何封控措施的情况下的数字。2月和4月死亡人数接近浮动上限。
虽然尝试进行共存的国家/地区,确实有超额死亡人数逐渐下降,甚至回归正常浮动范围的情况,但我们不禁要向西方学习,问一句:代价是什么?经济和人命都没有保住,只是满足了某些人的自由。