查看原文
其他

拐点究竟何时到来?为什么很难有个准信儿?

丁香园 DXY 丁香园 2020-02-14

本文作者:KellyWeaver,慕尼黑大学流行病学硕士在读


到今天为止,新型冠状病毒肺炎的疫情已经发酵一个多月了。期间,网络上不停涌现出形形色色的预测。不过,这些预测的结果之间差距实在是非常大,简直让人丈二和尚摸不着头脑。


据人民日报报道,钟南山院士在 11 日的一次远程视频病例讨论会议中说:「从目前来看,疫情拐点还无法预测,但峰值应该在 2 月中下旬出现。疫情拐点由返程高峰的防控情况决定。」他同时表示,没有任何人可以做出一个严格的拐点预测。

 

预测此次疫情的趋势,为什么这么难呢?「拐点」究竟何时到来?胜利的终点又在何方?我们到底应该如何看待各类「预言」呢?

 

丁香园邀请来流行病学的专业人士给大家讲讲。

 


精确的预测,需要怎样的数据?

 

通常情况下,在数据能够支持的前提下,预测模型自然是越贴近现实越好。那尽量贴近现实的预测,需要什么样的数据呢?


越精确、越贴近现实的预测,需要越大的样本量支撑,而且模型也越复杂。


例如,在流感数据预测中效果不错的机器学习法,需要至少好几年、多则几十年的高质量数据,才能得到相对满意的预测。

 

然而,此次「新冠肺炎」是一个暴发中的新发传染病疫情,我们面临的实际情况包括:

 

1)能够提取信息的时间窗很短,只有几十天;


2)公开数据的种类很少,几乎只有病例数能用。精确到每天的人群迁徙量、发热门诊量、呼吸疾病就诊量等,都很难得到;


3)对建模而言,更重要的是患者何时感染、何时开始有传染性。而这些数据,都很难再精确到「天」以下,所以病例数的时间序列都只有每天一个点、总共三四十个点。

 

所以,总体来看,我们现在能获取的数据是很贫瘠的。这次的情况肯定是不适合了做类似流感那样的机器学习预测了。好比我们手上才几个枣,实在喂不饱大象啊。

 

那么,拿着这样的数据,来看看我们能干些什么呢?

 

在稍微有点专业性的模型里,只剩下一个对数据要求不那么高的选择了:基于人群区组(compartment)的 SEIR 模型。

 


用 SEIR 模型,就可以精确预测了吗?

 

SEIR 这个模型的「基本款」是如此简单,以至于有点简陋,它假设:


1)R0基本再生数)从头到尾都不变;

2)每个感染者和每个易感者接触的概率都是完全相等的;

3)不考虑超级传播者的存在;

4)不考虑漏诊。

 

结合现实情况,如果这个模型不经修正就直接套用可能存在如下问题

 

首先,由于新型冠状病毒感染者在潜伏期也能传染,全国各地目前的确诊人数并不能完全客观反应真实患者人数,在局部地区,甚至可能只能反映当地疫情的冰山一角;

 

第二,由于我国政府在疫情不同阶段采取了效果非常明显的封锁、排查措施,导致湖北以外地区人与人之间的接触频率下降,发现感染者的效率也明显不同于武汉乃至湖北。这些都会影响 R0;

 

第三,「超级传播者」目前也已逐渐浮出水面,一个人传几十上百人的事时常见诸报端。

 

第四,全国 14 亿人,就算目前确诊 3 万人,显然,北京确诊患者传染与他同小区的其他人的概率,和他传染新疆克拉玛依的一位农民的概率肯定是不同的。

 

那么问题来了:如果希望数据预测能够尽可能贴近真实情况,每个省的数据应该如何加权?我国采取的减少外出、延长休假等措施,还有超级传播者,以及不同人之间传播概率不同,到底如何在模型中反映?

 

朋友,恭喜你,我们终于来到了传染病数学建模里最考验一个人知识功底的环节——定参数设计模型,也常被我们自嘲为「拍脑袋」。


 图片来源:图虫创意



「拍脑袋」时可能遇到的坑

 

其实,「拍脑袋」这一表达更多是一种调侃。这只是说,相对于 1 就是 1、2 就是 2 的数据本身而言,如何设置模型参数、如何调整模型结构,就会变得非常主观了。

 

如果是像埃博拉、流感这样重复出现的疾病,起码建模时各种参数还能依靠以往的经验来设置;但遗憾的是,新型冠状病毒流行病学特征独特,潜伏期长、潜伏期可传染、传播能力更强、更少依赖超级传播者……这些,都使得预测模型无法直接套用 SARS 的各项参数,虽然两者都是冠状病毒。

 

而对于此次疫情的建模,到底能不能无限接近真实情况,就只能取决于建模者的知识基础、建模经验和谨慎程度了。

 

因此,我们就能看到,同样是 SEIR 模型,有的人只能发微博,还错得离谱;有的人发在预印本平台上,但结果也没好到哪儿去;有的人就可以发柳叶刀、NEJM。

 

事实上,目前互联网上流传的几个预测之间相差那么大,原因很大程度上就是在这个自由裁量的环节出现了分歧。

 

同样是「拍脑袋」,有的人有理有据,会尊重现实状况调整模型的结构和假设,结论也充分尊重不确定性。因此,最后得到的模型,无论是对于防控还是决策,都具有参考价值。

 

而有的人,就真是在拍脑袋。 前文提到的 SEIR 模型的几个理想化的假设,一个都不调整;参数也设置得特别离谱。于是最后模型预测结果夸张无比,弄出比零防控措施的流感的感染人数还多几倍的结果,很没有参考意义。

 

所以,看一个模型的预测结果,绝对不能只关注结果本身只有判断了模型的假设和参数是否合理,并与事实相互对照,才能采信或者拒绝预测结果。

 


更大都坑还在后面,我们永远无法验证模型

 

模型要变得越来越准,离不开反复对照现实校正自身的过程。遗憾的是,与预测天气预报不同,这在传染病学,是很难做到的。

 

现实情况是不断变化的,而且有些变化甚至还可能是由于你的模型结果公之于众导致的。而且,时间拉得越长,发生变化的可能性就越高,你的预测还能说对的可能性就会越来越低。

 

比如说,假设你做了一个模型,在 1 月 27 日的时候预测 2 月 1 日确诊病例过万。结果,29 日的时候,疑似病例的定义被放宽了一次,更多的人得到了筛查,于是,2 月 1 日那天的确诊病例数就高于你所预测的那个数字了。

 

所以,做传染病流行病学的建模,大家都认可一句名言:你永远不可能知道你是不是对的。

 


总结:到底应该如何看待各类预测?

 

目前来看,想要对暴发中的新发传染病,做出精准的中长期趋势预测,仍然是一个世界性的难题。

 

总的来说,以目前的技术,我们能够有比较高把握做对的,是在假定一切条件不变的情况下,对未来数天内的疫情走势做出一个短期预测。所以,钟南山院士说的「『拐点』尚未到来」、「全国情况稳定,但武汉不太一样」等结论,实际上就是基于目前的情况所给出的数天内的短期预测,是实事求是、科学的。

 

而对未来更长时间的预测,虽然仍然可以做,但由于「一切条件不变」这个假设没法在长时间下一直成立,最后预测的数字还能严丝合缝符合的几率是很低的。甚至,基本上可以说,如果预测的时期超过 2 周,那么就算最后对了,大概率也是蒙对的。如果错了,才是正常的。


因此,现在有些人去回顾 12 天前部分专家的预测,批判他们说「说好的拐点,元宵节后也没来」,也是过于苛刻的。

 

对长期预测的模型,相比给出的夸张、绝对的数字,我们更应关注它对各类防控措施效果的预估,并且必须仔细推敲它的假设和参数是否合理。

 

所以,希望各位读完本文后能够明白:无论近期各路专家如何给出预测,只要是中长期的预测,那么即便预测正确,也应当知道,其中运气成分不小,不值得盲目崇拜;错了就更是正常的,没有任何必要指责。

 

务必理性看待预测结果,不盲目相信,也不盲目批评,这样就是对科学最好的尊重了。


编辑:费菲,题图来源:图虫创意

丁香园正面向全体读者征稿!

如果你是身在一线的医务工作者、患者、患者家属、医疗防护设备厂商……只要你了解与此次疫情相关的线索,请与我们联系。

丁香园 郑宇钧:13141332233(微信)

丁香园 果子:scj389129661(微信)

丁香园 杨媛:joydaxiudela(微信)

丁香园 陈以寒:yeyouc_ (微信)

丁香园 周悦:jerrylover9(微信)

投稿邮箱:tougao@dxy.cn

添加微信时,请务必备注「线索主要内容+个人职业+所属单位」。



相关阅读点击查看:为什么武汉的「病死率」比全国其他地方高那么多?


两例重症肺炎,为何一例治愈,一例死亡?哈医大附属二院于百全副主任医师分享 2 例重症肺炎治疗成功和失败的案例,总结了新冠肺炎诊治的 6 条经验,点击「阅读原文」查看课程详情。



↓↓点击「阅读原文」免费学习新冠课程!

    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存