查看原文
其他

诺奖科学家最新成果,通用模型预测任何地区新冠疫情走势,不服来战!

小文、Kai 世界顶尖科学家论坛 2022-05-06



导读


每个人都想知道,这场百年一遇的新冠疫情,将何时结束;科学家们为此彻夜攻关、“捻断数茎须”。
年届73岁的世界顶尖科学家协会副主席、2013年诺贝尔化学奖得主、计算机大师迈克尔·莱维特,带领团队历时5个月的数据搜集和研究、经过90天的攻坚,甚至莱维特本人亲自编程计算,终于发布了最新的科研成果,“野心勃勃”用一条最佳拟合线“通吃”所有地区的新冠疫情预测。
一个数学模型,真的可以做到预测每个地方新冠疫情何时结束,以及确诊人数和死亡人数吗?
莱维特团队开放了所有的研究数据,乃至计算机运算代码。他们说,欢迎全球对他们的成果进行检验,发起挑战!


以色列当地时间6月30日,世界顶尖科学家协会(WLA)副主席、2013年诺贝尔化学奖得主、美国斯坦福大学结构生物学系教授迈克尔·莱维特向世界顶尖科学家论坛(WLF)发来由其领衔的科研团队,在科学预印本平台medRxiv上最新发表的论文——《通过最佳拟合直线预测某地区新冠肺炎(COVID-19)疫情发展轨迹》(Predicting the Trajectory of Any COVID19 Epidemic From the Best Straight Line)。

研究团队来自斯坦福大学医学院结构生物学系等

研究团队以美国约翰·普金斯大学、中国JOBTUBE和印度Rajkumar的统计数据为数据采集源,经过5个月对全球3546个不同国家地区的疫情数据追踪,和长达90天的科研攻坚,发现在许多地点,虽然疫情开始时间不同、具体情况不同,但是对已知数据利用统计学模型进行计算分析后发现线性趋势相似,疫情从高峰回落“曲线变平”的速度相似。

研究团队因此提出假设“是否有可能通过对累计新冠确诊病例或死亡数的数据整合,从而归纳出它的走势规律,在一些新冠疫情爆发早期的地区预测出疫情什么时候会结束爆发?”

带着这样的假设,研究团队进行了一波运算操作,发现可以借助统计学领域的Gompertz曲线函数(编者备注:Gompertz曲线以英国统计学家和数学家B.Gompertz命名。描述现象特点是:初期增长缓慢,以后逐渐加快,当达到一定程度后,增长率又逐渐下降,最后接近一条水平线。该曲线被广泛应用于现象的趋势变动研究。)来验证这个假设,用Y(t) º −ln(ln(N / X(t)) 公式来将确诊人数、死亡人数等数据集全部拟合成一条直线,并因此得出一种新的计算方法,研究团队这称之为最佳拟合线(Best-Line Fitting ,简称BLF)通过计算机编程对大量数据进行运算后,研究团队很幸运地发现这一假设是成立的。

 



以上数据截图反映的是Gompertz函数的运算和对德国疫情对预测|来源论文

“百年一遇”的新冠疫情,截至本周初在全球已造成了超过1000万确诊病例和50万人死亡;在这种全球性的大流行性疾病中,如果能够提前预测可能会造成的病例数和死亡率,那么对于决策者在制定政策以控制病原体和优化医疗资源分配时都会有非常重要的意义。

来自世界各国的众多科研小组都在尝试设计出可靠的疫情预测工具,他们的方法通常都是基于一系列数学和统计模型、综合不同类型的数据,如疾病数据、人口的流动细节和信息以及干预措施的影响(社会疏远、口罩使用以及卫生状况)等。

但这些变量可能因国家而异,即使在同一国家的不同地区,在检测新冠病例的确诊和死亡时候的标准都有可能不一样。所有这些因素都使得开发出一个适合全世界通用、可以预测新冠疫情轨迹的方法变得复杂。

目前暂时没有新冠疫苗和药物正式上市|来源网络

莱维特是计算生物学家,2013年因“发展复杂化学体系多尺度模型”获得当年诺贝尔化学奖,擅长通过各种数据运算方法来寻找普遍规律。研究团队的成果则更像一种“纯粹”的“数字游戏”,从统计数据中去大胆假设,并验证线性回归规律。对莱维特这样的计算机生物学家来说,全球新冠疫情爆发提供了大量的数据供分析,也充分提供了施展的空间和舞台。数据越多越准确,研究结果的可靠性越高

自12月底中国爆发新冠疫情以来,莱维特连续追踪中国的新冠疫情发展,并对新冠疫情发展进行大胆预测(详见文末往期报道),在国内外引发巨大反响。

这位已经73岁的精力旺盛的科学家毕生痴迷数据,此次更用“打鸡血”般的热忱投入到对新冠数据的挖掘分析中。2月2日至3月5日期间,莱维特一共迭代了30份中国地区疫情分析报告,在国内外引发巨大反响和争议。他本人也在国外社交媒体Twitter上持续发声,并接受了包括中国中央电视台、CGTN以及美国福克斯新闻网等在内的多国媒体的专访,来阐述他的研究方法和理论。

莱维特出席世界顶尖科学家论坛|WLF

根据最新的研究披露,虽然他的研究合作伙伴Dr. Scaiewicz用科学家更常用的Python语言来计算大量的数据,莱维特仍然用他从1980年就开始用的一种“老派”的名为Mortran的Fortran系计算机编程高级语言来编写程序,并用f2c转换工具转换成C语言进行运算,把运算效率提升了100倍。研究团队也开放了代码,“这非常易于一个熟练的程序员操作,也欢迎大家来验证我们的公式和模型来反对我们。”在研究报告中,研究团队写道。

莱维特的研究和他大胆的预测,引起了很多争议和批评,主要来自于实验派科学家和流行病学家等,实验派科学家信奉“实验出真知”,而流行病学家则更多考虑在流行病学领域存在的各种变量,但莱维特并不惧怕这样的批评,在前日参加林道诺贝尔得主大会线上科学日活动的圆桌讨论环节时,莱维特就颇为激烈的抨击一些批评者:“他们只是叫我‘停止发声’,却从不研究我的数据。”


莱维特对WLA表示,研究团队选择第一时间将研究成果在预印平台上发布,是“我们以前从未做过的事情”;这样做有两个原因:一是在目前新冠疫情仍在全球蔓延,团队将发现提供给所有人,希望对后期的防控有所帮助;另一个原因则是征求对于科研来说至关重要的广泛批评。

目前,研究团队研究仍在持续,包括更好地理解最佳拟合直线的相关参数,并且希望能够理解不同地点的人口规模、人口年龄/健康程度、地理位置面积、社会距离或封锁措施等是否会影响疫情的预测等等。

莱维特本人在最后结语中写道,“科学是一种极端保守主义的奇怪混合体,为的就是防止错误和激进的范式变化。但我们认为,我们在不到120天的时间内,已经开发了一些重要的分析工具”。研究团队也希望通过更多的全球讨论、交叉检查和合作,可以达成三个月前提出的这一发现,并能以此及时防止世界范围内的许多错误。

关于以上研究所有的表格和数据都可以通过以下APP查询:

1、不同国家最近更新的数据和图片分类显示 :http://levitt1.herokuapp.com/

2、最佳直线预测表图表:http://levitt.herokuapp.com/


(备注:研究以英文原文为准,如文中有因翻译理解不到位产生的错误,欢迎大家后台留言指出。特别感谢小羽、Dora对本文的贡献)

责任编辑:小文

 参 考 链 接 
  • Levitt, M., Scaiewicz, A. & Zonta, F. (2020). Predicting the Trajectory of Any COVID19 Epidemic From the Best Straight Line. medRxiv. https://doi.org/10.1101/2020.06.26.20140814

  • 俊平、何晓群、金勇.统计学(第四版):中国人民大学出版社,2009年:388



 莱 维 特 相 关 疫 情 报 告 



您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存