综述一下中美欧的四篇新冠朔源文章
第一篇是水平最高的,发表于10月30日的《科学》,却由于某种原因也是最不为人知的。领衔作者是西雅图华盛顿大学的病毒基因组学者Trevor Bedford。他们回测了从今年1月1日到3月15日之间收集冷冻的超过一万份门诊或者流感样患者的鼻咽拭子, 第一份新冠阳性样本出现于2月21日的病人采样。也就是说,在2020的整个1月和大部分2月, 在繁华的大西雅图地区都没有检出任何新冠。另一篇文章对他们的数据做了近一步统计模型,考虑到了无症状传播的情况,估算出美国“零号病人”出现的时间为1月6日,95%置信区间是从2019年的12月25日到2020的1月15日。
回测的第一例阳性出现2月21
这篇文章的优点:样本量大,采用的是高精确度的核酸检测。
缺点:没有提供冻存鼻咽拭子样本的具体条件。那么检不出的原因是否是因为新冠RNA的降解?
第二篇文章引发了美国主流媒体和中文社交媒体的关注,这是因为《华尔街时报》做了报道,题目是“新冠很可能在2019的12月中旬即在美国传播”。这个报道的根据是美国CDC在三天前11/30日发表的一篇论文,他们测试了2019年12月中旬收集的1912份血样,测到了39份新冠阳性的样本,比例为2%。
这个来自美国政府的官方文章,如果细品的话,给出了一个比较吓人的数字。由于献血基本上可以看作是来自大众的随机取样,而且这些样本涵盖了美国的广泛疆域。那么,如果在12月中旬美国就有2%的人口已经暴露过新冠了,就是六百万人,死亡率按低了算1%的话也会有高达6万人的死亡,这个很难不被发现。
这篇文章的公信力之所以高,另外一个原因是他的抗体检测做的非常透彻。我曾经写过一文《青岛三天检近千万人,有可能“全部为阴性”吗?》, 解释了青岛的新冠核酸测试是混合粗筛 + 个体回测确认的方式,有能力极大地降低假阳性的比例。
美国CDC这个篇文章,在原理上也是粗筛 + 细筛,但是它的细筛包含了好几套确认环节:1)信号减噪重测;2)血清抗新冠体外实验;3)血清抑制病毒刺突蛋白和ACE2受体结和实验;4)血清和新冠刺突高度特异性的S1结构结和实验。有了如此苦心孤诣地细筛,这个2%的阳性比例就绝不能被简单地视为是样本污染假阳性的可能了。
由于此文的结论和第一文的结论大相径庭,不出意料地第一文的作者Trevor Bedford提出了质疑,他认为去年新冠就在美国悄悄地广泛传播的可能性实在太低,CDC文中检出了抗体阳性,也许是捐血者之前不慎感染了其他种类的冠状病毒,而且他们的抗体刚好也能结合新冠罢了。比如,新冠刺突蛋白的S2亚基,和引发普通感冒的其他冠状病毒很类似,那么感冒的人的抗血清能识别新冠的刺突蛋白,也不奇怪。
我细读了CDC的文章,发现他们所有的新冠“阳性”血清样本中,只有一个人能够特异性识别刺突S1亚基,这个才是新冠显著不同于其他感冒冠状病毒而特有的。所以,这个研究真正检出的“新冠阳性”比例,很可能是大大地低于2%,《华尔街时报》这家世界著名媒体,是不是有点断章取义和标题党了?
只有一个样本展现了针对新冠特异的S1亚基的结合力(红色桃花)
我们上面的提到的统计模型,也被应用到了武汉的一个流感样本回测项目上,该研究估计武汉零号病人出现是在11月17日,95%置信区间从2019的10月26到12月3号。这个估算和美国12月 - 1月有极低比例的新冠暴露的可能也不矛盾。
和第一篇文章相比,CDC的这个研究的优点是,他们的血清样本比冻存的鼻咽提取物稳定很多,很适合回测研究。
缺点是,抗体测试特异性比核酸测试差很多,虽然他们已然采用了很多高端方法进行补救。
第三篇文章来自中国科学院和复旦,以及和他们合作的美国华人学者。他们的结论是新冠的源头可能来自印度次大陆,因为那里的病毒序列的突变率比武汉的样本还低,更有可能是进化的祖先。这篇文章被《环球时报》注意到了,也当然地引发了来自印度媒体的不满和反弹。
不过,目前网上对这个文章的热议却有一个误传,说此文被权威医学杂志《柳叶刀》接受准备发表了。实际情况是正在审稿中。而且枪打出头鸟,此文引发的政治性联想过盛,一下子造成了刷屏,连累得《柳叶刀》一害怕,把网上的预览文从服务器上拿掉了,让很多人失掉了先睹为快的乐趣。
好在此文的方法论证之前已经被一个很扎实的学术杂志《分子系统与进化》发表了(Molecular Phylogenetics and Evolution)。我也通读了此文,综合优缺点如下:
优点:此文通过分析今年1月 - 3月之间世界范围内几百个新冠序列,提出了一个比较新的观察:该病毒缺乏正向选择(Positive Selection)。
解释一下Positive Selection。
构成蛋白质和决定其功能的是20个不同氨基酸分子的排列组合,每一个氨基酸在蛋白中的位点,由基因序列中的三个核苷酸来决定的,但是有意思的是,三个核苷酸的改变有的并不引发其编码氨基酸的改变,比如排在第三位的核苷酸;而排在第一位的核苷酸的突变就必定改变氨基酸。
那么在基因序列随机进化和突变中,造成氨基酸替换的突变(异义突变)和不改变氨基酸的突变(同义突变)频率是固定的。而如果某一个蛋白位点功能特别重要和保守,那么在该位点的异义突变就会被淘汰,比如遗传核酸合成酶的关键性氨基酸如果变化,会造成病毒不能复制繁殖,这样的淘汰叫反向选择(Negative Selection),其结果是在该位点的异义突变大大少于同义突变。
反之,如果某一种突变特别有利于进化,比如人免疫系统蛋白分子对外部病原的识别,或者动物病毒蛋白跨界后对人体环境的的适应。这样的情形下,生命体就会特意地保留这一类的突变,造成在该位蛋白位点的异义数量大大超过同义突变,这就是正向选择(Positive Selection)。
如果新冠病毒在去年底在武汉刚刚完成了从动物到人类的跨界,那么在后来几个月的传播中,我们应该预期会看到病毒对自己的序列做出适应性调整,以便更加适应在人体内繁殖的环境,也就是说Positive Selection。
但事实是没有观察到正向选择,而绝大部分的突变都是中性的。这似乎意味着,在武汉爆发的新冠病毒,从一开始就已经是一种比较适应人体的成熟病毒了(?)。那么,最初的跨界是在什么地方呢?跨界之后的悄然传播又是在什么地方呢?也就是说,源头在什么地方?
此文的这个观察挑战了新冠的武汉起源说。
缺点:此文下载了来自各个国家的很多现成新冠序列,暴力分析一通后让印度次大陆躺枪了。但是和第一文测上万的流感样样本和第二文的回测近万早期血样相比,他们没有属于自己的数据和样本,也就是,干货。这样就注定了哪怕是再逆天的分析能力,也只能是流于假说。
另外,他们采用突变频率来确定进化树位置的方法,尚未得到公认。我不是分子系统学的专业人士也无法评价。
最后一篇文章是来自意大利的,此文的结论就更惊人了,他们测出去年9月的无呼吸道症状的癌症病人血样中的新冠抗体阳性就达到了14%,涵盖意大利各地。
这是否意味着新冠在去年9月就在意大利大流行呢?
应该说此文的技术硬核程度比美国CDC的差一大截。比如,他们的抗体是单位“自制”的,特异性和灵敏度等技术参数都缺缺,很难评估这14%阳性中有多少是假阳性。
也许就是这个原因,这个规模不小颇耗财力的研究仅仅发表在一个叫Tumori Journal的学术杂志上,影响因子连1都不到,这年头影响力如此低的生物医学类期刊都不多见,也许是高标准的杂志不接受这样粗放型的测试?
既然这样我就不对此文多费口舌评论了。
(图片来自网络)
参考资料:
https://science.sciencemag.org/content/370/6516/571
https://www.thelancet.com/journals/eclinm/article/PIIS2589-5370(20)30223-6/fulltext
https://academic.oup.com/cid/advance-article/doi/10.1093/cid/ciaa1785/6012472
https://www.ncbi.nlm.nih.gov/pmc/articles/PMC7684012/
https://journals.sagepub.com/doi/full/10.1177/0300891620974755
https://finance.sina.cn/tech/2020-11-30/detail-iiznctke3952675.d.html?fromtech=1&cre=tianyi&mod=wpage&loc=9&r=0&rfunc=95&tj=cxvideo_wpage&tr=214
https://twitter.com/trvrb/status/1333647437869633537
对美中“零号病人”出现时间的最新探讨新冠病毒推出了升级换代版辉瑞的疫苗结果为什么一定要在大选后宣布?
在疫苗问题上FDA为自己的声誉做最后的斗争疫苗商怼总统:您愿意批准可是我们未必申请世界9大新冠疫苗研发厂商联名发表声明(中英对照) “数十万人”接种新冠疫苗,怎么会无一例“明显不良反应”?对美中“零号病人”出现时间的最新探讨2020,中美新冠疫苗大比拼中国疫苗论文重磅出击,四个“但是”揭示忧喜参半新冠肺炎疫情数据铺天盖地,我们却可能忽略了最重要的参数