2020年11月17日,来自中国科学院Libing Shen、复旦大学Funan He和美国得克萨斯大学的Zhao Zhang通过分析新冠病毒基因序列较低的突变概率,重新定义SARS-CoV-2系统进化树,提出SARS-CoV-2溯源新方法:1. 根据简约原则,变异最小(least mutated strain, 最少突变株)的毒株应该是所有SARS-CoV-2的系统发育根/系统发育基础(phylogenetic root),故将最少突变株定义为病毒“根”。2. 利用收集到的全球4571条SARS-CoV-2序列,重新划定出病毒分类子集并指出:印度次大陆最有可能是新冠病毒最早发生人与人之间传播的地点,且最早的病毒时间可以追溯到2019年的7月-8月。相关研究发表在国际权威医学杂志Lancet旗下的预印本平台ssrn.com,题目为“The early cryptic transmission and evolution of SARS-CoV-2 in humanhosts”。部分成果已经经过同行评审发表在《分子系统发育与进化》上。
总结不难发现,由系统发育分析与突变谱相结合认为,武汉市首次鉴定的SARS-CoV-2毒株极不可能成为所有SARS-CoV-2的祖先。根据简约原则,变异最小的菌株应该是所有SARS-CoV-2的祖先。在澳大利亚、孟加拉国、希腊、美国、俄罗斯(塞尔维亚)、意大利、印度和捷克共和国等八个国家都可以找到这一最小突变。理论上,他们中的任何一个都可能是变异最少的毒株的诞生地。SARS-CoV-2由于其低突变性,能够在长时间和广范围的传播后保持其基因组完整性。由于单一/单纯的系统发育分析无法为SARS-CoV-2的起源提供线索,一个常识是病毒的发源地通常有很高的病毒株多样性。在本研究中,实验人员共收集到来自分布2449个毒株集的SARS-CoV-2基因组序列4571个。而美国SARS-CoV-2序列的百分比为71.13%(3297/4571),经最小突变分类后美国SARS-CoV-2毒株的百分比为66.6% (1631/2449)。美国的SARS-CoV-2序列的百分比远远高于它在我们分类数据集中的SARS-CoV-2菌株的百分比,这是病毒株多样性低的标志。在印度和孟加拉国,统计结果表明,这两个国家的病毒株分集率远高于序列占比,这是病毒株多样性高的标志。印度和孟加拉国都位于印度次大陆。沙特阿拉伯具有相对较高的突变多样性,在地理上也接近印度次大陆,就在阿拉伯海对面。以上证据表明,SARS-CoV-2具有很低的突变性,并且在印度和孟加拉国都可以发现最小的突变毒株,科研人员很自然的提出,最早的人与人之间的SARS-CoV-2传播可能发生在印度次大陆。 那么,最早的人对人SARS-CoV-2传播日期是什么时候呢?研究人员指出,根据病毒突变率,SARS-CoV-2每年在其基因编码区累积约11.41个点突变。突变最少的菌株与NC_045512菌株之间存在三个核苷酸差异,那么,两个菌株之间产生分歧的时间约为三或四个月(每月0.951点突变推算)。自第一位SARS-CoV-2患者于2019年12月12日在武汉市住院以来,考虑到SARS-CoV-2具有潜伏期 2天-14天-23天不等的时间分布,武汉的SARS-CoV-2隐性传播必定于2019年11月中或下旬开始。因此,最早的或病毒源头的人对人SARS-CoV-2传播可追溯至2019年7月或8月。参考:This preprint research paper has not been peerreviewed. Electronic copy available at: https://ssrn.com/abstract=3724275