撰文 | 赵素文(上海科技大学iHuman研究所研究员,主要从事计算生物学研究)导读:找到新冠病毒的中间宿主,对理解和切断其传播途径的意义不言而喻。从一月底以来,中美科学家陆续宣布穿山甲是新冠病毒的潜在中间宿主,话都没太说死(尽管媒体对此的报道经常语不惊人死不休),这是因为穿山甲中发现的几株冠状病毒跟新冠病毒还真没那么像,其实还远比不上此前石正丽老师在云南发现的一种蝙蝠冠状病毒。穿山甲病毒引起科学家的重视,正是因为它只在冠状病毒非常关键的一个蛋白的非常关键的一个区域(只占基因组全长的百分之一)和新冠病毒像。而这种像,又主要体现在蛋白层面而非核酸层面。严格说来,我们离发现新冠病毒的中间宿主还有一段不小的距离。17年前,SARS流行的时候,科学家们找到的中间宿主是果子狸,一时间果子狸销声匿迹。新冠爆发后,大家才发现活果子狸在武汉华南海鲜市场堂而皇之地标价130块一斤。现在,科学家们发现穿山甲是新冠病毒的潜在中间宿主,希望穿山甲得救了,希望我们不再重蹈覆辙。
从2019年末起,新冠病毒在武汉大爆发,引发了一场严重的公共卫生事件。寻找新冠病毒(2019-nCoV)的天然宿主和中间宿主,对切断其感染人的传播路径意义重大。目前,研究者普遍认为蝙蝠是新冠病毒的天然宿主,中科院武汉病毒所石正丽课题组于2020年2月3日发表在Nature上的文章(2020年1月23日,该文章发表在预印本网站BioRxiv)加强了这种看法(Nature背靠背 | 张永振、石正丽团队分别发表文章报道武汉新型冠状病毒)。这篇文章指出,蝙蝠冠状病毒RaTG13 (Bat CoV RaTG13)和新冠病毒在全基因组层面的序列相同度(sequence identity,也常被称作序列一致性,但不应称作序列相似性)高达96%(图1)。其中序列相同度最低处发生在关键的刺突蛋白(图中简称S)上,特别是刺突的受体结合区域(receptor binding domain,简称RBD)。这一点并不奇怪,因为SARS类冠状病毒的刺突蛋白中的受体结合域(RBD)是病毒基因组中最易变化的。图1. 左图:目前已知的病毒中,蝙蝠冠状病毒RaTG13(左图蓝线)和新冠病毒最近,全基因组层面的序列相同度达96%。但在关键的刺突蛋白(S)的受体结合区域,序列相同度最低(~90%)。左图横坐标是新冠病毒基因组核酸位点编号,纵坐标是核酸序列相同度,图片来自石正丽课题组Nature一文中图1c。右图:新冠病毒刺突蛋白的结构,其中蓝色小球标记的是蝙蝠冠状病毒RaTG13和新冠病毒氨基酸残基不一致的地方(即突变),很显然,这些突变在受体结合区域(RBD)非常集中。这意味着蝙蝠冠状病毒RaTG13和新冠病毒对人的感染性差异巨大。为什么说刺突蛋白关键呢?因为它是新冠病毒感染宿主细胞的罪魁祸首。大家看一眼新冠病毒的结构就可以秒懂。刺突蛋白就是位于病毒颗粒最外层的紫红色花苞样蛋白(下图)。当病毒颗粒接近宿主细胞时,刺突蛋白识别并牢牢地抓住在宿主细胞上的ACE2蛋白,把病毒颗粒“锚定”在宿主细胞上。因此,刺突蛋白的性质对病毒的感染性是至关重要的。刺突蛋白差别大也意味着感染性差别大。图2. 刺突蛋白在新冠病毒中的位置(上图,来自Wikipedia)。SARS病毒刺突蛋白的结构,新冠病毒的刺突蛋白结构上与之类似(下图)。二、在刺突蛋白的受体结合区域,穿山甲冠状病毒和新冠病毒最像在目前核酸序列数据库中,和新冠病毒刺突蛋白的编码序列最近接的是哪个呢?是从病死的马来穿山甲中检测到一种冠状病毒,该病毒是由广东省生物资源应用研究所的陈金平团队去年通过宏基因组测序测到的,相关文章“病毒宏基因组揭示了马来亚穿山甲仙台病毒和冠状病毒的感染(Viral Metagenomics Revealed Sendai Virus and Coronavirus Infection of Malayan Pangolins)”于2019年10月24日发表在Viruses杂志上(详见BioArt报道:穿山甲是新型冠状病毒中间宿主吗?已有论文或可支持)。在这篇文章中,陈金平团队发现马来穿山甲“肺07”和“肺08”样本的病毒宏基因组中有十几条冠状病毒片段和SARS及SARS类病毒序列相同度达80-89%,但很遗憾的是他们并没有组装这些片段。更遗憾的是这个工作当时并未引起大家的关注。陈金平团队把测序数据于2019年9月20日上传到了美国NCBI数据库,在数据库中宏基因组项目号是PRJNA573298,名称为“死穿山甲个体宏基因组中的病毒组(Virome of dead pangolin individuals Metagenome)”,共有21个样本的数据,这些数据在2020年1月22日后可以公开查询。这个数据可以公开查询后,很快就受到了美国贝勒医学院Joe Petrosino课题组的关注。因为他们当时正在哺乳动物的病毒宏基因组中寻找新冠病毒的类似物,以期找到新冠病毒的源头或中间宿主。2020年1月31日,Joe Petrosino课题组的生物信息学程序员Matthew Wong(ID是torptube),在病毒学网站http://virological.org 上发帖,报告了他们的最新发现,即在刺突蛋白的受体结合区域,穿山甲冠状病毒和新冠病毒高度一致,蛋白的序列相同度达97%,远超石正丽课题组报道的基因组层面和新冠病毒最像的蝙蝠冠状病毒RaTG13。然而,他们也注意到,在全基因组层面,穿山甲冠状病毒和新冠病毒序列相同度为91%,还是比不上蝙蝠冠状病毒RaTG13。因此,该团队推测,从RaTG13演化到新冠病毒的过程中,发生过(不止一次)重组,而穿山甲参与了其中的一环。2月14日,Joe Petrosino团队把相关论文发表在BioRxiv上(提交时间为2月7日)。图3. 在刺突蛋白的受体结合区域(上图灰色高亮区域,下图),马来穿山甲病毒和新冠病毒最像。
穿山甲冠状病毒的基因组,是Joe Petrosino团队使用VirMap这个工具,用新冠病毒做模板,从穿山甲病毒宏基因组中组装出来的,基因组的完整度是85%。考虑到新冠病毒全长29900多个碱基,穿甲山冠状病毒基因组缺了约4500个碱基。这些缺失是由于冠状病毒在宏基因组中的丰度不足造成的,需要我国科学家找到原样本或类似样本,分离出冠状病毒再进行测序,即可得到穿山甲冠状病毒的完整基因组。这项工作是否已经在进行了呢?答案是肯定的。2020年2月7日,华南农业大学召开新闻发布会宣布,发现穿山甲是新冠病毒疫情的潜在中间宿主,因为从穿山甲中分离出的毒株与新冠毒株相似度(注:笔者怀疑此处应为相同度,即sequence identity,而非sequence similarity)达99%。由于相关论文尚未出炉,虽然笔者倾向于认为99%是全基因组层面的序列相同度,但99%的覆盖范围(coverage)到底是全基因组层面上的还是局部的,是核酸层面的还是蛋白层面的毕竟还透露得不够清楚。结果华南农大的数据还没有公布(BioArt认为,不公布数据或者发表学术论文,而是仅仅通过新闻发布会的形式公布成果是很难得到学术界认可的,科学讲究有一份证据说一分话),昨天管轶团队的文章今天在bioRxiv先发表了,管轶团队所用样品的广东部分和陈金平团队及华南农大团队来自同一批海关缉私行动。只是,管轶团队的结果和Joe Petrosino团队的结果非常相似,他们发现,在全基因组层面,穿山甲冠状病毒并没有比蝙蝠冠状病毒RaTG13更靠近新冠病毒。也就是说,论起和新冠病毒的亲疏远近,还是蝙蝠冠状病毒RaTG13排第一,穿山甲冠状病毒目前屈居第二。然而,对于受体结合区域蛋白层面的相同度远高于核酸层面相同度的事实,管轶团队并不倾向认为是发生了重组,而是认为可能发生了趋同进化。到底穿山甲中有没有另外一种冠状病毒和新冠病毒的序列相同度达99%,有待华南农大团队尽快发表相关数据才可能见分晓。三、穿甲山冠状病毒的刺突蛋白和新冠病毒的刺突蛋白还存在重大区别值得注意的是,Joe Petrosino团队所组装的穿山甲冠状病毒基因组中的刺突蛋白,在核酸层面和蛋白层面和新冠病毒的序列相同性分别为89%和91%,只是在受体结合区域,蛋白层面的相似性才达到97%,且与ACE2结合界面上的几个关键的氨基酸和新冠病毒是完全一致的。这说明,从穿山甲冠状病毒的刺突蛋白演化到新冠病毒的刺突蛋白,可能还要颇费周折。特别值得注意的是,在刺突蛋白区域,穿山甲冠状病毒和新冠病毒还有一个重大区别。这要从SARS类病毒的刺突蛋白感染宿主细胞的机制说起。在SARS类病毒感染宿主细胞的过程中,刺突蛋白会被蛋白酶首先切为S1和S2的两部分,这种切割有助于病毒的侵染,这是因为S1完成了把冠状病毒拉近细胞的任务后,需要离去以暴露被其包埋住的S2的头部,使得S2的头部可以插入宿主的细胞膜(图4)。新冠病毒的刺突蛋白有个短序列插入PRRA,正好位于S1和S2之间,这个插入和紧接其后的R构成了一个Furin蛋白酶切位点RRAR。这是新冠病毒独有的特征,其它SARS类病毒(包括SARS,蝙蝠冠状病毒RaTG13和穿山甲冠状病毒)都不含这个短序列插入(BioArt注:高毒力禽流感病毒和人流感病毒常发生,MERS也有furin-like酶的位点)。通俗地说,S1和S2之间Furin酶切位点的存在使新冠病毒获得了“强力加持”,使其感染性超过SARS病毒。事实上,早在2009年,就曾有研究者在SARS病毒中S1和S2位点之间引入Furin酶切位点(SARS病毒本身不含该位点),结果发现引入后SARS的感染性变高了。图4. 上图:新冠病毒(即图中nCov-2019)在S1和S2之间具有独特PRRA插入,因此获得了一个Furin酶切位点,图片来自参考文献中Matthew Wong的文章。下图:SARS类病毒感染宿主细胞的机理。新冠病毒S1和S2之间独特的Furin酶切位点“强力加持”了新冠病毒的感染性,因为它使得S1在完成抓住宿主细胞的任务之后容易及时离去,帮助病毒快速侵染宿主细胞。前文提到,穿山甲病毒宏基因组是有广东省应用资源研究所的陈金平团队测到的,那么为什么最近宣布穿山甲是潜在中间宿主的单位是华南农业大学呢?笔者查阅新闻发现,这两家使用的样品应该是同一批。根据《广州日报》的去年4月19日的文章《21只获救穿山甲仅5只存活 专家:效果理想》,和《三联生活周刊》今年2月15日的文章《调查 | 最后的穿山甲》,陈金平团队所使用的穿山甲组织样本来自于去年3月23日广东和广西海关的一次联合缉私,那次共截获了103只来自越南的马来穿山甲,其中21只在去年3月25日被送往了广东省野生动物保护中心,68只在3月26日被送到广西陆生野生动物救护与疫源疫病研究中心,另外14只没提下落,也许在移交前已经死亡,毕竟其中很多只都是严重受伤,健康状况不佳。其中交给广东省野生动物救护中心的这21只,截止到全年4月16日,已经死亡了16只,其中5只在3月就伤重不治,另外11只在4月份陆续因病而亡,不少得的是肺炎。剩余的5只,又陆续死亡了3只,其中至少一只死亡前几天有流鼻涕的症状。在救助穿山甲的过程中,广东省野生动物救护中心曾在4月16日邀请中国野生动物保护协会救护委员会、湖南省野生动物救护中心、广东省生物资源应用研究所、华南师范大学、广东省动物学会、广州动物园、长隆野生动物世界、深圳野生动物园多位专家,就海关缉私部门移交的穿山甲救护问题进行研讨。因此,才有了陈金平团队使用死亡穿山甲的组织样本来进行病毒宏基因测序,才有了不久前华南师范大学宣布穿山甲为潜在中间宿主。必须重申的是,穿山甲冠状病毒,在全基因组层面,和新冠病毒的序列相同性低于蝙蝠冠状病毒RaTG13,仅为91%。它只是在对病毒感染性至关重要的刺突蛋白的受体结合区域,在已知病毒中和新冠病毒最像(核酸层面序列相同性为90%,蛋白层面序列相同性为97%)。穿山甲冠状病毒的刺突蛋白,也不像新冠病毒那样有Furin酶切位点的加持。从新闻报道中的图片可以看到,广东的专家们在参与穿山甲救治时仅戴了手套,没有口罩,没有护目镜,更没有防护服,而我们知道广州并没有爆发疫情,显然这种穿山甲病毒,并没有新冠病毒那么具有传染性。从入境就被截获这一点来看,可以推测这批穿山甲应该入境前(越南)就携带上冠状病毒了。最近管轶团队从广西海关截获的多批穿山甲样本里也检测到了类似的冠状病毒,也证明了这一点。图5. 穿山甲是在地球上存活了至少4000万年的哺乳动物。马来穿山甲仅在东南亚有分布。穿山甲和人一样,是哺乳动物,它的ACE2蛋白和人的ACE2蛋白序列相同度为85%,所以可以“共享”病毒并不奇怪。穿山甲现存3属8种,都分布在气候比较热的地区,我国的野生穿山甲是中华穿山甲,近年来已经比较少见。非洲因路途遥远,走私过来的都是鳞片。因此国内的活体穿山甲主要是来自东南亚的马来穿山甲。有一点可以肯定的是,马来穿山甲主要分布地是东南亚,我国仅有云南省南部靠近国界的地方有少量分布。如果没有人消费这些穿山甲,这些病毒很难有机会流传到人口密集的都市并与其他物种进行多次重组,并最终引起大爆发。在2017年出版的《穿山甲的全球走私 (The Global Trafficking of Pangolins)》这份报告中,专家统计了各国执法部门截获的穿山甲数量,2010-2015年,平均每年有4-5万只穿山甲被截获。这份报告还总结了穿山甲的走私路线。众所周知,中国是穿山甲消费的最大市场,而让笔者略感意外的是,美国也是一个走私目的地,而且中美之间竟然还有持续使用超过五年的走私路线(图6)。在该报告出版之后,海关截获的数字更是年年攀升,先是上升到每年10万只,到了去年,光是前7个多月,就已经截获了11万只,而走私的数量是数倍于此!穿山甲在野外基本是独居的,即使生病,也不易引发大流行。而活穿山甲在走私过程中,经常多只一起走私,由于环境恶劣,很容易得肺病并互相传染,所以穿山甲冠状病毒具备在被走私的穿山甲群体中长期流行的条件。中国有食用穿山甲习惯的群体主要在南方,这和穿山甲喜热怕凉,北方本来就没有分布,也很难养活,所以历史上没有养成食用习性有关。武汉,处于野生穿山甲分布的北缘,笔者揣测生活在东南亚的穿山甲到了武汉可能更易生病。图6. 2010-2015年间频繁使用的穿山甲走私线路图。图片来自报告《穿山甲的全球走私》。新冠病毒爆发之后,在科学家做出穿山甲是潜在中间宿主的推测之前,曾有网友依据自己的一些经历,发帖怀疑新冠病毒来自穿山甲。其中一位是微博网友“华而不实啊华”,他是武汉BRT1路司机。2020年1月19日,他在微博上回顾,在2019年10月初,在他的BRT1路车上,一个操外地口音的乘客在武昌雄楚大道BRT卓刀泉南路S1站(湖北省肿瘤医院附近)上车,在车上带哭腔打电话说“已经半个多月了,咳嗽、哮喘,听说土方穿山甲能治哮喘病,已经在武汉几个大市场买穿山甲(活杀现宰)……”而推测“这病不是穿山甲传给人的吧”。这条线索至少反映了当时武汉几个大市场都是有卖活穿山甲的。百度搜索“穿山甲 肺癌”会得到111万条结果,首页不乏有推荐吃穿山甲的,天知道肺部功能已经受损的人万一接触到含有冠状病毒的穿山甲会怎么样。还有一位豆瓣网友在1月20日下午,即钟南山院士做出人传人的论断之前,在豆瓣发起投票 “如果你吃穿山甲生病了,病有治不好的可能性(同时有致死率),你会告诉医生吗?”也许反映了发帖者知道某人怀疑自己得的新冠肺炎是食用穿山甲引起的。穿山甲如果是新冠病毒的中间宿主,那么穿山甲冠状病毒,到底在哪里与蝙蝠冠状病毒发生重组,又在哪里获得了Furin酶切位点的强力加持,最终形成了在武汉爆发的传染性超强的新冠病毒?是否还有其他中间宿主存在?都还是未解之谜。如果武汉还有活体穿山甲,或者穿山甲鳞片,也许可以帮助我们解答这些问题中的一部分。愿这场大疫早日散去,更愿我们未来能够不再重蹈覆辙!1. Ping Liu et al. Viral Metagenomics Revealed Sendai Virus and Coronavirus Infection of Malayan Pangolins (Manis javanica). Viruses, 2019 Oct 24;11(11)
2. http://virological.org/t/ncov-2019-spike-protein-receptor-binding-domain-shares-high-amino-acid-identity-with-a-coronavirus-recovered-from-a-pangolin-viral-metagenomic-dataset/362/53.https://weibo.com/1497087080/It0HitPLztype=comment#_rnd1581176981037 4. Matthew Wong et al. Evidence of recombination in coronaviruses implicating pangolin origins of nCoV-2019. bioRxiv, 2020.2.13 https://www.biorxiv.org/content/10.1101/2020.02.07.939207v15. Tommy Tsan-Yuk Lam et al. Identification of 2019-nCoV related coronaviruses in Malayan pangolins in southern China. bioRxiv, 2020.2.8https://www.biorxiv.org/content/10.1101/2020.02.13.945485v16. Peng Zhou et al. Pneumonia outbreak is associated with a novel coronavirus of likely bat origin. Nature. https://www.nature.com/articles/s41586-020-2012-77. 多面體的雹子 polyhedron's blog,Covid-19的furin識別位點爲人爲製造的探討