新型冠状病毒(2019-nCoV)的基因组组成及遗传分化分析丨CellPress论文速递
2020年2月5日,Cell Press细胞出版社旗下期刊Cell Host & Microbe刊登了来自中国医学科学院系统医学研究中心苏州系统医学研究所,国家病毒性疾病预防控制研究所国家卫计委医学病毒学重点实验室联合加州大学微生物学、免疫学和分子遗传学系的研究团队合作发表的一篇Commentary(评论)文章,系统阐述了新型冠状病毒(2019-nCoV)的基因组组成及遗传分化分析。
Cell Press细胞出版社微信公众号特将此综述译成中文,旨在第一时间与广大科研人员分享最新的新型冠状病毒(2019-nCoV)相关研究成果,点击“阅读原文”或识别下图二维码阅读英文原文。
*以下所有内容为论文的中文翻译,供参考,请以英文原文为准。
2019年12月下旬,中国湖北省武汉市爆发了肺炎,一种被世界卫生组织(WHO)命名为“2019新型冠状病毒”或“2019-nCoV”的新型冠状病毒(CoV)被认为是此次疫情开始的原因[7][12][13]。此次疫情的出现与一大型海鲜动物市场有关,相关调查正在进行以确定感染的来源。迄今为止,中国已确诊了成千上万例的人类感染病例,全球各地也出现了许多输出性病例[1]。
冠状病毒主要引起呼吸道和胃肠道感染,按基因可分为四个主要属:α-冠状病毒,β-冠状病毒、γ-冠状病毒和δ-冠状病毒[9]。前两种主要感染哺乳动物,而后两种主要感染禽类[11]。此前已有六种人类冠状病毒被发现。其中包括属于α-冠状病毒属的HCoV-NL63和HCoV-229E,以及β-冠状病毒属的HCoV-OC43、HCoV-HKU1、严重急性呼吸系统综合征冠状病毒(SARS-CoV)和中东呼吸综合征冠状病毒(MERS-CoV)[11]。经过2003年SARS大流行、2012年MERS爆发,以及最近的2019-nCoV疫情,冠状病毒正在引起全球关注[1][10]。
SARS-CoV和MERS-CoV被认为具有高致病性[2],而且两种病毒很有可能由蝙蝠分别经果子狸 [5]和单峰骆驼[3]最终传给人类[2]。
冠状病毒的基因组大小在26,000至32,000个碱基之间,包括可变数目的开放阅读框(ORF)(6至11个)[10]。占整个基因组约67%的第一个ORF编码16种非结构蛋白(nsps),其余的ORF编码辅助蛋白和结构蛋白[2]。四种主要的结构蛋白为刺突表面糖蛋白(S)、小包膜蛋白(E)、基质蛋白(M)和核衣壳蛋白(N)。刺突表面糖蛋白在结合宿主细胞上的受体中起着至关重要的作用,也决定了病毒的宿主向性[9][14]。 SARS-CoV和MERS-CoV的刺突蛋白通过不同的受体结合域(RBD)与不同的宿主受体结合。SARS-CoV将血管紧张素转化酶2(ACE2)作为主要受体之一[4],CD209L作为替代受体[8],而MERS-CoV使用二肽基肽酶4(DPP4,也被称为CD26)作为主要受体。此前的初步分析表明,2019-nCoV与SARS样蝙蝠冠状病毒在进化上具有密切联系[12]。在此,根据此前确认的三个新型冠状病毒(2019-nCoV)的基因组,即武汉/ IVDC-HB-01 / 2019(EPI_ISL_402119)(HB01)、武汉/ IVDC-HB-04 / 2019(EPI_ISL_402120)(HB04)和武汉/ IVDC-HB-05 / 2019(EPI_ISL_402121)(HB05),我们对该病毒进行了深入的基因组注释,并与相近的冠状病毒进行了比较,其中包括1008例人SARS-CoV,338例蝙蝠SARS样CoV和3131例人类MERS-CoV,这些相关的冠状病毒基因组于2020年1月12日(发布日期:2019年9月12日)之前发表于病毒病原体数据库和分析资源(ViPR)(http://www.viprbrc.org/)和NCBI上。
图1
图2
我们比较了上述三个2019-nCoV的基因组后发现它们几乎相同,在约29.8kb核苷酸的基因组中仅有五个核苷酸的差异。对2019-nCoV基因组进行注释的结果表明,它具有14个能够编码27种蛋白质的ORF(图1A)。位于基因组5'端的orf1ab和orf1a基因分别编码pp1ab和pp1a蛋白,包含15种nsps,即nsp1至nsp10,nsp12至nsp16(图1A)。基因组的3'端编码4种结构蛋白(S、E、M和N)和8种辅助蛋白(3a、3b、p6、7a、7b、8b、9b和orf14)。在氨基酸水平上,2019-nCoV与SARS-CoV非常相似,但有一些显著差异。例如,8a蛋白存在于SARS-CoV中而不存在于2019-nCoV中; 3b蛋白在SARS-CoV中为154个氨基酸,但在2019-nCoV中只有22个氨基酸。需要进一步的研究来表征这些差异是如何影响2019-nCoV的功能和发病机理的。
用分子进化遗传学分析(MEGA)(版本7.0)得出的基于全基因组的系统进化树表明,2019-nCoV与人CoV、MERS- CoV、蝙蝠CoV、SARS样蝙蝠CoV和SARS-CoV处于同一β冠状病毒演化支。冠状病毒的系统发生树分为两支,β冠状病毒属构成一支,而α冠状病毒、γ冠状病毒和δ冠状病毒属构成另一分支。2019-nCoV与SARS样蝙蝠CoV在系统发生树中为平行关系,而 SARS-CoV则由SARS样蝙蝠CoV进化而来,这表明2019-nCoV在整个基因组序列方面更接近SARS样蝙蝠CoV。研究还显示,2019-nCoV 的基因组与SARS样蝙蝠CoV(MG772933)的基因组相似度最高。相比之下,2019-nCoV与MERS-CoV相差较大,与MERS-CoV的关联不是非常紧密。植物遗传学分析表明,在pp1ab、pp1a、包膜蛋白、基质、辅助蛋白7a和核衣壳基因的编码蛋白方面,2019-nCoV最接近SARS样蝙蝠CoV(图1C)。
鉴于2019-nCoV与SARS-CoV或SARS样蝙蝠CoV(图1B & 1C)之间的密切关系,对不同蛋白质中氨基酸替代的检测可以揭示2019-nCoV在结构和功能上与SARS-CoV的不同。2019-nCoV(HB01)的氨基酸序列与SARS和SARS样病毒相应的共识序列之间共有380个氨基酸替代(图2)。非结构蛋白7(nsp7)、nsp13、包膜蛋白、基质或辅助蛋白p6和8b中未发生氨基酸替代。nsp3和nsp2中分别有102和61个氨基酸替代。此外,在长度为1282个氨基酸的刺突蛋白中发现了27个氨基酸替代,包括氨基酸357-528区受体结合域(RBD)中的6个替代和在氨基酸基础亚区(SD)569-655中的6个替代。受体结合亚基S1区(图2)C端中的四个替代(Q560L、S570A、F572T和S575A)位于两种肽中,而这两种肽是先前报告的SARS-CoV抗原[6]。
由于对这种新型病毒的了解目前还十分有限,我们无法对2019-nCoV和SARS/SARS样CoV之间大量的氨基酸替代作出合理解释。例如,在SARS-CoV中与人类受体ACE2蛋白具有直接相互作用的受体结合基序中不存在氨基酸替代[4],但在受体结合域的另一个区发生了6个突变。这些差异是否会对2019-nCoV与SARS-CoV相较不同的宿主向性和传播特性造成影响,值得未来的进一步研究。
(点击“阅读原文”或识别下图二维码阅读论文原文)
本文参考文献(上下划动查看)
1. China CDC, 2020. Tracking the Epidemic. Available at http://weekly.chinacdc.cn/news/TrackingtheEpidemic.htm?from=timeline#Beijing%20Municipality%20Update
2. Cui, J., Li, F., and Shi, Z.L. (2019). Origin and evolution of pathogenic coronaviruses. Nat Rev Microbiol. 17(3), 181-192. Published online 2018/12/12 DOI: 10.1038/s41579-018-0118-9.
3. Drosten, C., Kellam, P., and Memish, Z.A. (2014). Evidence for camel-to-human transmission of MERS coronavirus. The New England journal of medicine. 371(14), 1359-1360. Published online 2014/10/02 DOI: 10.1056/NEJMc1409847.
4. Ge, X.Y., Li, J.L., Yang, X.L., Chmura, A.A., Zhu, G., Epstein, J.H., Mazet, J.K., Hu, B., Zhang, W., Peng, C., et al. (2013). Isolation and characterization of a bat SARS-like coronavirus that uses the ACE2 receptor. Nature. 503(7477), 535-538. Published online 2013/11/01 DOI: 10.1038/nature12711.
5. Guan, Y., Zheng, B.J., He, Y.Q., Liu, X.L., Zhuang, Z.X., Cheung, C.L., Luo, S.W., Li, P.H., Zhang, L.J., Guan, Y.J., et al. (2003). Isolation and characterization of viruses related to the SARS coronavirus from animals in southern China. Science. 302(5643), 276-278. Published online 2003/09/06 DOI: 10.1126/science.1087139.
6. Guo, J.P., Petric, M., Campbell, W., and McGeer, P.L. (2004). SARS corona virus peptides recognized by antibodies in the sera of convalescent cases. Virology. 324(2), 251-256. Published online 2004/06/23 DOI: 10.1016/j.virol.2004.04.017.
7. Huang, C., Wang, Y., Li, X., Ren, L., Zhao, J., Hu, Y., Zhang, L., Fan, G., Xu, J., Gu, X., et al. (2020). Clinical features of patients infected with 2019 novel coronavirus in Wuhan, China. Lancet. Published online 2020/01/28 DOI: 10.1016/s0140-6736(20)30183-5.
8. Jeffers, S.A., Tusell, S.M., Gillim-Ross, L., Hemmila, E.M., Achenbach, J.E., Babcock, G.J., Thomas, W.D., Jr., Thackray, L.B., Young, M.D., Mason, R.J., et al. (2004). CD209L (L-SIGN) is a receptor for severe acute respiratory syndrome coronavirus. Proceedings of the National Academy of Sciences of the United States of America. 101(44), 15748-15753. Published online 2004/10/22 DOI: 10.1073/pnas.0403812101.
9. Li, F. (2016). Structure, Function, and Evolution of Coronavirus Spike Proteins. Annu Rev Virol. 3, 237-261. DOI: 10.1146/annurev-virology-110615-042301.
10. Song, Z., Xu, Y., Bao, L., Zhang, L., Yu, P., Qu, Y., Zhu, H., Zhao, W., Han, Y., and Qin, C. (2019). From SARS to MERS, Thrusting Coronaviruses into the Spotlight. Viruses. 11(1). Published online 2019/01/17 DOI: 10.3390/v11010059.
11. Tang, Q., Song, Y.L., Shi, M.J., Cheng, Y.Y., Zhang, W.T., and Xia, X.Q. (2015). Inferring the hosts of coronavirus using dual statistical models based on nucleotide composition. Scientific reports. 5. DOI: Artn 1715510.1038/Srep17155.
12. Zhou, P., Yang, X.-L., Wang, X.-G., Hu, B., Zhang, L., Zhang, W., Si, H.-R., Zhu, Y., Li, B., Huang, C.-L., et al. (2020). Discovery of a novel coronavirus associated with the recent pneumonia outbreak in humans and its potential bat origin. bioRxiv. DOI: http://dx.doi.org/10.1101/2020.01.22.914952.
13. Zhu, N., Zhang, D., Wang, W., Li, X., Yang, B., Song, J., Zhao, X., Huang, B., Shi, W., Lu, R., et al. (2020). A Novel Coronavirus from Patients with Pneumonia in China, 2019. The New England journal of medicine. Published online 2020/01/25 DOI: 10.1056/NEJMoa2001017.
14. Zhu, Z., Zhang, Z., Chen, W., Cai, Z., Ge, X., Zhu, H., Jiang, T., Tan, W., and Peng, Y. (2018). Predicting the receptor-binding domain usage of the coronavirus based on kmer frequency on spike protein. Infection, genetics and evolution: journal of molecular epidemiology and evolutionary genetics in infectious diseases. 61, 183-184. Published online 2018/04/07 DOI: 10.1016/j.meegid.2018.03.028.
Cell Press新型冠状病毒资源中心
2020年1月31日,Cell Press新型冠状病毒资源中心正式开放。您可以在该资源中心页面上查找到2019-nCoV论文的投稿政策,以及Cell Press旗下期刊已发表的有关疫情和病毒的论文。网站正在不断更新中,所有内容都可以免费阅读→点击查看。识别下图二维码,即刻访问资源中心。
Cell Press新型冠状病毒资源中心
Cell Press冠状病毒资源中心网站正在不断更新中,后续我们也将为大家继续介绍最新上线论文,敬请期待!
推荐阅读
点击“阅读原文”,查看英文原文