Nature综述:宏基因组时代的病毒分类
The following article is from 微生态笔记 Author DengLab
Peter Simmonds
Roger Hull
Nuffield Department of Medicine, University of Oxford, UK
由宏基因组方法确定的病毒种类与数量都远超过传统实验方法能确定的数量。在2016年波士顿的宏基因组时代病毒分类学术研讨会上,专家们提议:只通过宏基因组确定而未经过表观特征分析的病毒应当正式归入病毒分类委员会(ICTV)的分类系统中。虽然仅依据宏基因组序列进行分类与传统依据表观特征分类相去甚远,但全球病毒组的综合特性分析仍依赖更加完善的病毒序列分类框架。在本文中,作者们思索了将宏基因组数据归入ICTV数据的必要性及方法,同时呈现了被该机构执行委员会认可的观点。
病毒专营寄生生活,存在于几乎所有细胞形式生物中。依据遗传物质差异,大致可分为单链、双链DNA以及RNA病毒,它们的基因组大小差异很大,从2,000到2,000,000bp不等。宏基因组方法极大地增加了我们对病毒多样性的认识,冲击了传统的病毒分类学方法。过去ICTV对于新的病毒的分类与描述往往需要侵染宿主的信息、裂解周期、病毒质粒结构和特征等。通过宏基因组测序分析发现的病毒缺少这类传统分类学所必需的信息,但它们可能在生态系统中占有重要地位,与宿主共存甚至共生。以往对于这一类非人类病原体或是不造成全球性生态失衡的病菌关注较少。而本文阐释了基于宏基因组序列病毒的分类必要性和可用的方法。
海洋微生物群落中发生了哪些生态过程?几十年来,回答这个问题一直是微生物生态学的中心目标。微生物生态学家努力理解环境因素是如何共同作用来调节微生物群落的构建,生物地球化学循环的通量,以及生态系统与生物体之间的相互作用。这些信息使我们能够预测微生物群落对生态系统变化的反应,并可能操纵它们来执行特定的功能。在当前全球气候和生态系统变化的情况下,了解微生物群落的功能从未如此相关过。
环境中的病毒基因组并不直接反映生物学特性,因此传统的分类方法很难适用。这些生物学特性很大程度上由病毒基因组编码,但我们目前还不能充分理解这些信息以及一些酶的功能、病毒的结构、表型特征等。通过这些序列得到的一些信息可以作为分类的多重标准,如进化关系、全部基因组成、基因表达特征、基因复制策略、特殊基序的存在与否、全部或部分基因的组成(如GC含量)。然而由于技术问题使得不同病毒序列混在一起、基因组引入人工偏差、病毒与宿主基因组整合等问题出现,这可以通过增加测序读长和模板环化的方法来降低错误的几率。
1.分类依据,仅依靠宏基因组数据分类病毒需要合适的方法检验其序列的完整性以及完成接下来的序列比对。这需要更高级的分类群,能够容纳所有宏基因组序列数据。
2.创造新的种,目前ICTV可以只依据序列信息给病毒分类。病毒的序列信息可以反映多种病毒特性,如基因组成、复制策略、宿主类型等。在缺少表型数据的情况下,这些可以作为最低限度的分类依据。
3.为已存在的科分派新的种和属,不同群体的病毒分配程序差异很大,基本上是基于各种生物学特性和系统发育分析。虽然生物学特性作为部分分类学依据,但如果序列之间有可比性,基因组也可以作为增加新的种属的依据。
4.描述新的科与目,某些宏基因组方法确定的病毒如果与已存在的种属几乎没有相关性,那么就很难分类。在这种情况下,新的科只能与已经确定的科比对有限的同源基因、基因组种的主要差异、复制策略等。通过序列相关性聚类病毒更适合低级的分类等级如属和种,但新的科创立需要更深层次的分类框架,涉及更多的序列信息。程式化聚类和网状分析方法依赖同源基因和遗传分歧的相似性度量,可以作为今后高效的分类方式。当然,聚类框架应当具体问题具体分析。例如噬菌体应该关注编码病毒结构的基因序列,而动物和植物RNA病毒应该更关注RNA聚合酶和其他保守的复制相关基因。
5.序列数据分类命名法则,病毒的发现方式多种多样,某一个最初由仅序列确定的种而后会容纳其它验证了生物学特性的纯培养病毒。因此宏基因组学仅记录了某一特殊病毒而不是整个群体。虽然某些病毒学家会用“某某相关(associated)”来命名宏基因组确定的病毒,但是并没有必要使用像细菌中的暂定种这一类的术语。
6.病毒分类程序的改进,目前提出的建议只是针对只确定序列的病毒,当然,这可以通过发展网上提交的方法改进,同时需要有精确的数据筛选系统。
病毒的分类命名程序与细菌和古菌大相径庭,国际细菌命名法规定只有最新发现的种可以暂时不归入目前已经存在的更高级的分类等级。1980年总共有2053株细菌和古菌被批准列入细菌学手册,那之后又有13434株原核生物补充进来。然而这些被广泛认知的菌的数量仍然与环境监测到的几百万种原核生物相差很大。细菌和古菌种的名称确定需要一些生物学特性支持,如形态学、代谢、生态学方面,其他特性需要获得纯培养探究。为了克服这一局限,许多研究人员建议用序列特征作为分类标准。接着,大约有350种未获得纯培养的原核生物被归入“暂定种(Candidatus)”。过去序列信息无关原核生物的分类,但现在16S分析已经成为一种重要的分类手段。虽然病毒和原核生物进化路线和分类方式完全不同,但两者都面临宏基因组方法带来的数据爆炸。
同样的结论也适用其他微生物:比如说真菌的分类命名也遇到了和细菌、古菌同样的状况。种的分配仍然很大程度依赖生物学特性。确实,同一真菌的有性和无性阶段形态学特征有所不同,可能因此被归入不同的种,目前专家们也在纠正这一偏差。还有一些极其相似的种通过序列测定移除重复的种。宏基因组的应用也在真菌的分类学上引起了巨大的变化,标记基因成为真菌分类的条形码。
参考文献:
Simmonds, P., Adams, M. J., Benkő, M., Breitbart, M., Brister, J. R., Carstens, E. B., ... & Hull, R. (2017). Consensus statement: virus taxonomy in the age of metagenomics. Nature Reviews Microbiology, 15(3), 161. doi:10.1038/nrmicro.2016.177
原文链接:
https://www.nature.com/articles/nrmicro.2016.177
中国科学院生态环境研究中心
环境生物技术重点实验室
邓晔 研究员课题组发布
作者:周煜琦
编辑:吴悦妮
猜你喜欢
10000+:菌群分析 宝宝与猫狗 梅毒狂想曲 提DNA发Nature Cell专刊 肠道指挥大脑
文献阅读 热心肠 SemanticScholar Geenmedical
16S功能预测 PICRUSt FAPROTAX Bugbase Tax4Fun
生物科普: 肠道细菌 人体上的生命 生命大跃进 细胞暗战 人体奥秘
写在后面
为鼓励读者交流、快速解决科研困难,我们建立了“宏基因组”专业讨论群,目前己有国内外2300+ 一线科研人员加入。参与讨论,获得专业解答,欢迎分享此文至朋友圈,并扫码加主编好友带你入群,务必备注“姓名-单位-研究方向-职称/年级”。技术问题寻求帮助,首先阅读《如何优雅的提问》学习解决问题思路,仍末解决群内讨论,问题不私聊,帮助同行。
学习16S扩增子、宏基因组科研思路和分析实战,关注“宏基因组”