病毒学主要关注对人类或我们最关心的其他物种具有致病性的病毒。在新型冠状病毒肺炎疫情期间,对于引发感染的病原体SARS-CoV-2科学家们进行了大量的研究。但2022年5月31发表在Annual Review of Virology上的一篇综述中强调了对新病毒和新宿主的研究可以带来的好处,并认为对自然感染现有和新兴模式生物的病毒的研究将以有用和难以预测的方式推动病毒学向前发展。但这篇综述的意义并不是说病毒学不应该把时间和金钱花在显然对公共健康或经济安全很重要的病原体上。相反,它解决了总体资源分配和多样化病毒学研究组合的问题。首先,作者通过举例说明了对于病毒长期广泛而深入的研究带来的一系列好处。其次,总结了不同宿主类群的病毒序列多样性,以此作为对我们对宿主-病毒相互作用理解中存在的偏差。最后,作者还描述了通过在以前未抽样的宿主中发现数千种新病毒的元基因组学所取得的成果,以及元基因组研究的局限性。研究对人类或我们关心的物种有致病性的病毒是病毒学的主要目标。但研究没有明显致病性的病毒、或者不会感染我们认为的重要的物种的病毒,也就是说对整个分类学中的病毒和宿主进行基础研究,它被研究的价值往往并不能立即显现。对病毒的研究主要有以下几方面好处:①基础病毒学在我们对基本生物过程的理解方面取得了重大进展。对肉瘤病毒和相关病毒的研究导致了癌症生物学的变革性进展,并获得了三项诺贝尔奖:证明病毒可以致癌、发现逆转录酶和癌基因的存在。②病毒学还产生了对细胞功能和分子生物学的重大见解。这些进展包括在分子生物学早期对噬菌体的研究取得的进展:例如,确定DNA是遗传物质,以及发现3个碱基组成一个密码子。③生物技术公司的目录中充满了病毒衍生的酶,这些酶是现代分子生物学的主力。已被证明在预防新型冠状病毒方面非常有效的mRNA疫苗是使用病毒酶生产的:噬菌体RNA聚合酶合成尖峰编码的mRNAs。④其他有用的工具也来自对宿主免疫反应的广泛研究。例如来自骆驼和相关物种的单域抗体(纳米抗体)比传统抗体更小,作为试剂和治疗药物具有很多优势。⑤通过对各种病毒和宿主的研究,我们对免疫系统的进化和功能的理解得到了提高。例如在鸡身上的实验表明,B细胞负责抗体的产生。⑥为大流行做好准备的程度往往反映了过去关于相对未知的病毒的工作。例如先前普通感冒冠状病毒HKU1的刺突蛋白的工作使严重急性呼吸综合征冠状病毒2(SARS-CoV-2)刺突蛋白的结构得以快速确定,并使基于刺突的疫苗得以更快地开发。⑦尽管我们是高等动物,但我们并不能阻止人畜共患病毒的感染。所有物种都是相互联系的生命网络的一部分,研究非经济重要物种的病毒有直接的兽医学和保护原理。那么,如果研究广泛多样的病毒和宿主是有用的,那么这项工作正在进行到什么程度?科研人员如何知道我们是否在基础病毒学研究上投入了足够的资源?一种方法是计算公共数据库中的病毒序列,并评估它们在病毒和宿主分类群中的分布。首先,这取决于序列注释,这可能是错误的或缺失的:例如,在NCBI的核苷酸数据库中,6.8×106个病毒序列中只有6.2×106个(91%)具有注释的宿主。其次,还取决于病毒和宿主的分类以及该分类在NCBI T分类数据库中的表示。最后,更重要的是,它评估的是病毒序列,而不是病毒本身或对病毒的了解。在测序出现之前,病毒学已经存在了几十年,而且大多数病毒学研究既不需要也不产生新的序列。尽管如此,科学家已经对病毒进行了50多年的测序,而生成病毒序列需要时间和金钱。因此,特定病毒或宿主的序列数量与病毒学家所花费的资源成正比。作者从NCBI病毒网站获得了近700万个病毒序列的元数据,并列出了每个病毒分类群的序列数量以及与单个宿主相关的病毒序列数量。与预期相符,病毒序列强烈偏向于某些类型的病毒。到目前为止,大流行病毒的序列是最多的。SARS-CoV-2大流行产生了前所未有的基因组测序洪流,NCBI核苷酸数据库中SARS-CoV-2序列占所有病毒序列的近一半(49.7%)。其次是人类和猿类免疫缺陷病毒和流感病毒。事实上,GISAID数据库中的SARS-CoV-2序列(>7×106)已经超过了NCBI中的病毒序列。其中,来自肉瘤病毒(SARS-CoV-2及相关病毒)、慢病毒(HIV及相关病毒)和流感病毒的序列占所有病毒序列的80.4%。但是,即使将肉瘤病毒、慢病毒和流感病毒从分析中删除,测序最多的病毒列表仍然以人类和家畜病原体为主。即使没有高度测序的大流行病毒的贡献,人类仍然是与病毒序列关联最多的宿主,占剩余病毒序列的56.8%这一分析还传递了另一个信息,在少数几种病毒占大多数序列的同时,还有来自数千种不同病毒和宿主(35781个病毒类和8322个宿主)的序列。在元基因组学出现之前,病毒学主要集中在感染产生明显表型的病毒上。现在,元基因组不仅促进了我们对病毒多样性和进化的理解,还产生了传染病的候选病原体,这对爬行动物等缺乏家畜经济重要性的宿主的传染病来说是一个福音,元基因组测序可以在样本采集的几个小时或几天内确定基因组序列。首先,最根本的问题是,测序只产生序列,从序列中推断病毒生物学的程度是有限的。例如,从元基因组数据中通常不清楚病毒的宿主是什么。
其次,即使有可能将病毒序列与宿主联系起来,元基因组学也很少揭示感染对宿主的影响。病毒的序列不能告诉你病毒的致病性有多强,甚至根本不能告诉你它是否有致病性。序列本身并不能揭示任何与组织嗜性、传播机制或与宿主免疫系统的相互作用有关的信息。来自元基因组学的候选病原体必须通过其他方法来验证,例如与疾病的强烈关联或实验性感染研究。
几十年来,老鼠和果蝇等传统模式生物一直是病毒研究的中流砥柱。最近,人们对研究自然感染这些生物体的病毒重新产生了兴趣。这在一定程度上是因为强调了自然微生物区系对免疫系统发展的重要性。基因组和基因编辑技术的最新进展增加了与非传统模式生物合作的可行性。元基因组学的进展正在彻底改变我们对病毒进化和多样性的理解。与此同时,我们只是触及了病毒多样性的皮毛,新技术提供了以前难以想象的机会来剖析宿主与病毒的相互作用。