查看原文
其他

Cell子刊:人体肠道病毒组高度多样、稳定且个体特异

宏基因组 宏基因组 2022-07-05


人体肠道病毒组高度多样,稳定并且个体特异

The Human Gut Virome Is Highly Diverse, Stable, and Individual Specific

原文链接:https://www.sciencedirect.com/science/article/pii/S1931312819304767

Cell Host and Microbe [IF:17.872]

DOI:https://doi.org/10.1016/j.chom.2019.09.009

Resource: 2019-10-09

第一作者:Andrey N. Shkoporov1

通讯作者:Andrey N. Shkoporov(andrey.shkoporov@ucc.ie)1

Colin Hill(c.hill@ucc.ie)1

其他作者:Adam G. Clooney1, Thomas D.S. Sutton1, Feargal J. Ryan1, Karen M. Daly1, James A. Nolan1, Siobhan A. McDonnell1, Ekaterina V. Khokhlova1, Lorraine A. Draper1, Amanda Forde1, Emma Guerin1, Vimalkumar Velayudhan1, R. Paul Ross1

作者单位:

1 爱尔兰科克大学爱尔兰APC微生物组和微生物学院 (APC Microbiome Ireland & School of Microbiology, University College Cork, Cork, Ireland)

热心肠日报

链接:https://www.mr-gut.cn/papers/read/1081524258

①纳入10名健康成年人,用宏基因组学方法深入分析粪便病毒组成在1年间的变化,发现肠道病毒组是高度个体化和稳定的;

②将个体肠道病毒中稳定存在且高占比的病毒组分命名为“持久稳定的个体病毒组”(PPV),主要包括烈性的crAss样噬菌体和其它有尾噬菌体目成员,以及微小噬菌体科;

③这些持久稳定存在的噬菌体可能与占主导地位的肠道细菌类群(如拟杆菌属、普氏菌属和粪杆菌属)有关。

主编推荐语:

人类的肠道中含有大量的病毒,其中绝大部分是噬菌体。在人肠道微生物组的研究中,关于病毒组的研究还比较缺乏。Cell Host and Microbe发表的一项研究,开发了基于宏基因组学的方法工具,能更为深入全面的分析人类肠道病毒组。该研究通过纵向队列分析表明,人肠道病毒组是稳定且高度个体化的,且每个人都存在“持久稳定的个体病毒组”(PPV),由靶向主要肠道细菌类群的烈性噬菌体组成。这些发现为进一步深入研究人类肠道病毒组打下了基础。

写在前面

技术亮点:
用自己的产生的数据作为参考数据库,提高数据利用率;加入已知量的外源噬菌体来估计肠道噬菌体的载量。

图型摘要

Shkoporov等人证明了人类肠道病毒高度的个体特异性和时间上的稳定性。他们描述了病毒群落中数量上广泛分布且持续存在的部分,称为持续的个体病毒(persistent personal virome,PPV)。PPV主要由烈性噬菌体组成,我们预计他们会靶向裂解肠道细菌的主要分类群。

摘要

人类肠道中含有大量病毒,主要是噬菌体。大多数仍然未被发现,我们对它们在肠道微生物组的形成和影响人类健康方面的作用仍然知之甚少。我们对健康成年人粪便病毒组进行了纵向宏基因组分析,揭示了高度的时间稳定性、个体特异性以及与细菌微生物组的相关性。我们使用了一种利用大多数测序数据并且不依赖于数据库的方法,我们发现了一种稳定的、数量上占优势的个体特异性持续的个体病毒(PPV)的存在。病毒基因组的聚类和重新分类注释确定了几组crAss-like噬菌体和Microviridae 噬菌体是人类肠道最稳定的共生体。基于CRISPR的宿主预测强调了这些稳定的病毒群落与高度优势的肠道细菌类群如Bacteroides, PrevotellaFaecalibacterium     之间的联系。这项研究为人类肠道病毒的结构提供了见解,并为假说驱动的研究奠定了重要的基础。

背景

人类肠道微生物群落是一个复杂的生态系统,从出生时的定殖开始,并在整个生命过程中不断改变和适应。微生物群落中的细菌和古细菌为宿主提供了一系列功能,包括免疫系统发育、维生素合成和能量生成。该细菌成分的特征是在健康受试者中具有高的时间稳定性,但是会受到诸如旅行、疾病和抗生素使用等事件的短暂影响。在Actinobacteria 门和Bacteroidetes 门中通常观察到最高的持续性,其中高度丰富的成员表现出最大的稳定性,而Firmicutes 门在时间上更具动态性。

微生物组中的病毒成分(病毒组)主要是噬菌体,它们被认为在通过捕食和水平基因转移形成微生物群落中起着关键作用。 这些复杂的噬菌体群落代表了我们对人类微生物群的理解和推动其组成的力量的认知非常不足。高达90%的病毒体序列与当前的参考数据库几乎没有同源性,并且病毒基因组缺乏通用的标记基因来帮助其分类。许多病毒学研究依赖于数据库,这些方法将研究范围限制在一小部分(通常只有10%左右)可以识别的病毒序列中。其余的病毒DNA通常被忽略,一般被称为“病毒暗物质(viral dark matter)”。

已经提出了存在健康的核心肠道病毒组,该病毒组由温和的噬菌体主导,并且病毒组和细菌微生物组成之间的联系已经得到强调。许多横断面人群研究报告了一些胃肠疾病和全身性疾病(如炎症性肠病、艾滋病、糖尿病和营养不良)中肠道病毒的疾病特异性改变。然而,在缺乏关于大多数差异的噬菌体的分类信息、宿主范围和生物学特性的情况下,对病毒组组成的这些差异进行有意义的解释是不可能的。 更好地理解不同分类水平的病毒组组成的短期和长期动态也是至关重要的。

尽管最近有所进展,但关于噬菌体捕食的动力学、细菌宿主的噬菌体抗性获得、宿主-噬菌体共同进化和在肠道中的多样化,仍有待研究。健康人群和患者人群的纵向病毒学研究对于在复杂的多微生物在群落水平上阐明这些机制至关重要,并有望在横断面病毒学研究和简化的体内和体外模型的假设驱动在研究之间建立联系。

在单个受试者身上进行的人类肠道病毒组的开创性纵向研究表明,肠道病毒组在2.5年的时间内显示出与细菌微生物组相似的高时间稳定性。在这里,我们扩展了以前的发现,并报告了12个月内10个个体肠道病毒的全面纵向研究。我们使用了一种优化的独立于参考数据库的流程,能够从头提取和组装源自粪便类病毒颗粒(VLPs)的鸟枪测序reads,我们严格去除了残留的细菌序列污染,并且我们可以对超过80%的单个鸟枪读数进行临时分类。我们还利用假定的病毒congtigs的重新聚集来鉴定结构和/或功能相似的病毒群,并揭示肠道病毒组隐藏的系统发育核心。我们报道了令人印象深刻的时间稳定性和病毒个体间的多样性。
最后,我们证明了一个高度个体化和持久性的病毒组部分的存在,即“持久性个体病毒体”,主要由烈性的crAss-like噬菌体、Caudovirales目的其他成员和烈性的Microviridae科组成,预计它们会感染细菌微生物群的主要代表。

结果

总病毒载量和α-多样性是是个体特有的,并具有持久的特征

Total Viral Load and a-Diversity Are Subject Specific and Persistent Features

在12个月的时间里,我们通过每月同步采样监测了10名健康成年受试者的粪便病毒组。对一名受试者在第19、20和26个月进行了三次随访取样(图1A)。使用Illumina平台(图1B)对从粪便VLP级分中提取的扩增的DNA和RNA(cDNA)进行集中的基因组测序。为了补充这一数据,并有助于类似的低覆盖重叠群,在一个时间点(第8个月)对每个受试者进行了未扩增的VLP深度核酸测序。随后,将读数汇编成一个非冗余的重叠群目录,并进行严格过滤以去除残留的细菌DNA污染。为了将病毒组组成放在整个微生物结构的更广阔的背景下,对所有粪便样本进行16S rRNA基因文库测序,并在对第8个月的样品进行了群落DNA的宏基因组学分析。

图1 通过VLP鸟枪测序恢复的病毒多样性的实验设计

Experimental Design and Viral Diversity Recovered by the VLP Shotgun Sequencing

(A)从10个研究对象收集粪便样本的时间轴以及进行分析的类型。

(B)用于粪便类病毒颗粒(VLP)相关核酸提取和鸟枪测序的实验和生物信息学方法的简要概述。

(C)在每个受试者的每个时间点上,Illumina的reads总数比对到最终去污染的39254条重叠群目录的比例。

(D)计算出的10个个体在时间点9-12之间每月的总粪便病毒载量。

(E)每个受试者在每个时间点经过去污染后剩余的contigs数量。

(F)含有整合酶或位点特异性重组酶基因的contigs的相对丰度。

(G)重叠群长度和覆盖深度分布。

病毒序列的最终目录包括39254个非冗余的完整和部分病毒基因组。10名受试者的大部分样本显示了该重叠群目录的对于reads序列覆盖的高水平(中位数为82.8%,图1C),这表明我们的污染过滤策略是有效的,并确保大部分数据包含在分析中。这也被另一个现象印证了,只观察到相对较少一部分reads(7.23±3.10 7)比对到保守的单拷贝细菌cpn60 伴侣蛋白基因(cpn60 chaperonin gene)上,假设平均细菌基因组大小为3.5 Mb,在过滤前的数据集中大约有0.45%是细菌染色体DNA序列。

在时间点第9–12个月的样品加入外源性乳球菌噬菌体Q33,这在人类肠道微生物群落研究中并不常见,这使我们能够粗略地定量每克粪便在2.2 X 108 和 8.4 X 1010基因组拷贝之间的总病毒载量, 假设总基因组的平均大小等于Q33(31.1 kb;图1D)。估计的病毒载量是受试者特异性的(p = 0.05,ANCOVA分析),并且在3个月期间没有显著变化(p = 0.35)。我们观察到粪便病毒群落的丰富程度有很大差异,每个样本中有11到4509个基因组或基因组片段。丰富度水平因受试者而异(p = 0.002,图1E),并且在每个受试者在1年期间中稳定(p = 0.27)。通过包含整合酶和位点特异性重组酶基因的重叠群的丰度进行估计,温和噬菌体的相对丰度变化很大(0%–68%)。然而,甚至这一特征似乎也反映了病毒的个体差异(p = 6.32±3.106)并且随时间相对稳定(p = 0.08;图1F)。

有趣的是,病毒α-多样性的测量结果仅显示与细菌多样性呈轻度正相关(Spearman ρ = 0.25–0.36,在FDR(错误发现率)校正后p < 0.05),但与温和噬菌体contigs的相对丰度呈强相关(ρ = 0.69–0.79)。与此同时,病毒α-多样性的测量显示弱至中度负相关(ρ = -0.11到-0.45),而后者与温和噬菌体丰度呈负相关(ρ = -0.41)。

重叠群的分类分配揭示了Caudovirales 目和Microviridae 未知噬菌体的普遍存在。检测到一些Inoviridae 噬菌体的代表,以及真核ssDNA病毒(Circoviridae, Anelloviridae, Genomoviridae)。特别值得注意的是,有相当数量的植物RNA病毒Virgaviridae (图1G)。总的来说,恢复了不同大小的重叠群,主要代表具有中-低水平序列覆盖的基因组片段。完整的环形病毒基因组(n = 623)的大小从Anelloviridae 的略大于3kb到某些“巨型”Myoviridae 噬菌体的287kb不等。在39254个病毒基因组和基因组片段中,6961个被归入科级分类组。在先前描述的病毒中,只有241种具有相近的同源物(>50%的核苷酸同一性超过90%的序列长度)。这些主要包括与乳球菌(Lactococcus)噬菌体和肠杆菌科(Enterobacteriaceae)噬菌体具有同源性的重叠群,并添加了一些隐蔽的真核ssDNA病毒(Torque teno viruses、gemycircular-virus)和多种植物RNA病毒。共有3556个contigs(包括162个完整的环状contigs)包含整合酶或位点特异性重组酶的基因,表明可能存在温和的生活方式。大多数完整的温带噬菌体基因组的大小为40-50kb,属于Siphoviridae

随着时间的推移人类病毒高度个体且组成稳定

Human Viromes Are Highly Individualized and Compositionally Stable over Time

10个受试者粪便病毒群落最令人印象深刻的特征是高度的个体间特异性和至少1年至26个月的个体内保守性。
尽管总病毒多样性高得多,但在研究队列中,只有1380个相对丰度高于0.1%的重叠群占VLP测序空间的99%。在某些受试者(917、918、920和924)中,在相对丰度达到95.6%时,可以看到单一且独特的病毒重叠群的明显优势。在大多数情况下,这种占绝对优势的病毒重叠群可分为Microviridae 或crAss-like噬菌体的临时科(图3B)。由于使用了全新的组装和分类方法,我们能够为病毒重叠群分配到科级,占每个样本的VLP读数中位数的82.6%。有尾噬菌体目成员(crAss-like噬菌体、SiphoviridaeMyoviridaePodoviridae, reads的累积相对丰度分别为21.2%、12.7%、8.3%和5.0%)和Microviridae 成员(31.0%)占优势,而其他病毒科,如丝状Inoviridae 噬菌体(0.1%)和真核病毒科圆CircoviridaeGenomoviridae (0.07%和0.02%),偶尔也能见到。

图2 个体间病毒组特异性、保守性以及与细菌组组成的相关性

Inter-individual Virome Specificity, Conservation, and Correlation with Bacteriome Composition

(A)按时间点划分的10个受试者中病毒组的科水平分类组成,个体contigs(相对丰度为0.001的有1380条)用黑色边框标出;红色三角形表示受试者最近使用抗生素的时间点。

(B)通过16S rRNA扩增子测序确定的对应细菌样本的分类组成,仅显示相对丰度≥0.05的科。

(C)基于Jensen-Shannon差异度量的病毒群落矩阵的主坐标分析排序;统计椭圆由受试者以0.95置信水平给出;主题的颜色代码在(D)中给出。

(D)根据16S rRNA基因扩增子测序数据,对病毒群落PCoA坐标和细菌OTU PCoA坐标进行Procrustes旋转(rotation);詹森-香农散度度量(Jensen-Shannon divergence metric)用于两种情况;前56个轴被纳入分析,但仅显示前2个轴。

尽管随着时间的推移会有一定的波动,但病毒组组成在科水平和重叠群水平上都是稳定的,这是由稳定的和个体特异性的细菌组组成所模拟的(mimicked)。(图2A图2B)。受试者身份解释了重叠群水平上病毒组成的66.2%的方差(PERMANOVA, p = 0.001)和OTU水平上细菌群落的82.4%的方差(p = 0.001)。这比数据集中包含的任何其他变量都高得多,包括细菌和病毒成分相互作用的相互影响。然而,我们观察到病毒和细菌群落的组成之间有很强的相关性(Procrustes randomization test, p = 0.001,0.804,图2D)。受试者922中由两次抗生素治疗引起的细菌群落的短暂扰动导致病毒成分的类似扰动(图2A图2B)。

在约束排序试验(constrained ordination tests)中,病毒组变异的至少一个维度是由一方面是Prevotella,另一方面是Bacteroides, Barnesiella, AlistipesEggerthella 的反向效应来解释的。Prevotella 丰度较高与观察到的病毒多样性(Spearman r = 0.28)和温和噬菌体重叠群的流行率(prevalence)(r = 0.27)轻度相关,与总病毒载量(r = 0.53)呈负相关。有趣的是,与这个维度无关,发现crAss- like噬菌体contigs和Microviridae 之间呈负相关(r = 0.53)。

尽管稳定性很高,但我们观察到细菌和病毒成分随时间缓慢转变(draft),远离在时间点1采样的原始群落。在病毒的情况下,这种转变(draft)更明显,几乎可以肯定是由于鸟枪式VLP测序与16S rRNA扩增子测序相比具有更高的分类学分辨率。

PPVs稳定,并且在数量上占优势

PPVs Are Stable and Numerically Predominant

我们对显著的时间稳定性和个体独特性的观察,以及少量病毒重叠群对个体病毒体的控制,使我们得出一个假设,即相对小的、高度个体化的和稳定的病毒集合,我们称之为持续的个体病毒体(persistent personal viromes,PPVs),可能是个体间病毒体多样性和稳定性的主要驱动力。病毒体中剩下的不太稳定的部分可能包括丰度低的噬菌体、感染短暂微生物组成员的噬菌体和饮食来源的植物病毒。为了检验这一假设,我们逐步细分了每个个体的病毒群落矩阵,使其仅包括至少在第3、6、9或11时间点出现的病毒重叠群。这一过程给我们留下了数10个重叠群,而不是每个样本上的数千个重叠群(图3A),尽管大多数VLP reads仍然可以被比对到这些较小的重叠群目录中(图3B)。尽管我们认识到测序深度可能是检测低丰度持续性重叠群的一个限制因素,并寻求严格性和敏感性之间的折衷,但我们根据经验选择了每个受试者12个时间点中的6个时间点作为界定PPV重叠群的阈值

图3 病毒组中的相对重量和PPV的分类组成

Relative Weight in the Virome and Taxonomic Composition of PPV

(A)每个受试者具有保守功能的病毒重叠群数量。

(B) 与(A)相同,与保守重叠群比对上reads数目。

(C)每个受试者在PPV中的reads比例。

(D和E) NMDS病毒群落数据(使用g Bray-Curtis 差异)分离成个人持久性部分(D)和瞬时检测部分(E);持久性病毒体的缩放导致应力值为0.2的收敛解;瞬时病毒体没有给出收敛的解(scaling of persistent virome results in convergent solution with stress value of 0.2; transient virome gives no convergent solution)。

(F)持久性和短暂性病毒粒级中病毒科级分类群的累积相对丰度。

(G)以重叠群数量(蓝色)表示的每个个体的PPV大小,以及个体之间共享的PPV比例(红色);箱线图给出了共有PPV 重叠群的分类组成。

(H)至少在两个个体之间共享的PPV 重叠群的相对丰度。

基于这一标准,我们建立了一个由10个受试者的833个重叠群组成的PPV目录,该目录在每个样本中招募了中位数为92.3%的去污染后能比对上的VLP reads(图3C)。我们将每个个体群落中剩余的病毒群定义为短暂检测到的病毒群(transiently detected virome,TDV)。然后,我们应用了非度量多维标度(non-metric multidimensional scaling,NMDS)和PERMANOVA分析,以找出这两个分数中的哪一个赋予病毒更大的个性(individuality)和稳定性(图3D图3E)。与预期一致,PPV部分以高度有序的方式按个体聚集(55.2%的方差由受试者解释,p = 0.001),而TDV部分则无序得多(17%的方差由受试者解释,p = 0.001)。除此之外,TDV显示出个体间明显更多的共享。从分类学的角度来看,Microviridae 和crAss-like是PPVs最突出的代表。相比之下,TDV显示出Siphoviridae 的流行,以及诸如Inoviridae, Genomoviridae, Papillomaviridae, AnelloviridaeVirgaviridae 等少数病毒群的存在(图3F)。

尽管10个人共享一个工作环境,但PPV的规模和组成高度个性化(图3G)。无论PPV大小如何,个体之间共享的PPV重叠群 的数量非常少,只有46个重叠群(22个完整或几乎完整的病毒基因组,图3H)在两个或更多个体之间共享,两个重叠群(6.6 kb的环形Microviridae 基因组和93 kb的环形crAss-like噬菌体基因组)在五个或更多个体之间共享。没有重叠群在10个人的PPVs中被分享。

PPV成员的聚类揭示了与人类细菌微生物群主要成员相连的系统发育核心的存在

Clustering of PPV Members Reveals the Existence of a Phylogenetic Core Connected to the Main Members of Human Bacterial Microbiota

在缺乏基于系统发育的噬菌体分类信息的情况下,并且由于绝大多数病毒序列不能被分配到科水平以下的任何已知分类单元,我们使用vConTACT2聚类流程将病毒重叠群分成近似属或亚科水平的组。为了便于重叠群的分类定位,已知的病毒基因组(NCBI参考序列数据库)被包括在其中,其中710个基因组与本研究中的重叠群聚类在一起。使用这种方法,我们在整个数据集中确定了3639个病毒聚类,只有114个聚类和66个单重体(singletons)形成了所有10个个体的PPVs(图4A)。

图4 PPV噬菌体聚类及其预测细菌宿主

Phage Clusters of the PPV (Based on Gene Orthology) and Their Predicted Bacterial Hosts

(A)重叠群的vConTACT2网络仅限于653个PPV的非单一重叠群;使用MCL将顶点颜色随机分配给114个聚类中的每一个;大小反映重叠群长度。正方形,线性重叠群;圆,圆形重叠群。边缘厚度反映了对数显著性得分,使用Kamada-Kawai算法的图形布局。

(B)与(A)相同,但根据病毒家族对顶点进行着色(E中的颜色代码);红色轮廓,含有整合酶和/或位点特异性重组酶基因的重叠群。

(C)通过CRISPR间隔匹配预测的持久性病毒簇的宿主范围;顶点颜色根据病毒家族而定(颜色代码请参阅图E)。对于包含已知噬菌体的簇,其分类名称为蓝色。连接病毒簇和细菌属的边缘数等于含有CRISPR匹配的重叠群。红色轮廓线表示含有含有整合酶和位点特异性重组酶基因的重叠群的簇。

(D)PPV和TDV中病毒簇的数量随所包含个体数量变化的反射曲线。

(E)32个病毒簇表明PPV和TDV之间分布不均(在使用Bonferroni校正的Wilcoxon试验中p <0.05)。

从系统发育的角度来看,大部分PPVs重叠群属于大的、多样的、相互联系的有尾噬菌体目(Siphoviridae, Myoviridae, crAss-like 噬菌体),或者形成非常紧密的孤立聚类(Microviridae, 小的Podoviridae噬菌体,图4B)。在180个暂定病毒分类群中,有24个与已知病毒的基因组聚类在一起,并确立了分类地位。通过在大量细菌参考基因组中寻找CRISPR间隔区匹配,进一步证实了基于从头分配和vConTACT2与已知病毒分类群共聚类的病毒分类群的分类位置。我们能够找到对63个PPVs聚类成员的强有力的匹配(hits)。同一个群的成员经常命中不同的相关或不相关的细菌属,而某些细菌属,如高度流行的肠道共生体Bacteroides, Parabacteroides, Prevotella, Blautia, FaecalibacteriumClostridium,则命中多个不同的噬菌体群(图4C)。

与先前的预测和实验数据一致,多簇高度丰富和持久的crAss-like噬菌体和Microviridae噬菌体与Bacteroides 属和Bacteroidales 目的相关分类群相关联。类似地,Clostridiales 目的革兰氏阳性严格厌氧菌与许多有毒和温和的Siphoviridae群以及一些Microviridae 形成了一个相互连接的网络,不同于感染革兰氏阴性厌氧菌的细菌(图4C)。我们观察到的与人类健康相关的属如AkkermansiaFaecalibacteriumRuminococcus 相关的PPVs噬菌体群值得进一步研究。

图5 个体病毒组中PPV聚类的相对丰度

Relative Abundance of PPV Clusters in the Individual Viromes

顶部注释栏,受试者;左侧注释栏,病毒科。基于欧氏距离完全连锁聚类的树形图(Dendrograms based on complete linkage clustering with Euclidean distances.)。右边给出了大于5个个体中出现的聚类的名称;带有编码整合酶和位点特异性重组酶的contigs的聚类用红色突出显示。

与个体的病毒重叠群一样,PPVs中病毒聚类的相对丰度显示了受试者的明显分离(图5)。然而,聚类揭示了个体病毒组之间更高的共同性。一半或更多的研究对象共有22个PPV聚类。这些噬菌体群主要由强毒的crAss-like和Microviridae 噬菌体聚类组成,只有三个温和的Siphoviridae 基因组群(genomic groups)。与PPV不同的是,TDV噬菌体群的丰度没有受到区分。当比较人类粪便病毒体的PPV和TDV部分的病毒聚类的相对丰度时,32个噬菌体群显示出对其中一个或另一个的明显偏好(图4E)。例如,虽然集群c924 (CRISPR命中Enterococcus )和c2181 (CRISPR命中BlautiaCoprobacter )的存在量相当,但c2181在三个个体中是PPV的一部分,而c924在所有受试者中仅是TDV的一部分。这一方面可以反映出BlautiaCoprobacter 噬菌体在微生物群中更为确定的位置,另一方面可以反映出Enterococcus 噬菌体-宿主对的快速动态。关于聚类c1774(未知宿主的Siphoviridae,两个受试者)和c65(混合预测,八个受试者,CRISPR命中AkkermansiaButyricimonas),可以得出类似的结论。

PPVs基因组的微小异质性和突变累积率

Microheterogeneity and Mutation Accumulation Rates in PPV Genomes

已经建立了粪便病毒的高度个体性和时间稳定性,以及属于相对少数系统发育群的PPV的存在,我们决定在单个菌株水平上检查PPV基因组的时间稳定性。总之,我们在424个PPV重叠群中鉴定出31061个高质量多态性位点(30600个双等位基因和461个三等位基因)。为了简化分析流程,我们将单核苷酸多态性和三核苷酸多态性(triallelic SNPs)排除在本研究之外。此外,我们将我们的分析限制在9258个在研究初始时间点未检测到的多态性位点。这给我们提供了一个机会来跟踪研究过程中每个重叠群先前未发现的(新的)SNPs的积累。

具有仅38个病毒重叠群的小PPV的受试者918(图3G)作为我们观察到的等位基因动力学类型的例子(图6A)。在一些重叠群中,相继出现了新的变异体,这些变异体逐渐占据了整个群体(99.1和93.1 kb的c264和c567聚类的Ass-like噬菌体基因组)。对于其他重叠群,我们看到了新变异体的协同爆发,它们迅速取代了早期的基因型(c849聚类的99.1kb crAss样噬菌体)。后一种类型的行为表明一种新的但相关的噬菌体菌株的出现和旧菌株的快速替代。不管怎样,我们观察到在任何特定的时间点,每种类型的噬菌体都是由多种紧密相关的基因型(微异质性)混合而成的。

图6 1年间PPV基因组中新SNPs的积累

(A)来自受试者918的持久性病毒基因组的实例,随着时间的推移,具有相对丰富的替代性SNP等位基因;

(B)PPV片段中每个contig、每个病毒科的突变累积率(between-group comparisons were done with Kruskal-Wallis test [p = 1.8 * 108], followed by a post hoc Wilcoxon test with Bonferroni correction);

(C)同上,但是是整合酶基因的存在;

(D)与先前相同,但contigs按受试者分组(p < 0.05 in Kruskal-Wallis test for subject 922 versus 917, 918, 919, 921)。

然后,我们评估了来自所有10个个体的PPV重叠群中新等位基因累积的比率,该比率在4个数量级上变化(图6B)。根据预测的病毒科水平对重叠群进行分组突出了一些显著的差异。例如,Microviridae 的突变累积率几乎比crAss-like噬菌体高一个数量级(Wilcoxon test,p = 0.011)。同时,整合酶基因的存在并没有影响突变率(p = 0.3,图6C)。这与之前观察到的人类肠道中毒性噬菌体比温和噬菌体有较高突变率形成对比。 有趣的是,受试者922(接受了三个疗程的β-内酰胺(b-lactams)抗生素)的相对重叠群突变率与研究组的其他受试者相比显著增加(图6D),这可能是由于抗生素诱导的微生物宿主群体的扰动,或者甚至是由于β-内酰胺(b-lactams)的直接突变促进作用。

讨论

自从人类肠道病毒的第一次关注宏基因组研究揭示了以前未知、复杂和多样的噬菌体和真核病毒群落以来,已经过去了十多年,这些噬菌体和真核病毒在形成微生物群落和影响人类健康方面具有潜在的作用。尽管过去十年在理解这些病毒群落方面取得了相当大的进展,但病毒宏基因组方法学的许多缺点是显而易见的,例如难以区分真正的病毒序列和细菌DNA污染,DNA扩增偏差,当前病毒数据库的不完善、不能对大多数序列进行分类学上的分类(“病毒暗物质”)以及缺乏关于噬菌体宿主范围和感染周期类型的信息。因此,许多以前的研究只专注了一小部分可识别的序列(14%-30%),忽略了病毒组的其余部分。要了解肠道中这些病毒群落的动力学和生物地理学,以及它们对肠道微生物组和整个有机体稳态的重要性,还有许多工作要做。

在这篇文章中,我们对10名健康受试者进行了为期至少1年的粪便VLP部分的全面纵向宏基因组研究。在严格去除细菌污染序列后,我们不再依赖于不完整的病毒序列数据库,而是采用了全新的病毒发现方法,并创建了一个大的完整病毒基因组和片段病毒基因组序列的目录(n = 39254)。我们知道病毒基因组具有模块化结构,并且经常通过重组表现出相当大的镶嵌性,因此我们通过设置覆盖范围75%作为病毒序列检测的阈值以此去除数据集的噪声。尽管如此,我们还是能够比对到82.8%的VLP reads。虽然大多数肠道病毒仍然未知,但我们应用了两种独立的从头分类方法,将大多数数量上占优势的病毒序列分配到科水平,并初步分配到亚科或属水平。我们还在一些粪便样本中添加了已知浓度的外源噬菌体,以实现内源性病毒基因组的绝对定量。

使用这些方法,我们能够证明与粪便病毒个体特异性一致的令人印象深刻的时间稳定性。 相同或非常接近的病毒株稳定装配在微生物组中持续长达26个月(图2A)。这与早期在一个健康成人中观察到的病毒组高度稳定性和在一组单卵双胞胎中进行的较短时间的研究相一致。这种组成的稳定性也反映在α-多样性水平和病毒总数的稳定水平上(图1D),表明病毒种群不受周期性波动和经典的“杀死赢家(kill the
winner)”动力学的影响,至少在物种水平上是如此
,但通过其他机制在肠道生态系统中得以维持。这种行为完全符合温和的噬菌体生活方式。事实上,通常假设肠道病毒与其他细菌密度极高的环境相似,是由温和的噬菌体控制的,它们与宿主之间遵循“搭载赢家(piggyback the winner)”式的动态相互作用。在人类肠道中也报道了温和噬菌体序列的流行。在这方面某种程度上矛盾的发现,我们将在后面讨论。

我们证明组成病毒组的稳定性主要与相对少量的高度流行、持久和个体歧视(individual-discriminatory)的病毒基因组联合体(PPV)有关,后者构成了大多数VLP序列(图3D)。CRISPR间隔序列匹配分析表明,大多数PPV噬菌体感染Bacteroides, Faecalibacterium, Eubacterium,Prevotella,Parabacteroides,所有这些都是丰富的、持久的,并且高度适应肠道环境(图4C)的细菌。尽管PPV噬菌体构成了病毒组的主要部分,并且在数月至数年内组成稳定,但也存在低丰度但高度多样性的病毒序列(每个样品高达数千个)。我们将这种不太稳定和非个体化的病毒称为“瞬时检测的病毒”(transiently detected virome,TDV)。我们的数据提供了一些初步证据,TDV相对PPV可能在个体间更为共享,这需要在更大规模的横断面人群研究中验证。 与PPV相反,TDV噬菌体含有多种CRISPR原间隔区,这些原间隔区对应于不太丰富和更短暂的细菌分类群,如Streptococcus, Clostridium, Akkermansia, Acinetobacter, Listeria, Escherichia,Bilophila。这并不排除瞬时病毒基因组具有同样持久性的可能性,但对相对丰度非常低的基因组进行可重复检测可能是不可能的。

与以前的研究一致,大部分PPV和TDV片段都是由双链DNA有尾噬菌体目噬菌体和单链DNA裂解性噬菌体Microviridae 科(图3F)的代表的,尽管Microviridae科的流行可能由于扩增偏倚而有些夸大。通过使用一种全新的聚类方法,我们能够检测到一个占优势的和持续存在的病毒群的小的跨主体系统发育核心,它整合了22个crAss-like噬菌体、其他有尾噬菌体目和Microviridae 科(图4E图5)。我们的数据证实了以前的观察,即在肠道病毒组中,crAss-like噬体具有特殊的,有时是核心的作用。 在这项研究中,只有十个个体中的一个没有通过检测一种或另一种类型的crAss-like噬菌体的可检测水平而被定殖。这些具有90-105 kb dsDNA基因组的明显烈性的噬菌体也具有在受试者之间共享的最高倾向(图3G),并且与小的裂解性单链DNA Microviridae 一起控制了小的系统发育核心。一半受试者共有22个病毒聚类,其中12个由这两个病毒群代表(图5)。在两个受试者(918和924)中,属于两到三个不同聚类的四到七个不同聚类的crAss-like噬菌体菌株的特定组合占总病毒组的高达97%,并在研究期间持续存在于微生物组中,通常具有最小的基因组序列变异(图3I6A)。同一受试者的总病毒载量很高表明,类似crAss的噬菌体形成了大量的群体,这些群体叠加在肠道中的其他病毒上,而不是取代它们。与此同时,在crAss-丰富的个体中,多样性的降低(图1E)和PPV大小较小(图3F)可以通过在有限的测序深度条件下用几个高度占优势的序列掩盖背景多样性来解释。

与预期一致,有尾噬菌体目的许多其他成员似乎是温和的。然而,温和噬菌体并不主导病毒组,在核心(22个聚类中的3个)中也不占优势。受试者916是这一规则的一个有趣的例外,其总病毒载量持续较低,与高病毒多样性和温和的有尾噬菌体目(Caudovirales)的明显优势一致(图1D)。在受试者916中没有大量裂解性噬菌体的情况下,很可能是从常驻微生物菌株中诱导原噬菌体,而不是裂解性复制,成为高度多样化、均匀分布且主要是温和的噬菌体集合的主要贡献者。

由于经典的温和噬菌体很少控制肠道病毒组,除了整合入宿主基因组的能力之外,其他机制似乎也是人类肠道噬菌体长期存在的主要原因。最近,有报道称,一种crAss-like的噬菌体能够与其宿主一起增殖,而不会显著影响其生长。甚至一些特征明确的裂解性噬菌体,如大肠杆菌噬菌体T7,已被证明能稳定地在单系小鼠的肠道中定殖。在粪便微生物移植研究和动物定殖模型中,crAss-like噬菌体可以稳定地植入并逐渐控制病毒体,而不会显著影响其宿主群体的水平。裂解性噬菌体在肠道中稳定、高水平定殖的确切机制需要进一步阐明。

我们对SNPs的逐渐积累和亲本基因型的替换以及噬菌体群体的显著微基因组的观察(图6A)支持了以前一项小规模研究的数据,并可被解释为红皇后(Red Queen)共进化动力学存在的标志,而被早期人类肠道病毒体的纵向研究所忽略。最近的一份报告观察到小鼠肠道中连续的拮抗噬菌体-宿主共进化,导致细菌抗性和噬菌体抗性之间的“军备竞赛”。De Sordi等人提出,噬菌体捕食的选择性压力和持续的军备竞赛可能是肠道中细菌和宿主种群持续高多样性背后的主要驱动力,这反过来又导致微生物群落整体更大的稳定性和弹性。 在PPV的某些病毒类型的高丰度和最近提出的针对水生环境产生的噬菌体动态的“皇室(royal family)”模型之间可以得出一些有趣的相似之处。与海洋相似,肠道中的“杀死赢家(kill the
winner)”效应很可能在细菌和噬菌体菌株以及子菌株的水平上起作用,使得微生物群落在物种、属或更高级别分类水平上的分类组成长时间保持完整。

在我们的研究队列中,我们观察到细菌微生物群落和病毒群落之间存在非常密切的相关性(图2D)。例如,Prevotella 相对丰度的相对梯度和Barnesiella, EggerthellaBacteroides 的相对丰度似乎是病毒组组成中很大一部分差异的原因。最近的研究表明,Prevotella 的相对丰度越高,表明微生物总量越低,结肠运输时间越快。一致地,我们观察到,在我们的受试者中,Prevotella 的相对丰度较高,同时总病毒载量较低(图1D-1F),温和噬菌体的流行率较高。Prevotella 的相对高水平和低的总病毒载量也与病毒体的α-多样性增加相关(例如,在受试者916和922中)。这是合乎逻辑的,因为去除少量优势病毒会自动暴露低丰度病毒的高多样性。有趣的是,crAss-like噬菌体和Microviridae 科的累积相对丰度之间的权衡似乎与前述的Prevotella/Bacteroides 比率无关,这与之前的预测一致,即这两个属都可以作为这两个病毒科成员的宿主。

细菌、古细菌和真核生物的病毒在大小和物理性质上有很大差异。因此,由于方法学的限制,在我们的数据集中,许多病毒分类群似乎没有得到充分的代表,甚至完全没有引起我们的注意。
通过0.45毫米孔过滤器过滤粪便匀质物,并用氯仿提取,可除去大的或有包膜的噬菌体颗粒,而用聚乙二醇沉淀可能不能有效地捕获一些最小的病毒颗粒。最近,在猪、狒狒和某些人类群体的肠道中检测到一种基因组大小大于0.5 Mbp的未培养的Prevotella大噬菌体。据报道,包括人类和动物微生物群在内的各种环境中存在大量的巨型噬菌体,其基因组特征表明存在复杂的噬菌体-宿主和噬菌体-噬菌体相互作用。在我们的研究中,使用200 kb基因组大小的“巨人”阈值,我们能够检测到三个部分的噬菌体基因组(201-292 kbp)以及一个288 kbp的完整环状基因组。然而,它们都不是PPV的一部分。许多研究也报道了使用病毒宏基因组学在人类肠道中检测到巨型变形虫和藻类感染病毒的争议。

总之,我们展示了一项深入的纵向研究如何为人类肠道病毒体的复杂性质提供了新的见解,并证明了一种个人持久性病毒组的存在,这一发现在横断面研究中是不可能的。我们还开发了一些工具,在应用了严格和可靠的病毒重叠群鉴定流程后,可以对回收序列的大部分进行分析,而不是少数。尽管高个体间变异性是病毒体的一个特征,但几乎可以肯定的是,这是单个病毒重叠群的菌株水平特性的结果,我们表明基于蛋白质的聚类方法允许在个体或组群之间进行比较。这项研究提供了一个平台来理解组成病毒体的不同生物实体及其在肠道微生物群和人类健康中的作用。

翻译:秋芒树 待业

责编:刘永鑫 中科院遗传发育所

Reference

Andrey N. Shkoporov, Adam G. Clooney, Thomas D. S. Sutton, Feargal J. Ryan, Karen M. Daly, James A. Nolan, Siobhan A. McDonnell, Ekaterina V. Khokhlova, Lorraine A. Draper, Amanda Forde, Emma Guerin, Vimalkumar Velayudhan, R. Paul Ross & Colin Hill. The Human Gut Virome Is Highly Diverse, Stable, and Individual Specific. Cell Host & Microbe 26, 527-541.e525, doi: https://doi.org/10.1016/j.chom.2019.09.009 (2019).

猜你喜欢

10000+:菌群分析 宝宝与猫狗 梅毒狂想曲 提DNA发Nature Cell专刊 肠道指挥大脑

系列教程:微生物组入门 Biostar 微生物组  宏基因组

专业技能:学术图表 高分文章 生信宝典 不可或缺的人

一文读懂:宏基因组 寄生虫益处 进化树

必备技能:提问 搜索  Endnote

文献阅读 热心肠 SemanticScholar Geenmedical

扩增子分析:图表解读 分析流程 统计绘图

16S功能预测   PICRUSt  FAPROTAX  Bugbase Tax4Fun

在线工具:16S预测培养基 生信绘图

科研经验:云笔记  云协作 公众号

编程模板: Shell  R Perl

生物科普:  肠道细菌 人体上的生命 生命大跃进  细胞暗战 人体奥秘  

写在后面

为鼓励读者交流、快速解决科研困难,我们建立了“宏基因组”专业讨论群,目前己有国内外5000+ 一线科研人员加入。参与讨论,获得专业解答,欢迎分享此文至朋友圈,并扫码加主编好友带你入群,务必备注“姓名-单位-研究方向-职称/年级”。PI请明示身份,另有海内外微生物相关PI群供大佬合作交流。技术问题寻求帮助,首先阅读《如何优雅的提问》学习解决问题思路,仍未解决群内讨论,问题不私聊,帮助同行。

学习16S扩增子、宏基因组科研思路和分析实战,关注“宏基因组”

点击阅读原文,跳转最新文章目录阅读

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存