Nat. Med. :婴儿生命早期肠道病毒组和细菌组的动态
婴儿生命早期肠道病毒组和细菌微生物组的动态
Early life dynamics of the human gut virome and bacterial microbiome in infants
翻译:秋芒树 英国帝国理工学院
责编:刘永鑫 中科院遗传发育所
原文链接:https://www.nature.com/articles/nm.3950
Nature Medine [IF = 32.621]
DOI: 10.1038/nm.3950
作者:Efrem S Lim1,2, Yanjiao Zhou3,4, Guoyan Zhao1, Irma K Bauer3, Lindsay Droit1,2, I Malick Ndao3,
Barbara B Warner3, Phillip I Tarr1,3, David Wang1,2 & Lori R Holtz3
圣路易斯华盛顿大学,医学院,分子微生物系(Department of Molecular Microbiology, Washington University School of Medicine, St. Louis, Missouri, USA.)
圣路易斯华盛顿大学,医学院,病理与免疫学系(Department of Pathology & Immunology,
Washington University School of Medicine, St. Louis, Missouri, USA.)圣路易斯华盛顿大学,医学院,儿科系(Department of Pediatrics, Washington University School of Medicine, St. Louis, Missouri, USA.)
杰克逊基因组医学实验室和布莱根妇女医院(The Jackson Laboratory for Genomic Medicine, Farmington, Connecticut, USA, and Channing Division of Network Medicine, Department of
Medicine, Brigham and Women’s Hospital, Boston, Massachusetts, USA.)
通讯作者:
Lori R Holtz (Holtz_L@kids.wustl.edu)
David Wang (davewang@wusm.wustl.edu)
Resource: 2015-09-14
热心肠日报
链接:https://www.mr-gut.cn/papers/read/1079299880
Nature Medicine:婴儿肠道病毒和细菌组的动态变化
创作:赵弘烨 审核:蓝灿辉 2017年01月07日
鉴定一个纵向健康双胞胎婴儿队列的肠道病毒组和细菌组:
①比起不相关的婴儿,孪生兄弟姐妹之间的病毒组和细菌组较为相似;
②从出生到2岁,真核生物病毒组、细菌组都会扩张,但这伴随着噬菌体病毒组组成的萎缩和移位;
③出生后,噬菌体-细菌之间的关系即开始,并具有高捕食者-低被捕食者的状态,这符合Lotka-Volterra捕食模型;
④比起成年人相对稳定的菌群,婴儿菌群是高度变化的,并与随着年龄变化的细菌、病毒和噬菌体组成有关。
摘要
生命早期对免疫系统的发育很重要,对成年后的健康也有影响。虽然已经确定出生后很快就获得了肠道细菌微生物组,但在生命的最初几年,我们对由噬菌体、真核RNA病毒和真核DNA病毒组成的病毒组(virome)却知之甚少。在这篇文章里,我们描述了健康双胞胎婴儿纵向队列中肠道病毒组和细菌微生物组的特征。相比无关婴儿,同卵双胞胎之间的病毒组和细菌微生物组更相似。从出生到2岁,真核病毒组和细菌微生物组扩大,但却伴随着噬菌体病毒组组成的收缩(contraction)和转变(shift)。 噬菌体-细菌的关系始于高捕食者-低猎物的动态(high predator–low prey dynamic),与Lotka-Volterra prey模型一致。因此,与在成年人中观察到的稳定的微生物组相比,婴儿微生物组是高度动态的,并且与生命早期的细菌、病毒和噬菌体随着年龄的变化相关联。
背景介绍
肠道微生物组包括细菌、真核病毒、细菌病毒(噬菌体)、真菌和古菌。已经确定,这些微生物的一部分会与免疫系统相互作用并影响宿主的健康。肠道细菌微生物组的改变与多种人类疾病有关,包括肝硬化、糖尿病和炎症性肠病。大多数针对微生物组的治疗策略,如益生菌、益生元和粪菌移植,都旨在调节细菌微生物群落。细菌微生物组在出生后很快就建立起来,在接下来的几年里,它的组成向一个标准(stereotypical)的“类成人(adult-like)”的细菌群落结构转变。
这一过程会受到多种相互作用因素的影响,包括营养、出生模式、抗生素使用和地理环境。对双胞胎的研究表明,同卵双胞胎比无关个体共享更相似的细菌微生物组。
我们对病毒组(virome)知之甚少,这是一个由真核RNA病毒、真核DNA病毒和噬菌体组成的多样化群落。新的证据表明病毒组对人类健康有影响。 Anellovirus(真核DNA病毒)的载量(burden)与宿主免疫抑制的程度和器官移植的结果直接相关,也是儿科发热性疾病和AIDS的指标。致病性猴免疫缺陷病毒(Pathogenic simian immunodeficiency virus)与肠道病毒的扩张(expansion)有关,其中包括许多真核RNA病毒。此外,慢性病毒感染可增强寄主对病原性挑战的抵抗力,表明病毒可能对寄主产生有益的影响。肠道微生物还含有多种噬菌体,在健康成年人体内,这些噬菌体主要由Caudovirales 目和Microviridae 科组成。这些噬菌体通常在一段时间内保持稳定的群落。肠道噬菌体群落组成的变化与克罗恩病(Crohn’s disease)和溃疡性结肠炎(ulcerative colitis)有关。然而,与环境生态系统的噬菌体-细菌相互作用的种群动态变化遵循Lotka-Volterra “捕食者-猎物(predator-prey)”模型不同,噬菌体和细菌之间的捕食者-猎物(predator-prey)关系尚未在人类肠道微生物组中观察到。健康婴儿肠道病毒的宏基因组学研究仅限于一项对单个婴儿的研究,其中使用适度深度的桑格测序在单个时间点分析了DNA病毒。有针对性的PCR和RT-PCR研究已经鉴定出了一些真核病毒,包括经常在健康婴儿粪便中发现的picornaviruses和anelloviruses。尽管已经报道过一些对腹泻(diarrhea)和急性弛缓性麻痹(acute flaccid paralysis)等疾病患儿的肠道病毒的宏基因组研究,但迄今为止,还没有对一组健康婴儿的病毒组进行纵向分析的研究。
鉴于细菌微生物组是在婴儿的生命早期建立的,并可能影响长期健康,我们研究了伴随人体发育的真核病毒和噬菌体的变化。为了阐明病毒个体间和个体内变异的程度,我们对一对健康的同卵双生双胞胎和三对健康的异卵双胞胎的粪便样品进行测序。在这项研究中,我们将“健康婴儿”定义为没有明显潜在遗传或慢性疾病的婴儿,尽管这些婴儿也会发作急性病。为了确定病毒组的组成及其伴随年龄增长的演变,我们比较了从出生到两岁的六个时间点收集的粪便样本中的肠道病毒组。此外,我们对同一粪便中的细菌16S rRNA基因进行了测序,以生成一个关于人体肠道病毒组和细菌微生物组发育关系的综合考察。我们的结果提供重建了一个跟随时间变化的深入的婴儿肠道病毒组的动态变化过程,并揭示了在健康婴儿发育过程中自然发生的捕食者-猎物,即噬菌体-细菌(predator-prey bacteriophage-bacteria)的动态变化规律。
研究结果
婴儿早期发育的病毒组
Virome of infants during early development
我们对居住在美国密苏里州圣路易斯市大都会区的八名健康婴儿(四对双胞胎)的粪便样本进行了宏基因组测序(图1a)。 本研究中分析的样本从出生第1-4天(定义为第0个月)以及3、6、12、18和24个月时进行纵向收集,以确定婴儿早期发育期间的肠道微生物组。为了全面检测DNA和RNA病毒,从粪便标本中提取总核酸,并采用两种互补的扩增方法:多重置换扩增法(multiple displacement amplification,MDA)和序列独立的DNA和RNA扩增法(sequence-independent DNA and RNA amplification,SIA)。MDA法由于phi29聚合酶有高效持续的合成能力而被广泛使用。但是MDA法不能检测到RNA病毒,也会导致对小型环状DNA分子的偏向性扩增。为了对这种方法进行补充,我们采用了SIA法,检测到DNA的同时也能检测到RNA,但是它的DNA探测能力一般不如MDA法敏感(图1b)。我们合并了文库,在Illumina MiSeq平台上进行测序。每个MDA样品平均得到了549,301 ± 207,521 (mean ± s.d.) 条reads,每个SIA样品平均得到了551,592 ± 229,210(mean ± s.d.) 条reads。接着,去除了这些reads的接头,进行质量过滤,分类学分配(assign),每个样品随机重抽样(randomly subsampled)得到200,000条reads。为了定义全局(global)的病毒组组成,我们生成了一个由MDA方法和SIA方法鉴定的病毒科水平的文件,并且生成了一个存在-缺失(presence-absence)的热图(图1c)。这和以前基于PCR的研究结果一致,我们在婴儿粪便的样品中鉴定到了真核RNA病毒,例如caliciviruses, astroviruses和picornaviruses。另外,比起真核RNA病毒和真核DNA病毒,在科水平我们检测到更多的噬菌体。此外,只鉴定出一个古菌病毒科(Lipothrixviridae) 。
为了比较个体之间的病毒组多样性,我们在病毒属的水平用unweighted Bray-Curtis距离测定了β-多样性。病毒组的PCA分析表明,双胞胎的相关性(co-twin relatedness)和年龄对病毒多样性的变化有贡献。凝结的分层聚类(Agglomerative hierarchical clustering)也支持双胞胎的病毒组组成比无关个体更相似(图2)。
图1. 婴儿肠道病毒组的实验设计和宏基因组分析
Figure 1 Study design and metagenomic analysis of the infant gut virome.
(a) 8个健康婴儿(4队双胞胎)微生物组研究的测序方法
(b) 热图展示不同测序方法下分配至各病毒科的reads数量。可见受方法影响很大。只蒜了7个样本的方法比较,如A2-24为A2号个体24个月取样。
(c) 有无热图展示8个样本6个时间点上病毒组的状态。个体为A1-D2,时间点为0, 3, 6, 12, 18和24个月。
图2. 病毒组Beta多样性分析
Figure 2 Analysis of virome beta diversity.
凝聚层次聚类分析病毒组(基于真核病毒和噬菌体属水平)不同时间点的Bray-Curtis距离。
在出生后获得真核病毒组
The eukaryotic virome is acquired after birth
接下来,我们关注真核病毒组,真核病毒群落在最早期的样品中丰度很低,随后升高(图3a),表明真核病毒组通过环境暴露而建立。在鉴定出的真核RNA病毒中,最常见的病毒属是肠病毒(enterovirus)、副肠孤病毒(parechovirus)、烟草花叶病毒(tombamovirus) 和札幌病毒(sapovirus)(图3b)。真核病毒相对稀少,这妨碍了对常见生态参数(包括多样性和稀疏性)的准确评估。为了确定同卵双胞胎是否在相同的时间点携带相同的病毒株(virus strains),我们分析了副肠孤病毒的序列副肠孤病毒是我们的研究中检测到的最普遍的RNA病毒之一,通过组装读段(reads)并将所得的重叠群(contigs)映射(map)到副肠孤病毒基因组上。系统发育分析表明,双胞胎中的婴儿共享几乎相同的副肠孤病毒株(strains),但是不同的双胞胎具有不同的株(strains)。与这一发现相一致的是,在同卵双胞胎中也检测到了肠病毒,即另一种高度流行的真核RNA病毒。虽然这些发现表明双胞胎中的婴儿经常感染相同的病毒,但我们也观察到只有双胞胎中的一个婴儿检测到,而另一个婴儿没有检测到的病毒。例如,在婴儿 A1 3个月大的样品中检测到副肠孤病毒的序列,但在其同卵双胞胎A2中却未检测到(图3c)。为了确定观察到的不一致是由于测序灵敏度的局限还是病毒载量(viral load)的差异造成的,我们用定量逆转录-聚合酶链反应(quantitative RT-PCR,qRT-PCR)筛选了所有样品,并测量了人体parechoviruses的拷贝数。所有五个测序阳性样品都通过了qRT-PCR检测,检测呈阳性。另外的三个测序阴性样品在qRT-PCR检测中呈阳性,不过病毒载量(viral load)非常低。最后,qRT-PCR和测序都证实“不一致(discordant)”的婴儿A2携带与其同卵双胞胎A1相同的人类副肠孤病毒分离物。
因此,qRT-PCR结果独立验证了通过深度测序检测到的病毒的存在,并进一步证实了同卵双胞胎共享相似的病毒组。
指环病毒(Anelloviruses)是检测到的最普遍的真核DNA病毒科(图3d)。 几乎所有的指环病毒都是未知的,并且与以前描述的指环病毒差异很大(图3e)。因为以前的报道表明,指环病毒载量与宿主免疫状态的变化有关,所以我们假设婴儿免疫的变化(例如,母体抗体的减弱)可能反映在指环病毒流行率(prevalence)或丰度的变化上。由于检测到大量新指环病毒的序列,我们将一组非冗余的指环病毒的重叠群作为“参考基因组(要求小于95%的核酸序列相似度)”。然后,我们将每个样本的读段比对到指环病毒参考重叠群上,以确定每个重叠群的存在普遍性。这种方法与用于检测三种特定指环病毒的重叠群的PCR检测结果的一致率为98.6%。指环病毒在3个月大之前很少被检测到,但很快显著增加,在6-12个月大时达到顶峰(图3g)。
值得注意的是,一名婴儿在12个月大时至少携带了47种指环病毒。此外,同卵双胞胎比无关婴儿共享更高比例的指环病毒(图3h)。 此外,在一些情况下,可以从同一婴儿的粪便中检测到相同的指环病毒,这些粪便被收集的时间相隔为12个月(图3f),这表明持续存在或者是反复感染的稳定来源。
图3. 随年龄原核RNA和DNA病毒的替换以及双胞胎间共享病毒组
Figure 3 Alterations in the eukaryotic RNA and DNA viruses with age and evidence of shared viromes between co-twins
(a) 在不同的年龄,观察到原核DNA和RNA的分类群的丰度。使用的方法是线性回归,R2和95%置信度如图所示
(b) 检测出的原核RNA病毒属的样本数量
(c) 副肠孤病毒(parechovirus)序列基于最大似然方法的系统发育分析。Bootstrap值如图所示
(d) 包含了展示出的原核DNA病毒属的样本数量
(e) 61 个指环病毒(Anelloviruses)重叠群和12个参考株序列中的ORF1氨基酸序列比对结果,并采用最大似然方法建树,图中展示了属名
(f) 有无热图展示了指环病毒重叠群,配色与E的系统发育树的颜色一致
(g) 在不同的时间点指环病毒的丰度。用Wilcoxon检验进行统计显著性分析。
噬菌体群落的组成随着年龄收缩和转变
Bacteriophage community contracts and shifts in composition with age
尽管在所有样品中都检测到了DNA噬菌体,但是采用SIA法产生的数据并没有产生任何RNA噬菌体。在没有RNA噬菌体的情况下,我们选择将随后的噬菌体分析集中在采用MDA法产生的数据上,这样我们的发现可以与其他采用MDA法的噬菌体病毒研究相比较。与真核病毒相比,噬菌体丰富度在0个月时最大,并随着年龄的增长而降低(图4a)。丰富度稀疏曲线表明,细菌种类的积累速率随着年龄的增长而降低,这表明丰富度的降低不太可能是由抽样偏差造成的(图4b)。同样,噬菌体多样性随年龄增长而降低(图4c)。同卵双胞胎之间噬菌体病毒组的人际变异(interpersonal variation)比无关婴儿之间的要低(图4d),即病毒组更相似。与其他研究一致,最丰富的噬菌体来自有尾噬菌体目(Caudovirales)(包括长尾噬菌体科Siphoviridae、丝状噬菌体科Inoviridae、肌病毒科Myoviridae 和短尾噬菌体科Podoviridae) 和微小噬菌体科(Microviridae) 。然而,在24个月大时,群落组成发生了明显的变化,微小噬菌体科 科的相对丰度增加(图4e)。
这种微小噬菌体科丰度的变化在采用SIA方法产生的数据中也发现了,表明它不是由方法偏差造成的。还观察到微小噬菌体科物种丰富度的增加,表明这种扩张(expansion)不是由特定物种驱动的。有尾噬菌体目(Caudovirales)的相对丰度与微小噬菌体科的相对丰度成反比(图4f)。*crAssphage仅存在于一个样本中,表明crAssphage不是在生命早期获得的。因此,婴儿早期发育的特点是噬菌体群落丰富性和多样性的收缩,伴随着向以微小噬菌体科为优势组分的转变。
图4. 年龄增长噬菌体丰度下降且组成发生转变
Figure 4 Decrease in bacteriophage richness and diversity with age coincides with a shift in bacteriophage composition
(a) 在不同的年龄月份下噬菌体物种的丰度。使用了线性回归,R2和95%置信度如图所示
(b) 稀疏曲线,展示了被识别噬菌体物种的丰富度
(c) 在不同时间点的噬菌体的α-多样性,使用了线性回归,标注了R2和95%的置信区间
(d) 两对(白色)噬菌体病毒体在属水平上的Bray-Curtis距离,按双胞胎内(Winthin twins,白色)与双胞胎间(Between twins,灰色)分组相比较。统计显著性通过学生t检验进行评估; P = 0.01–0.05,* P < 0.01。
(e) 噬菌体科水平的相对丰度。按科分类,未命名的按目分类。
(f) 该图显示了微小噬菌体科家族丰度与有尾噬菌体目丰度的关系(n = 48个采样时间点)。线性回归和95%置信区间,并显示Spearman相关系数(r)和统计显著性
婴儿的细菌微生物组的变化
Bacterial microbiome changes in infants
随着细菌种群丰富度和多样性的不断增加,婴儿早期健康肠道细菌微生物组的生态特征在2-3岁时发育成熟,成为更稳定的“类成人(adult-like)”种群。 鉴于我们在噬菌体病毒组中观察到的巨大变化,我们试图了解这些变化是否与细菌微生物组的变化相关。因此,我们进行了细菌16S rRNA基因测序,平均每个样本产生67,569条序列。经过质量过滤后的序列以97%的同一性阈值被聚类到一个操作分类单元(OTU)中。未加权的UniFrac距离矩阵(unweighted UniFrac distance matrices)的PCoA分析表明 细菌群落的变化与年龄有关。细菌丰富度(图5a)和多样性(图5b)也随着年龄增长而增加的现象与其他研究一致。总的来说,我们鉴定出越来越丰富的梭菌属Clostridia (厚壁菌门Firmicutes)(图5c)。在此之前,芽孢杆菌纲Bacilli (Firmicutes)的OTUs在0个月占优势,Gammaproteobacteria (Proteobacteria)和Actinobacteria (Actinobacteria)的丰度在3个月和6个月增加,Bacteroidia (Bacteroidetes)丰度在12个月、18个月和24个月增加。同卵双胞胎之间的个体间差异小于无关婴儿之间的差异。(图5d) 因此,本研究中婴儿的细菌微生物组与之前观察到的预期变化轨迹一致。
图5. 细菌群落随年龄扩张
Figure 5 Bacterial community expansion with age
(a) 在不同的年龄下细菌物种的丰富度。使用了线性回归,R2和95%置信度如图所示
(b) 不同时间点的细菌的α-多样性,使用了线性回归,标注了R2和95%的置信区间
(c) 基于16S rRNA基因测序,细菌科水平的相对丰度
(d) 双胞胎之间和无关个体之间细菌群落的Unifrac距离,统计显著性通过学生的t检验进行评估,** P < 0.01
噬菌体与细菌类似捕食者-猎物的关系
Predator-prey–like bacteriophage and bacteria relationships
尽管海洋中噬菌体-细菌的关系显示出捕食者-猎物(predator-prey)的动态,但噬菌体和细菌种群在成年人肠道中相对稳定。然而,还没有研究过在婴儿中是否存在这种捕食者-猎物(predator-prey)的关系。在我们的研究队列中,噬菌体多样性与细菌多样性成反比(图6a)。通过检查随时间的趋势,我们发现微生物群落在0个月时从高噬菌体-低细菌的多样性群落转变为24个月时的低噬菌体-高细菌的多样性群落。
噬菌体和细菌丰富度由年龄决定的方式成反比也与这一发现一致(图6b)。进一步反映这些生态趋势,噬菌体和细菌的特定属之间的相关性,使用混合线性模型计算,主要是负相关。因此,婴儿病毒组和细菌微生物组在生命早期以动态轨迹进化。
图6. 噬菌体和细菌之间的负相关关系
Figure 6 Inverse ralationships between bacteriophages and bacteria
(a) 噬菌体多样性和细菌多样性之间的相关性(n = 48个采样时间点)。线条表示线性回归,并显示Spearman相关系数。颜色表示年龄从0到24个月不等。
(b) 噬菌体丰度和细菌丰度之间的相关图(n = 48个采样时间点)。线条表示线性回归,Spearman相关系数(r)表示。颜色表示年龄从0到24个月不等
讨论
肠道微生物之间的相互作用影响宿主的生理、发育和免疫。婴儿肠道细菌微生物组的组装(assembly)可能对成年时的微生物组有决定性的作用,这会对宿主表型的某些方面产生长期影响,包括肥胖、炎症肠病和食物过敏。然而,我们对病毒在婴儿体内的发育方式、对细菌微生物组的影响或在人类健康中的作用都知之甚少。在这个研究中,我们纵向描述了8个婴儿(4对双胞胎)的完整病毒组和细菌微生物组,并揭示了健康婴儿病毒组发育过程中的微生物里程碑。双胞胎研究设计使我们能够确定同卵双胞胎之间的婴儿微生物组(病毒组和细菌群落)比无关婴儿之间更相似。
这一结果与一项成年同卵双胞胎的研究形成了对比,在这项研究中,DNA病毒对每个个体都是独特的,双胞胎之间的相似程度并不比无关个体之间的相似程度高。一种可能的解释是,尽管“双胞胎(twin-ness)”这一特点在婴儿期很重要,但这可能反映了这样一个事实,即环境暴露是病毒成分的主要驱动因素,因为婴儿双胞胎通常仍然共享一个共同的环境。
当在同一时间点取样时,在同卵双胞胎中检测到非常一致(near-identical)的真核病毒株就证明了这一点。
指环病毒(Anelloviruses)被提议作为功能性免疫能力(functional immunocompetence)的生物标记物,因为血清中指环病毒载量的变化与移植受体的免疫抑制水平有关。此外,还经常通过PCR在婴儿血清中检测到指环病毒。我们观察到在6个月和12个月大的时候肠道中指环病毒丰富度的增加;这些指环病毒中的大多数与已知的指环病毒有很大不同,强调了使用无偏的深度测序方法来系统地描述病毒组的价值,因为它们可能难以用PCR检测到。我们推测这种扩张(expansion)可能是免疫状态降低的结果,因为随着母体抗体的减弱,它与人类IgG的最低点相一致。
到目前为止,没有证据表明“杀死赢家(kill-the-winner)”的动态在人类肠道微生物组中发生,因为细菌(猎物)种群的峰值并没有先于噬菌体(捕食者)的增加,随后细菌(猎物)种群减少。虽然这是经典Lotka-Volterra“捕食者-猎物”模型中最普遍认可的一个方面,但该模型也描述了有限的猎物多样性控制捕食者丰度(即捕食者峰先于猎物,也称为反向捕食者-猎物循环)的相互关系。我们的研究表明,早期婴儿发育中噬菌体-细菌的相互作用始于Lotka-Volterra模型的后一种动态。我们假设噬菌体的多样性在出生时很高,但是噬菌体群体是不可持续的,因为细菌定居密度低。这导致噬菌体病毒组的收缩,从而减轻对细菌群落的掠夺性压力,使其能够在肠道中形成并且定植。反过来,这推动了新建立的细菌群落中选择的噬菌体组成的转变(包括微小噬菌体科Microviridae 丰度的增加)。在一项为期2.5年的对单个成体的纵向研究中,微小噬菌体科是主要的噬菌体分类单元,这提出了一个问题,即婴儿期的动态微生物组状态如何以及何时转变为稳定的群落,虽然这已经在成年人的研究中报道过。此外,尽管我们的研究无法解决早期噬菌体多样性的来源问题,但我们的数据提高了垂直或产前传播的可能性(首次采样的中间天数为生命的第2.6天)。尽管如此,我们的数据将作为健康婴儿微生物群落发展的参考。尽管出生时与健康发育相关的噬菌体收缩可能是一种普遍的表型,但特定的起始噬菌体组成可能因外部因素(如地理和饮食)而不同。
众所周知,饮食、抗生素和出生模式会影响细菌微生物组。尽管我们的队列包括在接合性(zygosity)、母乳喂养状况和分娩方式方面不同的个体,但研究队列规模小排除了这些因素在微生物组中发挥作用的分析。无论如何,我们目前的研究提供了肠道病毒和细菌在早期发育过程中动态相互作用的详细信息。
方法
取样
Sample
该研究得到了圣路易斯华盛顿大学医学院人类研究保护办公室的批准。我们获得了双胞胎婴儿母亲的同意,每月收集孩子的粪便标本,持续到三岁。粪便样品装在含有冷冻包的绝缘信封中快递给实验室,并且储存在-80℃直至分析。收集的数据 包括分娩方式,婴儿给药的情况,喂养的食物和疾病发作(发烧/呕吐/腹泻)的情况,定期采访父母或检测双胞胎医生的医疗记录。本研究中的4对双胞胎(8名婴儿)被选为健康婴儿的代表,这些婴儿在接合性(zygosity),母乳喂养,性别(6名男性和2名女性)和出生模式方面各不相同。在这项研究中,我们将这些婴儿定义为“健康”,因为他们没有明显的潜在遗传或慢性疾病。没有其他排除标准。婴儿也有急性疾病发作。用于在研究中标记标本的命名方法是,短线前表示婴儿双胞胎,短线后是年龄(例如,A2-24是指来自第A对双胞胎的第二个小孩儿,在24个月龄时收集的样品)。为了手稿的清晰起见,生命年龄定义为0个月(平均2.6天,s.d.±1.1天),3个月(平均98.0天,s.d.± 2.7天),6个月,18个月(平均545.0天,s.d.± 17.4天)和24个月(平均718.5天,s.d.± 11.6天)。
病毒组测序
Virome sequencing
将粪便样品(约200mg)以1:6的比例稀释在磷酸盐缓冲盐水(phosphate-buffered saline,PBS)中,并通过0.45μm孔径的膜过滤。根据制造商的推荐,在COBAS Ampliprep仪器(Roche)上从滤液中提取总核酸。使用随机数发生器随机化样品(以定义每次测序样品的分组),然后进行以下扩增方法。对总核酸进行序列无关的DNA和RNA扩增(SIA),引物由随机15-mer(15 Ns)上游的碱基平衡的16个核苷酸(nt)特异性序列组成,用于随机引物,如前所述,用于Nextera DNA试剂盒构建文库(Illumina)。
对于多重置换扩增(MDA),根据制造商的说明用phi29聚合酶(GenomiPhi V2试剂盒,GE Healthcare)扩增总核酸,并用于Nextera DNA试剂盒构建文库(Illumina)。使用Agencourt Ampure XP珠(Beckman-Coulter)纯化和筛选文库,然后使用2100生物分析仪(Agilent Technologies)定量。合并多重SIA文库并与多重MDA文库分开测序。一个SIA样本(C2-0)库构建失败,未进行测序。此外,评估文库构建后可能发生的标本交叉污染水平,我们在每次测序时加入了由来自线虫Orsay病毒RNA1区段建构的独特索引的cDNA文库。
因此,24个文库和1个Orsay病毒对照文库以等摩尔每次合并测序,并在华盛顿大学基因组科学与系统生物学中心的Illumina MiSeq平台上测序(总共4次MiSeq测序运行,2×250双端读取,MiSeq v2试剂盒)。
病毒组序列处理
Virome sequence processing
在处理病毒组序列直至分类学分配(assignment)期间,研究人员对分组信息(即年龄,双胞胎,时间点)不知情。对测序读数进行样本拆分(demultiplexed),并去除了接头序列。使用ea-utils包中的fastq-join合并双端序列。以Q30 Phred质量得分的阈值下对序列进行质控,修剪和丢弃低质量核苷酸。
通过查询定制的病毒数据库来识别候选病毒读段(reads)。定制病毒数据库由具有来自NCBI NT和NR数据库(2013年11月7日下载)的“病毒”超级域分类(superkingdom classification)的所有序列组成。CD-HIT用于最小化序列冗余,产生449,469个序列的定制病毒NT数据库和621,095个序列的病毒NR数据库。使用BLASTn(e-value阈值1E-10)依次针对定制的病毒数据库比对测序这场仗,然后是BLASTx(e-value阈值1E-3)。通过使用MegaBLAST(e-value阈值1E-10),BLASTn(e-value阈值1E-10)比对到NCBI NR数据库查询候选病毒reads来过滤假阳性病毒序列,使用BLASTx(e-value值1E-3)比对到NCBI NT数据库以去除具有对应于非病毒序列(例如,人,真菌等)的最佳BLAST比对的序列。测序读段的分类学分配(assignment)由最佳BLAST结果的分类ID确定。使用内部(in-house)perl和python脚本从BLAST的输出文件中解析科水平和属水平的分类学分配(assignment)。使用MEGAN(version 5.8.6)中的最低共同祖先算法(lowest-common-ancestor algorithm)确定噬菌体物种分类学分配,参数如下:Min Support: 1, Min Score: 40.0, Max Expected: 0.01, Top Percent: 10.0, Min-Complexity filter: 0.44。由于读段中存在低复杂性/重复区域,分析中省略了以下假阳性病毒家族分类学分配:Herpesviridae (3 条reads), Mimiviridae (1 条 read) and Phycodnaviridae (2条reads)。为了评估标本交叉污染,我们评估了每个拆分(demultiplexed)数据集中是否存在映射(map)到对照Orsay病毒的读段。从对照文库自身获得的Orsay病毒测序读数的平均数为463,315条读段(SD ± 106337条读段)。48个婴儿标本中没有一个产生任何Orsay病毒测序读段。
病毒组分析
Virome analysis
根据测序深度,SIA法和MDA法生成的测序读段稀释(rarefied)到每个样品200000条读段(5次重复(iteration))。将针对给定病毒分类群检测的reads数量绘制为热图。所有重复(iteration)的分析都获得了一致的结果。因此,这说明我们得到的结果来自于有代表性的重复(iteration)。为了定义全局(global)病毒组的组成,我们合并了经过稀疏(rarefied)的SIA和MDA数据,并将其绘制为未加权(存在/不存在)(unweighted (presence/absence) )的热图。该合并数据用于分析全局(global)的病毒组(真核病毒和噬菌体)。在真核病毒体群落的独立分析中,真核病毒的流行情况(prevalence)不足以准确评估最常见的生态测量指标(measurement)。为了分析噬菌体病毒组的群落,我们使用了MDA数据,因为它更能代表DNA病毒,使我们的研究结果可以与之前采用MDA法的其他噬菌体组的研究相比较。使用vagen R包进行生态分析,包括丰富度和多样性测量(Shannon指数,Bray-Curtis相异性),凝聚层次聚类(agglomerative hierarchical clustering)和稀疏曲线分析。使用500个置换/重排(permutations)绘制稀疏曲线。使用Emperor 进行主坐标分析(Principal-coordinate analyses,PCoA)。
为了检查个体间病毒的株系(isolates),使用bowtie2和 PhyML将测序读段映射到参考基因组(人体parechovirus 1(FM178558),人体肠道enterovirus B(NC_001472)和 crAssphage(NC_024711.1))。用jModelTest2(version 2.16)和ProtTest(version 2.4)评估进化模型,在PHYML(version 3.00)构建最大似然的系统发育树。
通过1000个非参数bootstraps评估对ML树的支持,并且至少进行两次分析。
人体副肠孤病毒分析
Human parechovirus analysis
之前描述过一个靶向基因组中5’UTR区域中的保守序列用于筛选所有样品的副肠孤病毒的泛副肠孤病毒的TaqMan RT-PCR检测。使用的引物如下:AN345F(5’-GTAACASWWGCCTCTGGGSCCAAAAG-3’)和AN344R(5’-GGCCCCWGRTCAGATCCAYAGT-3’),探针AN257(5’/ 6-FAM / CCTRYGGGTACCTYCWGGGCATCCTTC / TAMRA / -3’)。使用TaqMan Fast Virus 1-Step Master Mix(Applied Biosystems)进行qRT-PCR。20μL反应液中包括5μL提取的样品,10 pmol每种引物和5 pmol探针。使用以下循环条件:50℃ 5 分钟,95℃ 20秒;40 个循环进行95℃ 3秒和58℃ 30秒。根据制造商的方法在体外产生测定的标准曲线,使用MEGAscript(Ambion)从一个包含目标区域的质粒中产生体外转录的RNA,生成标准曲线。使用5×106至5个拷贝的体外转录RNA的系列稀释液产生标准曲线,并定义5个拷贝的检测下限。样品在96孔板形式中用5个仅含水的阴性对照进行测试。
所有5个阴性对照均为副肠孤病毒阴性。我们试图从副肠孤病毒阳性样品中获得直系同源3D区域以进行系统发育比较。
使用oligo(dT)20,用ThermoScript逆转录酶(Life Technologies)进行3’RACE反应,随后用对人体副肠孤病毒特异的引物(5’-CCAGGTTAACAATGAACTATGGCAG-3’)进行PCR扩增。虽然在样品D1-12和D2-12通过了Taqman试验(低病毒拷贝),检测到人类副肠孤病毒,但我们无法经过3’RACE和RT-PCR从这些标本中扩增人体副肠孤病毒。
指环病毒分析
Anellovirus analysis
许多指环病毒序列与已知的指环病毒只有非常有限的相似性(identity),这表明它们是高度不同的。因此,我们首先整理(curate)指环病毒的基因组序列。使用Newbler(version 2.8)从所有质量过滤的读段中重新(de novo)组装重叠群,并使用BLASTx对上述定制的病毒数据库进行查询,以鉴定指环病毒重叠群。将大于500 nt的指环病毒的重叠群与参考指环病毒基因组进行比对,参考基因组如下:alphatorquevirus TTV1 (AB008394), TTV-P1C1 (AF298585), TTV SIA109 (FJ426280), TTV8 genotype 22 (AB054647); betatorquevirus TTmV1 TLMV-CBD279 (AB026931), TTV-like TLMV-CLC062 (AB038625), TTV-like TTMV_LY2 (JX134045), TTmV5 TGP96 (AB041962), TTV-like LIL-y1 (EF538880), TTV-like LIL-y2 (EF538881), TTmV3 (NC_014088); gammatorquevirus TTmV1 MD1-073 (AB290918), TTmV MDJHem8-2 (AB303557), TTmV MDJN1 (AB303558)。通过采用一致序列(consensus),将具有大于95%核苷酸同一性的重叠群组合。
另外,为了确定指环病毒的系统发育关系,仅将编码ORF1的contig用于进一步分析。从ORF1氨基酸比对构建ML系统发育树,其包括上述anelloviruses参考基因组。通过1000个非参数自举来评估对ML树(LG + I + G + F)的支持。分析至少进行了两次。
为了在生物信息学方面确定指环病毒的流行率,使用bowtie 2和SAMtools,将测序读段比对到整理好的指环病毒基因组重叠群。我们评估了采用计算机分析和采用PCR检测流行率的一致性,选用了三种指环病毒:一种alphatorquevirus anellovirus Contig2355(正向引物 5’-GTAGCCAGAATAAGAACTATGCCC-3’,反向引物 5’-TACTGTCTAAAACCTGGAAGTTGC-3’); betatorquevirus anellovirus Contig2737(正向引物 5’-TCCAAGAGACTTTAAACCAGGCC-3’,反向引物 5’-GGAACTCCTGGATTGTCCCATC-3’); gammatorquevirus anellovirus Contig2393(正向引物 5’-CTGATGTAGATGATGGACATGGC-3’,反向引物 5’-CATGAGCTTTGTTGCAGAAAGTC-3’)。选择这三种指环病毒重叠群的标准如下:(1)选择每个属的代表(α,β和γ),和(2)基于序列数据,重叠群存在于一个婴儿多个时间点的数据中或在多个婴儿的数据中都检测到了。用Taq DNA聚合酶(Life Technologies)在以下循环条件下进行PCR:95℃ 5分钟,50个循环95℃ 30秒,58℃ 30秒,72℃ 23秒,然后72°C,10分钟。使用2%琼脂糖凝胶电泳检测产物。
细菌16S rRNA基因测序
Bacterial 16S rRNA gene sequencing
通过珠子研磨提取粪便样品中的核酸。使用特异V4区域的Golay-barcoded引物(F515/R806)。合并等摩尔的文库并使用Illumina MiSeq测序仪(2 × 250 paired-end reads, MiSeq v2 reagent kit)在华盛顿大学的基因组科学和系统生物学中心进行测序。4个样品(A1-0,A2-0,D1-0,D2-0)产生的reads不足(<10,000个读数)。因此,我们在40个PCR循环中对这4个样本重复16S PCR,并在随后的MiSeq测序运行中对其文库进行重新测序。
细菌16S rRNA基因分析
Bacterial 16S rRNA gene analysis
用QIIME v1.8.0进行16S分析。序列采用Q20进行质量控制,然后拆分样本。基于Greengenes数据库(version 13.8)将序列分配到97%同一性阈值的有参(closed )OTU。在处理16S rRNA基因序列直至OTU分类学分配期间,研究人员对组分配(group allocation)(即年龄,双胞胎,时间点)不知情。为了考虑样本间测序深度的变异性(variability),所有样本都稀疏到每个样本10000条序列(10次重复(iterations)),超过了之前描述的普遍接受的最小测序深度。在所有重复(iterations)中的16S分析中获得了一致的结果。因此,显示了从代表性重复(iterations)获得的结果。使用QIIME计算α多样性(Faith’s phylogenetic diversity),OTU丰富度和UniFrac距离。使用vegan R包绘制稀疏曲线,使用500次置换(permutations)。使用Emperor可视化PCoA图。
相关网络
Correlation network
使用线性混合模型研究细菌和噬菌体随时间的相对丰度变化情况。混合线性模型考虑了在不同时间点来自相同受试者的重复测量。在该模型中,对细菌和噬菌体的相对丰度进行了对数转换,将样品收集时间指定为固定效应,并将受试者指定为随机效应。使用错误发现率(false discovery rate,q值)校正来自多个比较的P值。q值小于0.05被认为是统计学显著。使用Cytoscape绘制细菌和噬菌体相关性。分析在R(version 3.1.2)中进行。
统计分析
Statistics
使用SAS进行学生t检验(双尾)。验证了组之间的正态分布和方差齐性。应用Wilcoxon检验(成对,无参)匹配的样品在0个月与24个月之间比较真核病毒丰富度,噬菌体丰富度,噬菌体多样性,细菌丰富度和细菌多样性。用GraphPad Prism进行Wilcoxon检验,线性回归和Spearman相关关系分析。相应地显示P值和95%置信区间。
数据访问编号
Accession codes
序列数据已经保存到NCBI Sequence Read Archive中,BioProject的登记号码为SRP058399。
译者简介
秋芒树,本科毕业于中国农业大学,硕士就读于英国帝国理工学院Computational Methods in Ecology and Evolution专业。关注婴儿肠道微生物,肠道细菌与噬菌体的相互作用。在宏基因组公众号发表《Nature:TEDDY计划中幼儿肠道微生物组随时间的发育》、《Cell子刊:成年同卵双胞胎的病毒组多样性与肠道微生物组多样性相关》、《CHM:新生儿肠道微生物菌群研究》 等。欢迎批评、指正和交流, j.wu18@imperial.ac.uk
Reference
Lim E S, Zhou Y, Zhao G, et al. Early life dynamics of the human gut virome and bacterial microbiome in infants[J]. Nature medicine, 2015, 21(10): 1228.
延伸阅读
Minot, Samuel, et al. “Rapid evolution of the human gut virome.” Proceedings of the National Academy of Sciences 110.30 (2013): 12450-12455.
Breitbart, Mya, et al. “Viral diversity and dynamics in an infant gut.” Research in microbiology 159.5 (2008): 367-373.
Bäckhed, Fredrik, et al. “Dynamics and stabilization of the human gut microbiome during the first year of life.” Cell host & microbe 17.5 (2015): 690-703.
猜你喜欢
10000+:菌群分析 宝宝与猫狗 梅毒狂想曲 提DNA发Nature Cell专刊 肠道指挥大脑
文献阅读 热心肠 SemanticScholar Geenmedical
16S功能预测 PICRUSt FAPROTAX Bugbase Tax4Fun
生物科普: 肠道细菌 人体上的生命 生命大跃进 细胞暗战 人体奥秘
写在后面
为鼓励读者交流、快速解决科研困难,我们建立了“宏基因组”专业讨论群,目前己有国内外5000+ 一线科研人员加入。参与讨论,获得专业解答,欢迎分享此文至朋友圈,并扫码加主编好友带你入群,务必备注“姓名-单位-研究方向-职称/年级”。PI请明示身份,另有海内外微生物相关PI群供大佬合作交流。技术问题寻求帮助,首先阅读《如何优雅的提问》学习解决问题思路,仍未解决群内讨论,问题不私聊,帮助同行。
学习16S扩增子、宏基因组科研思路和分析实战,关注“宏基因组”