Current Opinion in Microbiology/优先考虑植物核心微生物群成员的丰度-占有率分布
点击蓝字关注我们
题目:Abundance-occupancy distributions to prioritize plant core microbiome membership
优先考虑植物核心微生物群成员的丰度-占有率分布
期刊:Current Opinion in Microbiology(2019)
IF:6.23
通讯作者:Ashley Shade
摘要
核心微生物群成员是一个数据集的一致特征,被假设为反映与宿主的潜在功能关系。回顾最近的植物微生物组学文献,可以发现定义核心的各种特定研究方法,这对构建一般植物微生物组学框架提出了挑战。丰度-占有率分布在宏观生态学中用于描述空间上群落多样性的变化,为空间和时间研究的核心成员排序提供了一种生态学方法。此外,适合丰度-占有率分布的中性模型可以提供对确定性选择的核心成员的见解。我们提供了一些例子和代码,以便系统地从丰度分布中探索核心植物微生物群。尽管我们着重于植物微生物组的实例和相关讨论,但丰度占有法可以广泛而普遍地应用于确定任何微生物组的核心成员的优先级。(注:本文作者Shade等人在2010年发表的文章Seasonal and episodic lake mixing stimulate differential planktonic bacterial dynamics中将湖水里的浮游细菌,通过物种多度分布分为“稀有”、“一 般”、“优势”的类群组,根据样品占有率分为“瞬时”、“持久”的类群组,每一个群组对混合的水柱都有不同的响应,稀有−瞬时的和优势−持久的群组驱动整体微生物群落对混合水柱的响应)
引言
核心微生物群是微生物群落的共同特征。从2011年肉食性猪笼草的核心微生物群“组成与动物肠道微动物相似”的报告开始,在对拟南芥根进行了开创性研究之后,人们对识别核心植物微生物群的科学兴趣增加了科学兴趣。从那时起,核心微生物群的概念就被应用于在多种环境中生长的许多植物物种,并以各种生物或统计驱动方式进行定义(表1)。由于它们的一致性,核心微生物群成员被推断对宿主适应度具有一定的重要性,因此有可能管理植物微生物群以达到预期的结果。然而,每一个研究设计都是不同的,定义核心微生物群的方法几乎和已有的研究一样多。因此,对微生物组学研究,特别是对植物微生物组学的一个剩余的挑战是,在不同的研究中相互协作,以普遍了解核心微生物组学,这些核心微生物组学可用于在一个不断变化的星球上支持微生物组学的预测和管理,跨植物物种和环境。
表1:通过丰度、占有率和两者定义核心植物微生物群的代表性研究。有关植物种类、隔间和核心微生物组定义的完整研究列表及其详细信息
想要定义核心微生物组有不同的动机。有些研究只是想知道在一个寄主上哪个分类群最丰富。这一核心定义可以通过排列丰度曲线得到通知。然而,许多对植物具有功能性影响的微生物菌株通常是罕见的(例如,许多植物病原体),并且丰富度确定的核心错过了在群落中不占优势的重要成员。其他的研究想知道哪些分类群总是在宿主身上或在某种条件下(例如存在/不存在)被检测到。这个核心定义可以通过一个Venn图来说明。然而,微生物组数据集中稀有类群的优势将使在特定生长条件或基因型中检测到的类群数量膨胀。因此,检测定义的核心成员资格可以包括许多不重要的成员,这些成员是暂时的。最后,一些研究通过在特定条件下富集来定义核心微生物群。因此,核心成员是那些在焦点条件下持续检测到的丰度高于比较条件的成员。这个核心定义包含了探测和丰度的各个方面,并且可以提供生态见解,以便优先考虑由宿主选择的或适应宿主环境的成员。
图1注(下图):一种利用丰度占有率分布对核心微生物群进行空间和时间优先排序的通用方法
①空间(橙色)和时间(绿色)研究设计在确定占有率时有不同的考虑因素和优先级。
②列中的分类单元(操作分类单位,otu)和列中的样本(群落,包括复制)的分类单元表。存在/不存在由细胞的阴影显示,分类单元计数(丰度)是细胞值
③占用率根据研究设计确定,考虑到跨站点或随时间推移的检测,以及复制一致性。空间和时间方法在计算了排名指标后同样进行。
④分类单位按指数排序
⑤计算整个数据集的Bray-Curtis相似度,然后只计算排名靠前的分类群。排名靠前的分类群的贡献除以Bray-Curtis的总和,以计算预期核心集对β多样性的贡献百分比。下一个排名的分类单元是连续添加的,以找到排名中的一个点,在这个点上,再添加一个分类单元会降低β多样性解释值的回报率。
⑥一个假设的群落集合中性模型的例子适合一个充裕的占有率分布。每个点是不同的分类单元,核心分类单元是蓝色的大点,而非核心分类单元是黑色的小点。每个点是一个分类单元,由其平均log10相对丰度和占有率绘制,绿色实线是中性模型,灰色虚线是模型拟合的95%置信区间。不在95%模型置信度范围内的点被推断为确定性地而不是中性地被选择。模型上方的点由(植物)环境选择,模型下方的点受扩散限制。
在定义核心的方法中,有一些直觉上的共同点最近被应用于植物微生物群:它们通常包括一些分类单元比例贡献的阈值和对样本的最小检测。
在生态学中,这些直观的特性分别称为丰度和占有率。丰度-占有率分布提供了一种一致的、生态驱动的方法来确定核心成员的优先顺序。在宏观生态学中,物种丰度占有率分布常常被用来探索分类单元分布的大规模模式(图1)。一个分类单元的平均相对丰度经过log10变换,然后根据其出现的离散样本的比例绘制图(所有样本中都有1个样本)。丰度和占有率共同为解释种群和群落层面的多样性模式提供了丰富的信息。
丰度-占有率分布可用于从任何类型的群落数据集生成核心微生物组成员的支持性假设,然后为后续研究确定这些核心类群的优先级,以测试它们的功能重要性。在这里,我们首先讨论了丰度-占用率分布是如何被类似地应用和解释的,以将核心成员的优先级划分为空间和时间(图1)。我们通过量化排名靠前的成员(占有率)对beta多样性的贡献来通知核心成员的阈值。然后,我们讨论了利用微生物群落集合的中性模型,根据其分布下的群落装配过程来区分类群。利用大量的占有率数据拟合中性模型,不仅有助于解释和讨论核心成员关系,而且有助于假设的建立。最后,我们以注意事项和限制结束。
空间上优先考虑核心微生物群
在宏观生态学中,丰度-占有率分布通常用于考虑空间多样性的变化,虽然它并不经常被用于思考“核心”分类群,但这是一个在微生物生态学中更积极应用和研究的概念。在微生物生态学中,有几种研究类型具有明确的空间成分,允许将丰度-占有率方法直接转移到数据集。特别是对于植物微生物组的研究,空间成分是固有的,因为有时寄主施加了高度的环境异质性(例如土壤化学、根区)。在一些植物微生物组实验设计中,人们努力将盆栽、行间或田间变异性降至最低,以便能够分离出感兴趣因素的有趣属性(如植物基因型、管理)。 在其他的研究中,描述植物微生物群对空间环境梯度的变化提供了一个生物地理学问题,在这个问题上,空间本身就是感兴趣的因素。核心微生物群可以从这些空间研究设计中的任何一个得到信息。
然而,空间研究设计对于计算分类单元占有率很重要。计算占有 率的最简单方法是让所有离散样本对总样本的贡献相等,表示为1的比例(或100%的百分比)。这种方法是最保守的,并且将核心限制在每个样本中检测到的那些分类群,因此也将偏向于更丰富的分类群(见下面的中性模型讨论)。然而,随着空间上的重复,有时在生态学上是相关的,考虑到重复的集体和消除不一致的分类群。或者,占有率可以被视为在一个位置/处理中的检测,这样只要分类单元在每个位置被表示(尽管不一定在该位置内的所有重复中),它就被视为发生在那里。这种方法不太保守,因此可能存在假阳性分类群,在功能测试之后,这些分类群会从核心集合中删除。然而,这种方法也更有可能包括平均丰度在中到低的分类群,这取决于群落的结构。
Box1量化核心成员对beta多样性的贡献
系统地探索用于定义核心微生物群的丰度和占有率包含阈值的一种方法是,探究由此产生的核心成员关系如何反映完整数据集的总体模式,即β多样性。在这里,我们提供了一种方法和R代码来系统地探索核心包含标准。我们强调,该计算可应用于不同的研究设计:重复时间序列(图a,柳枝稷叶际);基因型定义的核心(图b,互惠移植实验中的猴花生态型招募)和位点定义的核心(图c,一项关于美国种植区普通豆子的生物地理学研究,作者未发表的数据)。在每种情况下,丰度占有率分布都符合中性模型。实线显示模型拟合,虚线显示95%置信区间。以绿色、蓝色或橙色突出显示的点分别属于空间、基因型或时间植物核心。中性模型的R代码来自Ref。
根据研究设计,分类单元按占有率排名第一,还可以选择包含分类单元丰度的权重。然后,通过计算归属于核心子集的总群落相似性的比例,量化核心分类群子集对β多样性的贡献。我们使用Bray Curtis(式1),但其他相似性是可互换的,因为不同的相似性强调β多样性的不同方面,应仔细考虑。
最后,为了确定核心包含阈值的增加将在解释值上提供边际回报的点,我们提供了两种方法:更严格的“肘”方法(一阶差分,见下面的解释)和β多样性的最终百分比增加(我们建议2%或更多)。
图1中的每个数据集都显示了将下一个分类单元添加到核心的累积解释值(如图1第5部分所示)。红线通过一阶差分区分核心分类单元,绿线、蓝线或橙线通过Bray- Curtis相似度区分解释值的最后2%增加。在等式1中,C是一组排序分类群(按占有率/丰度)对总Bray-Curtis相似性的贡献,BC是Bray-Curtis,被指定为包括所有otu或仅假设核心集。
公式1:C = 1 - (BCotu core)/(BCotu all)
求图的“肘”的方法是基于一阶差分(从数值微分)。在这种方法中,通过将曲线分成两部分并计算这两部分的平均变化率的差异,为每个截断点分配一个分数。然后,选择肘部点作为最大化该分数的截断点。(注:这里的肘部指的应该是图中的趋平(驻点)的点)
分析脚本:包括选择核心的肘和百分比增长方法,可以在https://github.com/ShadeLab/
PAPER_Shade_CurrOpinMicro找到。
建议对核心微生物进行系统研究,以确定生态支持的核心成员组成以及阈值,但从实验设计和提出的研究问题来看,应结合生态学的观点。我们建议进行迭代探索,量化β多样性核心成员的解释价值(Box1,图1-5)。这个过程包括按占有率对分类单元进行排序,连续确定排序分类单元对β多样性的集体贡献,并在添加下一个排序分类单元时应用一个建议收益递减的阈值。
考虑到土壤的高度环境异质性,另一个空间考虑因素是研究中包含的生物地理区域范围。与与使用标准盆栽土壤混合物的温室研究相比,一项全球研究应该期望拥有更多的多样性和更少的占有率为1的分类单元。因此,虽然不会有一个“一刀切”的核心包含阈值,但从丰度占有率分布对核心集的使用和系统探索可以提供一种一致的方法,将生态重要类群在空间和时间优先考虑。
在时间上对核心类群优先考虑
微生物群落生态学的纵向研究越来越普遍,而且由于植物发育过程中激素和根系分泌物的产生发生了已知的变化,因此大家对植物微生物群落特别感兴趣。另一个有趣的时间成分是具有多年生或一年两次生的植物历史可能会以不同的方式从具有年度策略的植物中招募和维持核心微生物群成员。此外,一些植物的隔间,如附生叶际表面,可能会经历比其他隔间更大的环境波动,如根内生植物。 然而,了解生活在这些隔间中的微生物群是如何在时间上发生变化的有很多工作要做,而且,由于破坏性采样通常是必需的,在研究设计中执行时间复制可能存在实验上的挑战。(译者认为现阶段去进行设计个性化非破坏性采样装置也是很有必要的,例如前面一些学习内容Science Advances/最初的土壤微生物群落组成和功能决定了未来植物的健康状况Microbiome/破译豆科植物根微生物组组成与功能)因此,定量时间研究核心微生物群已经形成,并且这个领域比较开放。
随着时间的推移,丰度-占有率分布已被应用于其他系统以识别核心微生物群。“持久性”和“暂时性”被用于根据人体肠道内每日时间序列的占用箱对微生物组成员进行分类。将中性模型应用于根据斑马鱼发育过程中离散时间点收集的数据计算的丰度-占有率分布。考虑到需要了解植物发育过程中微生物组的变化或季节变化,这些方法在概念上与植物微生物组研究的目标一致。
在计算空间占用率时,考虑的是将占用轴折叠为仅包含问题的最具生态相关性系列,而不是整个样本集。可以说,随着时间的推移,这对于定义核心微生物群更为重要,因为占有率表明了持久性:哪种分类群与植物相关的检测最为一致,即使随着时间的推移,环境也会发生变化(在前面的学习土传青枯病入侵破坏了根际细菌微生物组中,作者的时间采样通过分析手段将植物发育时间与理化性质剔除开来,以研究根际细菌群落的关联SBB/土传青枯病入侵破坏了根际细菌微生物组)。持久性是维持系统稳定性的一个关键生态学考虑因素,这通常是理解核心微生物群所期望的转化结果。此外,核心植物微生物群落的时间动态为比较干扰提供了重要的基线序列(例如,对于作物、生长季节与洪水、干旱或其他管理变化)
我们最近使用了大量的占有率分布来优先考虑多年生柳枝稷叶际(附生)中的一个核心,在一个复制的区块设计中在田间种植长达两个季节(这是作者2019年发表在NC上的文章)。 我们将详细讨论这项工作,以展示如何从生态学角度对占有率进行计算。因为我们对微生物群结构的季节性趋势感兴趣,复制的地块对于确定一致的核心成员至关重要,并且占有率被保守地定义为包括在给定时间点在所有复制地块中检测到的分类群。将核心数据集定义为在任何时间点的占用率为1,这说明了数据集的季节性,然后我们能够观察到哪些成员在整个生长季节和两年内也持续存在。我们发现,许多核心成员具有较高的平均丰度,并且也具有持续的季节性,正是这些核心成员的集体动力学为研究定义了β多样性中的时间模式(Box1)。总而言之,当环境发生变化时,将纵向研究的核心微生物组占用阈值设置为1可能过于保守,但重复的时间序列可以为确定在特定时间和特定季节条件下关键的核心类群的优先级提供支持。
中性模型用于了解确定性装配的核心微生物群
丰度-占有率分布的一般形状预计为“S”,其中最丰富的分类群显示最高的占有率,而罕见的分类群显示最低的占有率(图1)。这是数据的“中性”预期,假设微生物细胞无限扩散,分类群之间没有适应度差异。斯隆和柯蒂斯对这种中性模型进行了详细的讨论,并在废水处理微生物群落丰度占有率分布的理论探索和应用中引起了许多微生物生态学家的注意。
中性模型被用作群落组装的零假设,通常与确定性模型并行测试,以询问哪个模型最适合描述整个群落装配。然而,中性模型可以为确定核心微生物群的优先次序提供一个有趣的扩展,因为它可以区分预期确定性地从预期中性的分类群中选择的分类群(例如,如预期的占有率,给定平均丰度)。超出置信区间的分类群满足确定性期望(图1)。特别是,在中性模型预测之上的分类群,其在数据集中的平均丰度高于预期,而在预测之下的分类群,其丰度高于预期。对于植物微生物组,我们可以解释这一点,形成一个假设,在前一种情况下,植物环境为这些分类群选择,在后一种情况下,这些分类群是分散限制的。平行解释以前曾应用于斑马肠道、人类肺和皮肤的发育,以及更广泛的宿主和环境。在根据丰度和占有率选择的核心类群中,那些在模型拟合(由植物环境选择)之上确定选择的类群可以被给予更高的优先级,以获得稳健的定殖效率和与植物发生相互作用的潜力。因此,我们建议探索核心类群的聚集机制,以收集对其分布的更深入的生态学见解,并指导功能性的后续研究。
Box2继续分析标记基因以确定核心优先顺序的案例
高通量测序是一种基于系统发育信息标记基因(如16s rRNA、ITS或18s rRNA基因)评估培养无关微生物群落结构的标准方法。由于多路复用和高产序列输出,标记基因测序研究的设计复杂度和用于比较的样本数量都在增加。微生物组的比较是在前所未有的时空尺度上进行的,包括数百到数千种基因型与全基因组相关研究。为此目的,标记基因数据集,特别是16s rRNA基因扩增数据集,在对各种植物物种、基因型、土壤、条件和生态系统的包容性方面,仍然是数量最多、范围最广的。虽然这些不能直接与微生物在原位的功能性联系起来,但有证据表明特定的微生物特征在系统发育上是非常保守的。不管怎样,标记基因研究仍然是大规模分析和荟萃分析的最有用的方法。综合不同研究的数据集的元分析为获得植物微生物多样性的原因和后果的宏观生态学见解提供了一个关键策略。
最近的研究表明,有一套功能基因通常被植物微生物所隐藏,对植物微生物的相互作用很重要。因此,我们建议使用来自标记基因研究的丰度-占有率分布来优先考虑可能具有功能重要性的成员。一个优点是,标记基因研究通常提供了对丰度较低(罕见)的分类群的更深入观察,而不是对可被变基因组覆盖的分类群的更深入观察,从而为识别持久但丰度不高的核心分类群提供了一个窗口。
在使用标记基因研究来确定核心的优先顺序之后,重要的是后续的研究来确认它们的功能。这些实验包括分离和构建合成的“核心”群落,以及指导植物微生物实验,以量化在有无胁迫条件下对宿主的所有益处。在一致定义的核心成员集合上的比较基因组学将提供对其共同功能基因和相互作用机制的洞察。综上所述,标记基因分析仍然是询问核心植物微生物群的第一步。
考虑与限制性
我们重点研究了丰度-占有率分布在从标记基因扩增数据集(如16srRNA基因或ITS区域)检测核心微生物组中的应用。这种关注的动机是因为标记基因在大规模和跨系统分析中的持续应用,以告知核心植物微生物群的普遍性(Box2)。然而,在使用这种方法时需要考虑的是在没有功能数据的情况下,对给定的核心纳入标准进行知情解释。例如,位于核心包含物丰度占用阈值之外的分类群后来可能被证明在功能上很重要。研究人员对包含丰度或占有率最高的核心类群最有信心,这仅仅是因为有更多的强大的模式中明显的类群被更频繁观察到。对系统有条件贡献的分类群可能不符合基于其丰度的“核心”的包含标准,但我们建议使用补充方法来识别这些响应分类群,特别是在纵向研究或应激/受迫后。
此外,高占有率的分类群可能是采样或处理过程中引入的污染物。适当的控制,特别是对低生物量的样品,如叶内生植物、花和种子,需要区分核心类群和污染物。另外高占有率的核心类群应与空白土壤中的类群进行比较。预计空白土壤是植物微生物多样性的储库,因此在空白土壤中检测潜在的核心植物类群并不会使其对植物的潜在重要性失效。区分土壤和植物环境中高占有率类群相对丰度差异的统计分析可以更深入地了解它们对植物的特异性。判别分析、指示分类单元分析和许多其他统计方法可用于评估空白土壤和植物之间的分类单元丰度差异。
操作分类单元的定义方式最终将影响核心的大小。以100%的序列同一性而不是97%的序列同一性来定义分类群的流行程度有所上升。为了简单起见,我们将这些称为零半径OTUs(zOTUs),但也有其他术语应用于这些簇(扩增子序列变体,精确序列变体)。一方面,使用zOTUs可能会减少在完全占有1时观察到的分类群数量,但另一方面,它也可能允许核心内的冗余分类群因测序错误而出现;,这些zOTUs将以97%的同源性序列聚集在一起。在不影响原始测序数据的严格质量控制的情况下,我们建议对第一个聚类使用较低的识别阈值(例如97%的序列识别),并对丰度占有率分布进行初步探索。然后,那些被发现对β多样性有实质贡献的核心分类群可以被子集,并以100%重新聚类,以确定每个核心分类群的潜在应变水平变化及其分布。这种方法的好处是,来自相同的97%OTU的zOTUs可以作为一个生态类型一起折叠,并表现出相同的动力学。这并不意味着折叠的zOTU是相同的,也不确定一个zOTU是亲本zOTU的测序错误,但这确实意味着这些分类群与植物有着冗余的生态模式。折叠它们可以减少数据集中的冗余,并支持关注生态核心成员。由于已经证明,使用以97%序列同一性定义的zOTUs或OTUs通常在比较多样性中揭示相同的总体模式,因此预计任一分类定义都将充分地连接可优先用于功能研究的核心子集。
另外,我们注意到一些研究没有将核心微生物组的分析作为统计方法描述的一部分,经常在结果部分提到包含标准几乎作为一个旁白。应用丰度占有率分布来发现一个核心,强调需要仔细的统计考虑和透明的底层数据结构纳入标准,并可能导致改进监督和方法的严格性。使代码和统计工作流程可用于准确定义核心(Box1),并将这些细节包含在手稿的统计方法部分,将提高研究的可重复性,并支持对核心微生物组的一般理解。
结论
利用宏观生态学中的丰度-占有率分布,可以从扩增子序列数据集中发现核心微生物群的成员,并对其进行排序。这些分布可以类似地应用于空间和时间研究设计,然后与中性模型相结合,以改进关于核心微生物群组装驱动因素的假设,解释为核心分类群选择的机制,并为核心的讨论和解释提供信息。丰度占有率分布允许研究人员根据其潜在生态发现核心微生物群的成员并对其进行优先排序。它们可以为理解核电站核心的功能重要性提供系统的第一步。更广泛地说,这个宏观生态学的框架可以提供预测和理解核心微生物的策略。
总结
丰度-占有率分布可对于核心微生物作用有更好的探索,在时间空间上优先考虑核心微生物群丰度-占有率分布可能对我们以前忽略的类群有新的认识。这一套方法在用于更精细的微生态实验有可参考的方面。现阶段对于群落装配过程中确定性与随机性过程的探讨越来越多,本文在核心微生物类群联用中性理论模型对于核心微生物类群的装配过程会有新的探索。另外,在涉及时间系列实验中,由于环境的异质性对于微生物群落的分析增加了许多不确定性,利用一些手段剔除宿主自身生长带来的变化以及根据自己实验要求设计非破坏性采样装置方法是一个解决途径。(总结仅仅是个人一些看法,慎点)
扫码关注我们
微信号 : lida179438448
点击阅读原文可下载原文