PNAS(2016)-尺度定律预测全球微生物多样性
本文是一个纯理论性质的文章,对于利用微生物细胞数估计物种数有重大的意义,发表之后引起了不小的讨论。但是这篇文章不仅语法和用词让我很难受;很多概念也不清楚,另外外文书籍下载不了,导致读起来特别困难,很多地方没有完全理解。
因此这篇介绍也会非常不具体,一些我不懂的地方自动略过了。如果看了之后感兴趣还请自行阅读原文。
另外谁能下载这本书,我不胜感激~
Magurran, Anne E. Editor and McGill, Brian J. Editor, "Biological Diversity: Frontiers in Measurement and Assessment" (2011). Faculty and Staff Monograph Publications. 27.
https://digitalcommons.library.umaine.edu/fac_monographs/27
生态尺度定律(Scaling laws)因其预测能力和普适性而受到广泛研究,但往往不能统一生命领域的生物多样性。
本研究通过对全球范围内微生物和宏观数据的汇总发现了微生物和宏观动植物的共性(commonness)和稀有性(rarity)之间的关系:即他们的数量和丰度之间的比例相似。并提出了一个统一的尺度定律,该定律预测了地球上30个数量级上的优势微生物物种的丰度。
利用这一定律并结合生物多样性的对数正态模型,作者预测地球上有多达1万亿(1012)种微生物。
目前估计一个人的体内定殖着~1014个细菌细胞;地球上~1030细菌和古菌细胞。
这些发现有助于估计全球物种丰富度,并揭示生物多样性理论是否适用于所有物种丰富度的尺度,以及所谓的生物多样性的类律模式(law-like patterns)是否适用于生命树(tree of life)。
生态学和生物多样性理论的一个主要目标是预测在进化距离上较远的分类单元及空间、时间和丰富度尺度上的多样性、共同性和稀有性。
而微生物是地球上数量最多、分布最广;代谢、分类和功能最多样化的生物,必然是研究的重点和热点。
然而对生物多样性理论的检验很少同时包括微生物和宏观数据集;此外微生物生态学的研究还没有揭示宿主微生物群落规模及更大尺度上的多样性、共同性和稀有性的定量关系。
尺度规律为统一认识和预测生物多样性提供了一条有希望的途径。
y∼ xz这种关系被称作幂律规律,将两边都取对数后就变成了线性关系log(y) ∼ zlog(x)。
尺度定律揭示了生理、生态和进化上的约束是如何在基因组、细胞、有机体和大小差异很大的群落之间保持一致的。
最广为人知的规律包括代谢速率(B)随身体大小(M)的变化规律:B = BoM3/4;
以及物种数量(S)随面积(A)的变化规律(种面积关系,TAR):S = cAz。
除了面积和体型之外,生物多样性也受到群落中个体的数量(N)的限制。
在本研究中,作者将考虑N是否可能是对共性和稀有性的最强大的约束之一,以及生物多样性的在各个方面可以扩展的最广泛的变量之一。
目前的经验和理论研究表明,物种数量(S)与个体数量(N)的比例为0.25-0.5 (S ∼ Nz ,0.25≤ z ≤ 0.5) 。且这种关系适用于来自不同系统的样本,但并不适用于基于重采样(resampling)的累积模式。
最近的研究还表明,N通过对物种间的空间和时间之间的丰度变化进行数值限制,从而限制了共性和稀有性的普遍模式。
最值得注意的是,N越大物种分布越不均匀,稀有性越高。因此,作者预计更大的N将对应于更多物种间更不均衡的分布,其中稀有物种的比例会越来越高。然而这些关系的强度;微生物和大型生物之间是否存在差异;以及它们是否符合跨越数量级的尺度定律,实际上还都未知。
如果已知N条件下的多样性,共性及稀有性,那么就可以推导从local-到global-尺度的微生物多样性。如果微生物和宏观生物的规律是类似的,那我们会对生物多样性有更深刻的理解。为了回答这些问题,作者汇编了迄今为止最大的公开可用的微生物和宏观数据集。包括20,376个细菌、古菌和真菌群落的样点及14,862个树木、鸟类和哺乳动物群落的样点。作者关注物种丰富度(S)、物种间丰富度的相似性(均匀性,evenness)、相对低丰度物种间N的浓度(稀有性, rarity)和属于最丰富物种的个体数量(绝对优势种,Nmax)。利用所得的关系来预测大型微生物群落中的Nmax和S,并对地球上微生物种类的数量做出经验和理论支持的估计。
对Dominance, Evenness, Rarity, Richness四个指标的量化
Rarity: 稀有程度量化了物种在低丰度时的浓度。这个概念源于这本书。由于下载不下来其含义不清楚。
Magurran, Anne E. Editor and McGill, Brian J. Editor, "BiologicalDiversity: Frontiers in Measurement and Assessment" (2011). Faculty and Staff Monograph Publications. 27.
https://digitalcommons.library.umaine.edu/fac_monographs/27
Dominance:指最优势物种的丰度,用Nmax表示,概念也源于这本书。另外,相对优势度也是常见的表征手段,可用Berger–Parker index (Nmax/N = DBP)表示。本文主要使用Nmax。
Evenness: 5个指标来表征。Smith and Wilson’sindices (Evar and EQ), Simpson’s evenness (E1/D), Bulla’s index (O), and Camargo’sindex (E′)
Richness:量化了观测到的物种S,并用6个指标对理论物种数进行了估计,包括Chao1, ACE, jackknife, rarefaction, Margelef, McHennick。
估计大型微生物群的Nmax
牛瘤胃:绝对的优势种来自于Provotella属。可占到16S rRNA gene读长的1.5–2.0%。假设牛瘤胃中有1015个细胞,推测Nmax为1.5×1014 - 2×1014
人类肠道:优势种可占到16S rRNA gene读长的0.6 –12.2%。假设肠道中有1014个细胞,推测Nmax为1.06×1013 - 1.22×1013
全球海洋(非沉积物)及陆地:海洋中的Synechococcus 和 Prochlorococcus可能是主要的优势种,估计全球的丰度为7.0 ±0.3×1026 和 2.9 ± 0.1×1027。另外SAR11 clade(如Pelagibacterales)估计可能丰度为2.0×1028。作者使用SAR11作为地球上最优势种的上限。对海洋的Nmax估计为6.7×1026 – 3.0×1027,陆地Nmax估计为2.9×1027-2.0×1028。海洋中的细胞数为3.6×1028 - 1.2×1029,陆地的细胞数为9.2×1029 - 3.2×1030。
大型微生物群和地球的物种数预测
采用Curtis et al.等人提出的方法利用对数正态模型来预测全球微生物的物种数。Curtis et al.等人估计了1g土,1mL水和整个湖中微生物数量,进而估计了1吨土(很多小型生态系统)和整个海洋(很多大型生态系统)的物种数。公式源于这篇文章,看不懂略过。
Curtis TP, Sloan WT, Scannell JW (2002) Estimating prokaryotic diversity and its limits. Proc Natl Acad Sci USA 99(16):10494–10499
在7个数量级上,随着N增加,物种数量,优势种和稀有种都会增加,而物种均匀度会减少(图1)。微生物和大型生物的差别并不大。微生物物种数量的斜率z(0.38),高于大型生物的z(0.24),但是还在0.25 < z < 0.5范围之内。对于给定的N,微生物有着更高的稀有度和物种数,更低的均匀度。
自举法(bootstrap)研究表明,微生物和大型生物在稀有种和均匀度上差异的显著性取决于样本数量,样本量越大差异越显著。在不同的数据集中,微生物z(0.20–0.46)的变化要小于大型生物(0.07–1.23)。所有数据集综合的z = 0.51,和其他研究中观测到的一致。
之前对于全球微生物物种数的估计在104-109,基本都是基于已培养的微生物,且在大规模测序项目之前,并基于统计检验上的外推(如稀释曲线和chao)。
基于图1的关系,推测全球微生物的物种数为2.1 ± 0.14×1011 。
图1微生物和大型生物四个指标的规律
图2 Dominance-abundance scaling law预测全球的优势物种
在估计了全球优势物种数Nmax和细胞数的基础上,两种方法推测全球物种数:
一是利用已发表文章的N和dominance-abundance scaling law预测的Nmax(图中蓝色);
二是利用已发表文章的N和Nmax(图中灰色)。
两者对物种数的预测都在一个数量级之内,一致性较好。
图3 两种方法预测全球物种数
第一种方法的流程:
1.)随机选取一个N;
2.)估计Nmax;
3.)利用Nmax估计S;
4.)回到第一步进行1000次的迭代。
幂律、半对数、指数、线性多种模型进行比较。综合所有指标(R2,AIC, BIC),幂律模型是最优的。
1.本研究使用参考数据库比对(closed-reference)的方法得到OTU,与de novo 得到的OTU可能存在较大的差异;另外PCR的扩增区域及使用的引物都会对结果带来影响。
2.如果只检测到1次和2次的物种数很多,那么对物种数量的估计会比观察到的高很多。因为很多估计物种数量的方法,如rarefaction, jackknife, Chao都受singletons和doubletons的影响。
3. 当只取样了所有个体的极小部分时,很难估计物种缺失的部分。如对数正态模型和丰富度尺度关系估计单个人类肠道的物种数为105-106,然而观测到物种数却经常为103。这是因为样本量相比于整个肠道微生物组太小。Human Microbiome Project (HMP) 中整合4303个样本才得到了2.2×107条reads,对于检测1014个细胞中的105-106个物种是远远不够的。因此样本数量对检测的准确性至关重要。
作者估计地球上存在1011–1012个物种。目前只有∼104个物种被培养,少于105个物种有分类序列。EMP项目收录了不到107个物种,而其中29%只检测到了2次。仍有99.999%的潜在类群没有被发现。
Reference
Locey, K. J. and J. T. Lennon (2016). "Scaling laws predict global microbial diversity." Proceedings of the National Academy of Sciences of the United States of America 113(21): 5970-5975.
一个环境工程专业却做生信分析的深井冰博士,深受拖延症的困扰。想给自己一点压力,争取能够不定期分享学到的生信小技能,亦或看文献过程中的一些笔记与小收获,记录生活中的杂七杂八。
欢迎大家扫描下方二维码关注我的公众号,若有问题也可直接加我的微信:水岸风堤(lii32703)。
欢迎分享,转载请联系我。