查看原文
其他

凌波微课|扩增子研究第三讲:微生物群落研究的目的

Young 凌波微课 2023-08-18

学生信,做分析,就上凌波微课

微生物群落研究的目的

视频文字版
同学们,大家好!学生信,做分析,就上凌波微课!欢迎大家扫描视频上的二维码关注“凌波微课”,加入凌波微课交流群,参与我们的课程和课下交流。
我是主讲人Young,今天我们给大家分享的内容来自公众号“红皇后学术”,主题是:微生物群落研究的目的。通过之前的介绍,相信大家对于微生物群落研究技术的背景已经有所了解了,本节内容将告诉大家微生物群落研究能干什么?
本期内容主要有三个方面,首先,我们来看一下微生物群落研究内容有哪些;第二,如何进行微生物群落功能研究;第三,微生物群落研究方法。

PART 1  微生物群落研究内容

1991年Pace首次提出环境基因组学的概念,基于核糖体rRNA基因的扩增子测序来反映系统中的微生物多样性的组成(16S、18S、ITS、功能基因等)。常见 Marker gene包括细菌16S rRNA,真菌ITS和18S,功能基因包括AOA、AOB、nirK、nifH、McrA等。

首先,我们来看基于16S rRNA扩增子测序的微生物群落研究能够得到那些结果。最基本的结果就是通过对微生物群落样品的测序和分类学注释,我们能够得到微生物群落中物种的组成结构,群落中存在哪些物种,这些物种的丰度分别是多少。基于此,我们可以通过对不同微生物群落组成结构的比较,获得不同微生物群落的差异信息,整体微生物群落组成是否具有差异?哪些微生物的丰度存在差异?微生物群落组成结构的变化规律是个什么样子?包括Alpha多样性、Beta多样性、物种组成分析、差异分析、相关性分析以及16s功能预测。

图1 微生物群落研究内容



Alpha多样性



群落生态学中研究微生物多样性,通过单样本的多样性分析(Alpha多样性)可以反映微生物群落的丰度和多样性,包括一系列统计学分析指数估计环境群落的物种丰度和多样性。生物多样性可以用很多种方式定量,其中两个主要的因素是丰富度(richness)和均匀度(evenness)。Richness:丰富度即每个样本的物种数,样本中物种越多,样本越“丰富”。Evenness:均匀度即不同物种的相对丰度(abundance),它与丰富度互相补充,相辅相成。

Shannon-Wiener 是反映样本中微生物多样性的指数,利用各样本的测序量在不同测序深度时的微生物多样性指数构建曲线,以此反映各样本在不同测序数量时的微生物多样性。当曲线趋向平坦时,说明测序数据量足够大,可以反映样本中绝大多数的微生物信息。

图2 Shannon Wiener 曲线图

Rank-abundance 曲线是分析多样性的一种方式。构建方法是统计单一样本中,每一个OTU所含的序列数,将OTUs按丰度(所含有的序列条数)由大到小等级排序,再以OTU等级为横坐标,以每个OTU中所含的序列数(也可用OTU中序列数的相对百分含量)为纵坐标做图。Rank-abundance曲线可用来解释多样性的两个方面,即物种丰富度和物种均匀度。在水平方向,物种的丰度由曲线的宽度来反映,物种的丰度越高,曲线在横轴上的范围越大;曲线的形状(平滑程度)反映了样本中物种的均度,曲线越平缓,物种分布越均匀。

图3 Shannon Wiener 曲线图

物种累积曲线( species accumulation curves)是用于描述随着样本量的加大物种增加的状况,是调查样本的物种组成和预测样本中物种丰度的有效工具,在生物多样性和群落调查中,被广泛用于样本量是否充分的判断以及物种丰富度( species richness) 的估计。

图4 物种累积曲线


物种组成分析



根据分类学分析结果,可以得知不同分组(或样本)在各分类水平(如域、界、门、纲、目、科、属、种、OTU等)上的物种组成情况。

Venn图可用于统计多组或多个样本中所共有和独有的物种(如OTU)数目,可以比较直观的表现环境样本的物种(如OTU)组成相似性及重叠情况。

根据群落组分柱状图图,可以直观呈现两方面信息:第一,各样本在某一分类学水平上含有哪些优势物种;第二,样本中各优势物种的相对丰度(所占比重)。

聚类图:左边是样本间基于群落组成的层次聚类分析(bray-curtis算法),右边是样本的群落结构柱状图

Heatmap图是以颜色梯度来表征二维矩阵或表格中的数据大小,并呈现群落物种组成及物种的丰度信息。通常根据物种或样本间丰度的相似性进行聚类,并将结果呈现在群落heatmap图上,可使高丰度和低丰度的物种分块聚集,通过颜色变化来反映不同分组(或样本)在各分类学水平上群落组成的相似性和差异性。

群落中差异的检验主要包括ANOSIM检验、Adonis检验等。

图5 物种组成分析内容


Beta多样性



Alpha多样性分析为样品内的多样性,而beta多样性用于不同生态系统之间多样性的比较,也就是样品间的差异;Beta多样性分析是利用各样本序列间的进化关系及丰度信息来计算样本间距离,反映样本(组)间是否具有显著的微生物群落差异。

Beta多样性计算中主要基于OTU的群落比较方法,有欧式距离、bray curtis距离、Jaccard 距离,这些方法优势在于算法简单,考虑物种丰度(有无)和均度(相对丰度),但其没有考虑OTUs之间的进化关系,认为OTU之间不存在进化上的联系,每个OTU间的关系平等。另一种算法Unifrac距离法,是根据系统发生树进行比较,会根据16s的序列信息对OTU进行进化树分类,因此不同OTU之间的距离实际上有“远近”之分。

在群落的Beta多样性分析中,通常涉及到非约束排序(如PCA、PCoA等)、层次聚类(如UPGMA等)等具体的分析。无论哪种形式的Beta多样性分析,均以群落相似(或相异)程度为基础。

图6 Beta多样性分析内容


差异分析



组间显著性差异检验根据得到的群落丰度数据,运用严格的统计学方法,对不同组(或样本)微生物群落之间的物种进行假设检验,评估物种丰度差异的显著性水平,获得组(或样本)间显著性差异物种。该分析可选择门、纲、目、科、属、种、OTU等不同分类水平。

常见的有LEfSe差异分析、STAMP差异分析,ANOVA方差分析以及Kruskal wallis秩和检验分析等。

图7 差异分析内容


环境因子相关性分析



如果实验设计中还收集了其它环境因子数据,那么就可以通过关联分析评估环境因子与微生物群落的关系,例如CCA、RDA以及微生物与环境因子相关性分析,探究微生物群落结构变化是由哪些环境因子驱动的。

图8 环境因子相关性分析内容

PART 2  微生物群落功能预测

目前,有众多科研人员开发出了多种基于16S rRNA扩增子测序数据的微生物功能预测工具,可以预测微生物群落的功能进而比较其差异。Picrust 16S rRNA功能预测(Greengenes数据库注释),目前可以根据16S测序数据进行基于KEGG和eggNOG数据库的功能预测。Tax4Fun功能预测,支持SILVA注释结果,Tax4Fun只能做KEGG的预测。

图9 微生物群落功能预测分析

需要注意的是,因为这里的功能是预测的结果,并不是真实测定的,不同的研究人员对这一结果的认可程度并不一致,比如有的审稿人会觉得这一结果与微生物的丰度变化结果没有任何区别,不能作为进一步解释研究结果的证据,有的甚至会认为这一结果没有任何的可信度要求删掉,这取决于研究的领域(比如野生动物方向和养殖动物方向要求完全不同)。

总之,通过对微生物群落多样性研究,我们能得到微生物群落中存在哪些物种,这些物种丰度和组成结构如何,例如土壤环境中变形菌门、拟杆菌门、酸杆菌门含量丰富。其次,哪些特定功能微生物值得关注或具有产业利用价值,例如固氮菌、氧化还原菌群等;第三,环境条件变化为微生物群落组成结构的影响,例如一些极端环境,嗜酸、嗜高温,盐碱胁迫等;第四,不同微生物群落组成结构的差异影响环境功能差异;第五,微生物群落的功能预测,例如碳循环、氮循环、硫循环等。

得到这些微生物群落研究结果后,能解决哪些问题呢?首先,得到生境中全部微生物的组成,特定微生物群落组成谱,例如硝化、固氮等功能菌群;其次,对特定功能微生物群落进行分析和研究,挖掘微生物与环境等关联;第三,微生物群落时间动力学变化规律研究;第四,微生物和宿主的相互作用与疾病和代谢的关系;第五,人类活动或自然生态过程对微生物群落组成结构的影响。


PART 3  微生物群落研究方法

免于培养的微生物学研究方法主要基于测序,高通量测序使我们一次可以获得整个微生物群体的数据信息,简单来说包括两种策略:
1、基于特定标记基因的扩增测序方案(常见的16S,ITS,18S或特定功能基因)
2、对整个群落DNA进行测序,获取全部微生物基因组进而进行分类和功能分析的策略(鸟枪法宏基因组测序shotgun metagenomics)。

基于16s基因的分析方法:

但是,由于16S扩增子其极低的成本以及对于样本DNA的低要求,非常适合于大规模群体样本的调查和分析,随着DADA2等分析方法的改进,物种分类精度和准确度也有所提升,加上PICRUST等功能预测方法一定程度上弥补了基因信息的缺失,因此16s这类基于基因的微生物研究方法仍然是不可或缺的方案。

如果真的需要功能水平的结果,最好直接进行宏基因组研究。如果将16S功能预测的结果放入文章中,那么建议不要根据该结果做出任何实质性的结论,也不要把该结果最为物种丰度变化的佐证加以讨论。

图10 16S扩增子和宏基因组分析

宏基因组的概念是指生态环境中全部微小生物的基因组。与扩增子相比,宏基因组能够得到更多物种基因组信息,能够进行基因预测、基因功能注释、代谢通路分析、功能分析等,很大程度上弥补了扩增子分析的不足,增加了环境微生物关联分析的深度。因此,多组学联合分析,例如多样性+宏基因组,多样性+宏基因组+宏转录组,已经成为文章发表的主流。

图11 物种分类和功能

今天的分享就介绍到这里~ 感谢来自“红皇后学术”的内容分享。下一期我们将聊一下微生物多样性研究的策略,包括测序区域的选择、测序过程中的常见问题。玩转科研就来凌波微课,我们下期见!




往期精彩凌波微课|测序技术发展史及应用

凌波微课|分子钟学说和现代应用

凌波微课|微生态群落中单个物种的绝对定量?凌波微课|藻类与陆生植物起源凌波微课|读播:如何回复审稿意见凌波微课|如何消除数据的批次效应?选对工具很重要凌波微课|生物学重复,你有必要知道的那些事儿!凌波微课|生物学重复,值得你拥有!

凌波微课|微生物组多样性研究新热门——16s rDNA全长扩增子测序





END






红皇后学术以微生物群落研究为核心,重点关注扩增子测序和宏基因组测序,同时辐射转录组、蛋白质组合代谢组。

在分析技术上,主要为基于R语言的组学数据统计、分析和可视化解决方案。


凌波微课,创意于2020年不平凡的春天,由高通量测序及组学研究领域从业近十年的技术团队精心打造。

凌波微课的讲师们,实战经验丰富,旨在通过在线微课程及线下交流,帮助科研学生及科研工作者们由简入繁,掌握科研思路及生信分析的实际操作。凌波微课,用心服务科研用户,打造专业培训品牌,助力科研提升。


关注我

发现更多精彩

关注凌波微课公众号,回复“入群”,即可加入凌波微课课下交流群,更多干货等你呦!


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存