凌波微课|扩增子研究第十二讲:扩增子测序中的beta多样性分析
The following article is from 凌波微课 Author Bonnie
同学们,大家好!学生信,做分析,就上凌波微课!欢迎大家扫描下方的二维码关注“凌波微课”,加入凌波微课交流群,参与我们的课程和课下交流。
把时间交给阅读
扩增子测序结果中的beta多样性分析
上一讲我们讲解了alpha多样性相关的分析内容,alpha多样性主要在一维水平分析微生物群落,有一维水平就有二维水平,在二维水平比较微生物群落的差异所使用的就是beta多样性。这一节我们来了解一下beta多样性分析的内容。
Beta多样性分析
Beta多样性是通过计算微生物群落整体的距离来评估不同样本微生物群落的差异程度。
基于beta多样性的统计分析
用来评估物种群落距离的beta多样性指数有很多种,目前,在微生物群落研究中最常用的是Bray-Crutis距离和Unifrac距离。值得注意的是,单独的样本没有beta多样性距离的概念,beta多样性指数是指两个微生物群落间的差异程度。
Unifrac距离分为加权和不加权两种,Unweighted Unifrac在计算时只考虑物种在样本中是否存在,Weighted Unifrac在计算时同时考虑物种的存在及其丰度,类似于alpha多样性指数中的丰富度和多样性的区别。直观来讲,就是计算了仅被一个群落占据的进化历史的相对大小,这个量越大,说明两个群落中独立的进化过程越多,也就说明这两个群落的差别越大。当unifrac值为0,说明两个群落完全相同,没有各自独立的进化过程;当UniFrac值为1时,说明两个群落在进化树中完全分开,是完全独立的两个进化过程。
组内组间距离箱线图
根据样本的距离规律,我们可以大体评估研究过程中是什么因素影响了微生物群落。比如说不同样本正好按照季节聚类或者实验组和对照组分别聚类,那么可以基本判断一下实验因素是否对微生物群落有影响,但是并不推荐在文章中使用,因为有更好的展示方式,稍后会讲到。
但如果出现个别样品与其它生物学重复差距非常的大,就要考虑是不是这个样本有可能被污染了。
接下来让我们来看看基于beta多样性距离的一系列统计分析结果。首先来说说PCA和PCoA,PCA是主成分分析,PCoA是主坐标分析,这两种分析都是通过方差分析对多维数据进行降维,最后在二维坐标系中展示样本微生物群落差异的方法。
通常结果图中的每一个点代表一个样本,不同的颜色代表样本的分组,点与点间的距离代表样本微生物群落的差异程度,距离越大,样本间微生物群落差异越大。
对于结果的解释其实也比较简单,如果不同组的样本在图中分别处于不同的位置,比如说A、B两组分别位于横坐标轴的两端,那么我们就可以说某某因素会影响样品微生物群落的组成结构,不同组样本分别聚在一起,并且被PC1轴分开,PC1解释了整体微生物群落变化的百分之多少,等等诸如此类的话,当然在文章中最好还要同时结合组间微生物群落的差异检验结果。
常用的微生物群落整体结构差异检验方法主要有ANOSIM和Adonis,这两种统计学方法都是用来检验不同组样本的微生物群落整体结构是否具有显著差异。
ANOSIM:一种非参数检验,用来检验组间的差异是否显著大于组内差异,从而判断分组是否有意义。侧重于比较组间差异与组内差异的区别,如果结果的p值小于0.05,则表明组间差异大于组内差异。
一般在写文章的时候给出其中一个检验的结果即可,使用最多的是Adonis。
NMDS分析
除了刚刚介绍的这两种基于降维的整体微生物群落比较方法之外,通常的结果中还有一种基于群落距离进行聚类的方法,就是UPGMA,是利用距离聚类树的方式展示不同样本间微生物群落的差异情况,可以直观显示不同环境样本中微生物进化上的相似性及差异性,同属于一条分枝的样本微生物群落更为相似。
UPGMA聚类分析
样品的聚类结果主要使用AU和BP两种方法评估可靠性,其中AU更接近无偏向性的。一般认为当结果大于95时,说明样本的聚类十分可靠。
有时候也会出现所有分析方法结果都不太好,聚类混乱的情况出现,这时候可以使用一些非常规的方法来尝试解决问题。
首先介绍的是PLS-DA,这种方法在代谢组研究中适用的非常多,但是微生物群落研究中还并不是特别的认可,PLS-DA是一种与PCA相对应的有监督的分析方法,使用这种方法会使得原本并不明显的组间差距变得非常明显。
带统计的PCoA
比如这幅图中,上方的箱须图是不同组样本根据样本所处地点不同进行分组,不同组样本在PC1轴上的分布统计。
通过结合这些统计的结果,就可以看出不同分类的样本还是具有比较明显的区分的,同时还能够评估造成这些差异的主要微生物是什么。
补充知识说明
本节的最后再来介绍另外一种结果不好时的变通处理方式,当PCA或PCoA对样本的分组展示不明显的时候,可以将样品对应的PC1或PC2值提出来分别进行组间差异检验,以评估PC1和PC2轴对样本分组的区分能力。
样本比较分析
同时在图中应用箭头的方式展示主要物种对群落差异的贡献,类似于CCA/RDA的方式,这个在后面环境因子的章节会详细讲解。
今天的分享就介绍到这里~感谢来自“红皇后学术”的内容分享。玩转科研就来凌波微课,我们下期见!
往期精彩
凌波微课|扩增子研究第10讲:扩增子测序中的物种组成分析
凌波微课|扩增子研究第9讲:扩增子测序结果中的基本信息统计
凌波微课|扩增子研究第8讲:微生物多样性物种分类注释凌波微课|扩增子研究第7讲:高通量下机数据质控标准凌波微课|扩增子研究第6讲:高通量下机数据评估标准凌波微课|扩增子研究第5讲:微生物群落研究建库测序流程凌波微课|扩增子研究第4讲:微生物群落研究策略凌波微课|扩增子研究第3讲:微生物群落研究的目的凌波微课|扩增子研究第2讲:测序技术发展史及应用凌波微课|扩增子研究第1讲:分子钟学说和现代应用凌波微课|微生态群落中单个物种的绝对定量凌波微课|藻类与陆生植物起源凌波微课|读播:如何回复审稿意见凌波微课|如何消除数据的批次效应?选对工具很重要凌波微课|生物学重复,你有必要知道的那些事儿!凌波微课|生物学重复,值得你拥有!凌波微课|微生物组多样性研究新热门——16s rDNA全长扩增子测序
END
扩展阅读
高通量测序基础知识 微生物群落数据分析教程 抗生素抗性基因相关 宏组学研究之“道” 转录组测序技术和结果解读 红皇后学术文献解读列表 基本分子生物学实验 PAST:最简便易用的统计学分析软件教程目录 每天学习一点R系列 微生物研究相关工具 微生物研究投稿期刊简介