凌波微课|扩增子研究第十四讲:扩增子测序结果中的环境因子关联
The following article is from 凌波微课 Author Bonnie
把时间交给阅读
扩增子测序结果中的环境因子关联
对于一些实验室体系的研究来说,主要目的是探索特定的功能微生物或特定处理过程对微生物群落的影响。而对于现实环境的研究更多的希望了解微生物群落变化的影响因素是什么?什么因素调控了微生物群落?这一问题通常是通过微生物群落的数据与相关的环境因子进行关联来回答。
值得注意的是,环境因子关联中的环境因子可以是任何类型的数据,不要局限于我们常见的环境指标,比如同一环境样本中其它类型物种的组成结构,像水环境中的浮游动植物等,还有在动物共生微生物研究中,宿主动物相关基因的表达水平、代谢组学得到的代谢物组成数据等等,都是可以用来做关联分析。
我们知道大部分的统计学分析算法都是基于正态分布的数据进行的,因此当数据出现不符合正态分布情况的时候就会出现比较奇怪的结果。在进行环境因子关联分析之前,根据数据的实际情况,可能需要对其进行标准化和正态化的处理。
正态化(Normalizing):对于偏离了正态分布的数据,可以通过一些转换对其进行校准,例如Helinger transformation或者Chord transformation。处理之后的数据会有效的提高关联分析的可靠性。
VIF分析 BioEnv分析
BioEnv分析是计算不同环境因子组合与微生物群落之间的相关性,最后通过correlation的结果选出对微生物群落影响最大的环境因子组合。
CCA/RDA分析
筛选完环境因子之后,我们就可以来进行环境因子与微生物群落之间的关联分析,最常使用的方法就是CCA和RDA,这两个方法其实是一个东西,只不过其所使用的模型不同,RDA是基于线性模型,而CCA是基于单峰模型。
有时我们使用CCA或RDA进行分析得到的结果可能并不理想,这可能是由于部分数据类型并不适合CCA或RDA的算法,此时可以尝试使用db-RDA,有可能会得到理想的结果。
多元回归树(MRT),是通过分析细菌相对丰度与环境因子的关系,能够给出样本根据环境因子进行区分的阈值,可以用来判断所研究的环境中,目标环境因子在什么范围以内对微生物群落影响较小,有点类似于污染物的环境标准。
上述介绍的这些分析结果给出了环境因子与微生物群落的关系,但是在一些研究项目中,尤其是环境因子能够被分为2类或者3类的情况下,打个比方,比如在一个研究市政和重金属的复合污染对微生物群落影响的项目中,我们分别测定了常规的市政污染指标,比如氨氮、COD等等,同时测定了样本中各种重金属的含量,此时我们很自然的就想要知道到底是哪一种污染对微生物群落的影响更强呢?
不过由于这一结果要求对环境因子有明确的分类,因此在真正的研究中使用的频率还不是很高,反而是在关于抗生素抗性基因的研究中经常使用,用来确定环境因子、可移动基因单元以及细菌群落对于抗生素抗性组变化的贡献程度,这幅图也是来自于一个抗生素抗性基因的研究。
以上讲的几个分析结果都是用来分析环境因子与微生物群落整体结构的关系,如果想要知道具体哪些物种丰度的变化与环境因子有关,就需要用到相关性分析。
最常见的结果展示方式就是相关性热图,在图中使用色块的颜色表示物种与环境因子的相关系数,如果相关性检验的p值小于0.05,则在色块中标注星号表示物种与环境因子显著相关。
与差异检验的统计学方法一样,相关性分析首先要求有两个变量,比如物种丰度和环境因子,而且这两个变量是要成对的,两个变量的数据要一一对应,并且两个变量都是连续变量,最后要求两个变量的标准差不为零,也就是说两个变量中不能出现一个变量所有的数值都是相等的情况。
常用的p值检验方法有Bonferroni和FDR,FDR也就是常说的Q-value,Bonferroni更为严格,得到的结果可能更少,有时候校准之后可能一个相关的都没有了,各位根据自己数据的实际的结果进行选择就好,两种校准方法都是被认可的。
样本间的beta多样性距离就是样本间微生物群落的差异,而环境因子的差异就是样本间环境因子的差异,评估这两个差异之间的相关性有时要比直接分析物种丰度与环境因子的真实值更加有效。
相关性分析能够告诉我们物种丰度与环境因子有相关性,但是没法告诉我们是物种丰度先变还是环境因子先变,这一点在环境的研究中可能关注的比较少,但是在其它的研究中,比如疾病相关肠道菌群的研究中还是很重要的,需要判断是因为肠道菌群变化导致了疾病还是因为疾病导致了肠道菌群发生变化?
回归的概念很大,这里只是简单的介绍一下最基础的线性回归,在实际的应用中,大家可以根据自身的目的合理选择。
往期精彩
END
扩展阅读
高通量测序基础知识 微生物群落数据分析教程 抗生素抗性基因相关 宏组学研究之“道” 转录组测序技术和结果解读 红皇后学术文献解读列表 基本分子生物学实验 PAST:最简便易用的统计学分析软件教程目录 每天学习一点R系列 微生物研究相关工具 微生物研究投稿期刊简介