查看原文
其他

微生物多样性组间差异分析神器-STAMP

2017-09-18 舟行天下 宏基因组

点击上方蓝色「宏基因组」关注我们!

软件简介

在微生态研究中,当我们做完多样性测序后,想找出不同处理组之间差异物种或差异基因,一般常用的组间差异分析metastats(只能用于两组之间的差异比较)、LEfSe以及STAMP等。

今天给大家介绍STAMP的安装及使用:

该软件2014年发表于Bioinformatics,目前已被引用313次。该软件非常强大,不仅能够对两组甚至多组样本在任何分类水平的物种等进行显著性差异分析,而且该软件的操作简单易学。

1. 准备输入文件

在应用之前,首先要整理STAMP文件,格式如下图。如果关心的是不同分类单元差异物种,那么前面几列是物种的分类单元等级,如果有4个等级(例如目,科,属,种),那么前面就有4列(Hierachical level列)。接着后面就是每个样品的OTU数目信息

文件格式的整理是个关键步骤。STAMP有两种输入文件方式:

 

1.自己整理的STAMP格式文件;并且另存为.spf 格式

2.转换MothurPicrust等软件生成的其他格式文件为STAMP格式文件。

 

下面将介绍第一种自己整理的STAMP格式文件的方法:

OTU丰度文件,每列之间用tab键隔开的.spf文件(可在excel表格内编辑,然后保存为spf格式文件,需要注意的是该文件一定要包含表头)

 由于在同一个表格中选择不同level 的功能经常出现Bug,所以我们推荐读者把不同的分类单元分别保存成*.spf文件。

如图所示我们按目,科,属,种不同的分类等级分别保存成.spf的文件,然后在分析的时候各自单独运行。


接着我们还需要准备一个分组信息meta文件(格式同丰度表格式,该文件也需要加入表头,否则会默认第一行为表头,导致样本缺失。)如下图:


准备好以上文件之后我们就可以开始了

2. 文件导入

打开软件后,点击左上角的“file”-“load data”,输入文件即可。(方法File-load data,选择文件导入,注意文件存放的路径中不能包含中文字符)

3. 数据比较与作图

文件导入成功后,就可以设置参数,绘制想要的图了。具体的参数设置见下图:

该软件默认打开界面Multiple groups(多组比较),根据实际需要的比较方案进行选择,比如想进行两组之间的比较,首先点击Two groups,然后选择需要比较两组的组名以及统计方法和过滤条件,即可进行显著性差异统计分析。


一般常用的多组分析统计学方法包括ANOVAKruskal-Wallis H-test。两组之间比较统计学方法包括t-test(equalvariance)Welch’s t-testWhite’snon-parametric t-test。为了确保统计学意义和结果的准确度,需要选择合适的检验方法。t-test检验可以在最少样本数为4的时候保持较高的准确度和精确度,而且当两个分组之间具有相同的方差时,用t-test也更为准确。

当方差不同时,Welch’s t-test更为准确。White’s non-parametrict-test算法计算时间较长,当样本数目少于8的时候,可以使用该检验方法,当样本数目过多时,不宜使用该检验方法。

4. 作图类型及导出


结果示例:

注意事项

1.     结果文件存放路径中不能存在中文字符,否则在数据无法导入到软件。

2.     当输入的丰度表文件和分组文件样本不一致时,remain Unclassiffied readsuse only forcalculating frequency profiles方法会保留所有的数据,而remove Unclassiffied reads仅仅保留有确定分组信息的数据。注意的是,分组文件的样本一定在丰度表文件中存在,否则会报错,反之,是可以的。

3.目前版本的STAMP存在一些小的bug,一次分析只能使用一个数据文件,如果要打开新的数据文件,需要关闭软件后重新打开。如果分析完成,一定要记得保存(可以存为PDF格式或图片格式),不然需要再重新分析一次。


测试数据下载链接:http://pan.baidu.com/s/1hrHRhAG,提取码:v64x


更多相关文章阅读,请点击《你想要的宏基因组知识全在这

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存