16s分析之Qiime数据整理+基础多样性分析
还记得昨天最后一条命令吗?
single_rarefaction.py -i otus/otu_table_mc2_w_tax.biom -ootu_table_even6073.biom -d 6073
我们经过抽平后的结果otu_table_even6073.biom;基于这个结果,今天继续往后分析:
#抽平结果转化为txt文件格式:
biom convert -i otu_table_even6073.biom -o otu_table_even6073.txt--to-tsv --header-key taxonomy --table-type='OTU table'
进过这条命令转化为txt文件格式前两行以“#”,当我们转入R语言分析的时候,R是不会读取#开头的行,我们在这里去除第一行,并将第二行#符号去掉;
#计算样本中多样性,多选几个指标跑一下,运行速度很快:
alpha_diversity.py -i otu_table_even6073.biom -o alpha.txt -m ace,shannon,chao1,goods_coverage,simpson,observed_species
这里如果不明白怎么使用命令,也可以使用-h命令
alpha_diversity.py –h
这里-m选项很重要,计算alpha多样性的指标,我标记了几种我经常使用的:
'ace','berger_parker_d','brillouin_d','chao1','chao1_ci','dominance','doubles','enspie','equitability','esty_ci','fisher_alpha','gini_index','goods_coverage','heip_e','kempton_taylor_q','margalef','mcintosh_d','mcintosh_e','menhinick','michaelis_menten_fit','observed_otus','observed_species','osd','simpson_reciprocal','robbins','shannon','simpson','simpson_e','singles','strong','PD_whole_tree'
这里需要注意的是,有些指标是不需要进化树文件的,但是比如'PD_whole_tree'这个指标是需要进化树文件的,加个进化树文件就好
alpha_diversity.py -i otu_table_even6073.biom -o alpha.txt -totus/rep_set.tre -m PD_whole_tree
beta多样性分析
#对biom文件进行标准化
normalize_table.py -i otu_table_even6073.biom -o _otu_table_even6073_nm.biom
-a:这个参数可以指定标准化方法CSS是默认的方法,其次还有DESeq2
详细信息参考:http://qiime.org/scripts/normalize_table.html
beta_diversity.py -i _otu_table_even6073_nm.biom -o ./Beta -totus/rep_set.tre -m bray_curtis,weighted_unifrac,unweighted_unifrac
基于三个指标这里生成三个距离矩阵
接下来为大家介绍这个命令:
这条命令做多样性分析不需要抽平,并可以直接在Qiime中出图,本来Qiime可视化就做的比较好,没有理由我不去了解它:
#计算alpha多样性
alpha_rarefaction.py -i otus/otu_table_mc2_w_tax.biom -o alpha/ -t otus/rep_set.tre-m map.txt -e 6073
结果展示:
默认计算了三种指标
还有稀释曲线:
计算beta多样性
beta_diversity_through_plots.py -i otus/otu_table_mc2_w_tax.biom -obdiv1/ -t otus/rep_set.tre -m map.txt -e 6073
#下面这条命令会多次抽平,也就是说可以在图中做出置信域,个人认为这条命令做出来的会更真实一些
jackknifed_beta_diversity.py -i otus/otu_table_mc2_w_tax.biom -obdiv -e 6073 -m map.txt -t otus/rep_set.tre
就这条命令跑出来结果做一个展示:
这里展示pcoa结果,主要看一下这个置信域:
其他还有很多就不一一展示了,到最后,我们当然不会使用这些图片,还是我默认的套路Qiime分析,R出图;
接下来我们就可以直接使用R语言进行出图了,祝大家顺利