查看原文
其他

教程 | 用MetaPhlAn2分析微生物物种丰度

2017-11-22 WPP 宏基因组

本文转载自“锐翌基因”,己获授权。



MetaPhlAn2是分析微生物群落(细菌、古菌、真核生物和病毒)组成的工具,它在宏基因组研究中非常有用,通过分析能获得微生物的物种丰度信息。老规矩,小锐将从安装到使用,教你解锁这款软件。


1

安装MetaPhlAn2软件

1.1

依赖的软件

① Python (version >= 2.7)

② Bowtie2

③ Numpy

④ Pandas (optional, only required by utility scripts)

⑤ BioPython (optional, only required by utility scripts)

⑥ SciPy (optional, only required by utility scripts)

⑦ Matplotlib (optional, only required by utility scripts)

⑧ biom (optional, only required for biom format input/output)

1.2

安装

Step 1:下载 MetaPhlAn2软件并解压

(下载地址:https://bitbucket.org/biobakery/metaphlan2/get/default.zip)

tar xzvf biobakery-metaphlan2-<versioned>.tar.gz

cd biobakery-metaphlan2-<versioned>/


Step 2:添加环境变量

把变量export PATH=$MDIR:$MDIR/UTILS/:$PATH添加到变量文件$HOME/.bashrc中,其中$MDIR是软件MetaPhlAn2的安装路径。


Step 3:安装MetaPhlAn2依赖软件

安装bowtie2软件并添加到环境变量中。


2

运行MetaPhlAn2软件


metaphlan2.py  $SAMPLE  --input_type fasta > $OUTPUT_profile.txt

其中$SAMPLE可以是.fasta、.fastq和.tar.bz2格式的宏基因组序列文件;

运行结果主要输出两个文件bowtie2out.txt 和_profile.txt;

其中_profile.txt是物种丰度的结果。

如果样品较多,可以修改参数进行多线程运行MetaPhlAn2软件

metaphlan2.py  $SAMPLE  --input_type fasta  --nproc 4 > $OUTPUT_profile.txt

其中nproc 4是指线程数为4。


3

物种丰度结果的可视化

3.1

热图可视化丰度结果

热图能有效显示MetaPhlAn2软件输出的物种丰度结果,其中制作热图主要应用hclust2脚本(其下载路径为https://bitbucket.org/nsegata/hclust2/get/tip.zip)。

Step 1: 把所有样品结果的物种丰度合并成一个表格

grep -E "(s__)|(^ID)" merged_abundance_table.txt | grep -v "t__" | sed \'s/^.*s__//g\' > merged_abundance_table_species.txt


Step 2: 生成热图

hclust2.py -i merged_abundance_table_species.txt -o abundance_heatmap_species.png --ftop 25 --f_dist_f braycurtis --s_dist_f braycurtis --cell_aspect_ratio 0.5 -l --flabel_size 6 --slabel_size 6 --max_flabel_len 100 --max_slabel_len 100 --minv 0.1 --dpi 300

其效果图为:


3.2

进化分枝图可视化丰度结果

你也可以在进化树上进行可视化物种丰度结果图,这里主要应用GraPhlAn工具制作,可以用微生物的名字或物种丰度给树枝添加注释。

Step 1:生成GraPhlAn的输入文件

export2graphlan.py --skip_rows 1,2 -i merged_abundance_table.txt --tree merged_abundance.tree.txt --annotation merged_abundance.annot.txt --most_abundant 100 --abundance_threshold 1 --least_biomarkers 10 --annotations 5,6 --external_annotations 7 --min_clade_size 1


Step 2:生成进化分枝图

graphlan_annotate.py --annot merged_abundance.annot.txt merged_abundance.tree.txt merged_abundance.xml

graphlan.py --dpi 300 merged_abundance.xml merged_abundance.png --external_legends

其效果图为:

对于生信分析者来说,分析软件就像是他的第二个大脑。选择一款适合自己的软件,总能达到事半功倍的效果。MetaPhlAn2能否成为你的神助攻呢?要亲自试了才知道哦~感兴趣的小伙伴们,赶紧动起来吧。

供稿 | 温平平    编辑 | 王丽燕

猜你喜欢

写在后面

为鼓励读者交流、快速解决科研困难,我们建立了“宏基因组”专业讨论群,目前己有国内外七十多位PI,七百多名一线科研人员加入。参与讨论,获得专业指导、问题解答,欢迎分享此文至朋友圈,并扫码加主编好友带你入群,务必备注“姓名-单位-研究方向-职务”。技术问题寻求帮助,首先阅读《如何优雅的提问》学习解决问题思路,仍末解决群内讨论,问题不私聊,帮助同行。

学习16S扩增子、宏基因组科研思路和分析实战,关注“宏基因组”

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存