使用FUNGuild进行真菌功能注释
点击上方蓝色「宏基因组」关注我们!
背景
目前在NCBI等数据库中拥有大部分细菌的全基因组序列,这些全基因序列涵盖了这些细菌的功能以及代谢途径等信息。研究者在细菌16S扩增子测序中,通常会使用PICRUST(http://huttenhower.sph.harvard.edu/galaxy/root?tool_id=PICRUSt_normalize)及Tax4Fun(http://tax4fun.gobics.de/)进行细菌功能预测与注释。
由于目前真菌的全基因信息相对较少,而且真菌基因组远比细菌复杂,所以对真菌群落的研究一直没有很好地办法直接把其分类信息注释到功能基因以及代谢途径的信息上去。在2016年Nguyen开发了一个使用在线的和本地的python scrip-FUNGuild (“Fungi”+ “Functional” + “Guild”)来对真菌的扩增子测序拿到的OUT table 进行基本的功能注释。 目前它还只能对真菌的物种信息注释到其是病原、共生、腐生这三大类,
并进一步细分为12个小类:动物病原菌(animalpathogens)、丛枝菌根真菌(arbuscularmycorrhizal fungi)、外生菌根真菌(ectomycorrhizal fungi)、杜鹃花类菌根真菌(ericoidmycorrhizal fungi)、叶内生真菌(foliar endophytes)、地衣寄生真菌(lichenicolousfungi)、地衣共生真菌(lichenizedfungi)、菌寄生真菌(mycoparasites)、植物病原菌(plantpathogens)、未定义根内生真菌(undefinedroot endophytes)、未定义腐生真菌(undefinedsaprotrophs)和木质腐生真菌(woodsaprotrophs)。
注释的内容还包括三类形态特殊的真菌:yeast、facultative yeast和thallus,以及森林,草地,木头这三类真菌的生长环境
这样功能分类就搞定了,再通过生物信息学脚本将物种分类与功能guild分类联系起来就大功告成啦并对其所有的注释信息给出文献的出处,但这也是真菌宏基因研究从单纯群落结构分析转向功能结构分析迈出的重要一步。
下面我将简单介绍如何使用FUNGuild进行真菌功能注释。
Python scripts及实战数据链接:http://pan.baidu.com/s/1boKdqX5 密码:910a
首先给大家介绍网页版的如何使用:
登陆网站:http://www.stbates.org/guilds/app.php
1. 准备OUT table
输入格式为.txt或.csv的OTU,示例OTU下载链接:http://pan.baidu.com/s/1boKdqX5 密码:910a
2. 上传表格,开始分析
进入http://www.stbates.org/guilds/app.php,将准备好的OTU表格上传,点击“BeginAnalysis”,稍等片刻就能得到结果。
3. 结果输出
运行结束后,在页面底端点击“Downloadfull OTU file”即可获得功能分类结果。
如果使用本地版的则需要下载其python script,下载地址是:同上
然后直接在Linux上执行以下命令:
python3 Guilds_v1.0.py -otu ./otu_table_example.txt
注意:最好在Linux系统下使用python3运行。
得到结果会有一个otu_table_example.guilds.txt 的文件,打开该文件就可以进行分析了。
结果分析生成的结果示例如下表所示:
其中前面几列就是你输入的OTU表格的信息,后面是由FUNGuild给出的结果,其中包括: 营养方式(Trophicmode):即病原型(pathotroph)、共生型(symbiotroph)和腐生型(saprotroph); Guild类型(Guild):即上面提到的12种guild类型;置信度(Confidence):基于已发表文献或权威网站或作者实验室研究数据对分类结果给出可信度评估,分“极可能”(highlyprobable)、“很可能”(probable)和“可能”(possible)三个等级, 初学者建议采纳前两种置信度的数据结果。 生长形态(Growthmorphology):即上面提到的除12种guild类型之外的3种生长形态类型(yeast、facultative yeast和thallus);特征(Trait):描述某些真菌的生长时的特征,如白腐(whiterot);注释(Notes):描述某些真菌的寄主类型、生境特征等;引用/来源(Citation/Source):对真菌进行功能guild划分的参考文献或网站信息。
统计学分析:
我们可以统计出不同guild的比例做柱状图、可以分析TOP丰度OTU的guild情况,也可以结合理化因子等对研究对象做出合理的解释与假设等等。今年PloS one上有篇文章把FUNGuild结果使用到了极致,大家可以参考一下。
References
AßhauerK P,Wemheuer B, Daniel R, et al. Tax4Fun: predicting functional profilesfrommetagenomic 16S rRNA data[J]. Bioinformatics,2015, 31(17): 2882-2884.
LangilleM GI, Zaneveld J, Caporaso J G, et al. Predictive functional profilingofmicrobial communities using 16S rRNA marker gene sequences[J]. Naturebiotechnology, 2013, 31(9): 814-821
TojuH, Kishida O, Katayama N, et al. Networks Depicting the Fine-ScaleCo-Occurrences of Fungi in Soil Horizons[J]. PloS one, 2016, 11(11): e0165987
NguyenN H,Song Z, Bates S T, et al. FUNGuild: an open annotation tool forparsingfungal community datasets by ecological guild[J]. Fungal Ecology, 2016,20: 241-248.
阅读更多宏基因组文章,欢迎扫码关注