其他
微生物基因组分类数据库GTDB和软件GTDB-Tk
The following article is from 基因的生物信息学分析 Author 基因的生信分析
手里有一堆未知分类的基因组序列,想知道它们是哪个种?是不是新的种?手工一个个的看16s rRNA序列或者是ANI分析,太费劲了!
基因组分类数据库 GTDB(Genome Taxonomy Database)是基于大量基因组的系统发育分析来构建基因组分类学研究的标准流程,从而对微生物进行分类 。
Create a new conda environment: conda create -n gtdbtk Activate the environment: conda activate gtdbtk Install GTDB-Tk: conda install -c bioconda gtdbtk
...::: GTDB-Tk v1.0.2 :::...
Workflows:
classify_wf -> Classify genomes by placement in GTDB reference tree
(identify -> align -> classify)
de_novo_wf -> Infer de novo tree and decorate with GTDB taxonomy
(identify -> align -> infer -> root -> decorate) [In Development]
Methods:
identify -> Identify marker genes in genome
align -> Create multiple sequence alignment
infer -> Infer tree from multiple sequence alignment
classify -> Determine taxonomic classification of genomes
root -> Root tree using an outgroup
decorate -> Decorate tree with GTDB taxonomy [In Development]
Tools:
trim_msa -> Trim an untrimmed MSA file based on a mask
export_msa -> Export the untrimmed archaeal or bacterial MSA file
Testing:
test -> Test the classify_wf pipeline with 3 archaeal genomes
check_install -> Verify if all GTDB-Tk data files are present
Use: gtdbtk <command> -h for command specific help
INFO: Command: gtdbtk classify_wf --genome_dir ./genomes --out_dir ./output --cpus 1
INFO: Test has successfully finished.
Chaumeil PA, et al. 2019. GTDB-Tk: A toolkit to classify genomes with the Genome Taxonomy Database. Bioinformatics, btz848. Parks DH, et al. 2018. A standardized bacterial taxonomy based on genome phylogeny substantially revises the tree of life. Nat. Biotechnol., http://dx.doi.org/10.1038/nbt.4229.
猜你喜欢
10000+:菌群分析 宝宝与猫狗 梅毒狂想曲 提DNA发Nature Cell专刊 肠道指挥大脑
文献阅读 热心肠 SemanticScholar Geenmedical
16S功能预测 PICRUSt FAPROTAX Bugbase Tax4Fun
生物科普: 肠道细菌 人体上的生命 生命大跃进 细胞暗战 人体奥秘
写在后面
为鼓励读者交流、快速解决科研困难,我们建立了“宏基因组”专业讨论群,目前己有国内外5000+ 一线科研人员加入。参与讨论,获得专业解答,欢迎分享此文至朋友圈,并扫码加主编好友带你入群,务必备注“姓名-单位-研究方向-职称/年级”。PI请明示身份,另有海内外微生物相关PI群供大佬合作交流。技术问题寻求帮助,首先阅读《如何优雅的提问》学习解决问题思路,仍未解决群内讨论,问题不私聊,帮助同行。
学习16S扩增子、宏基因组科研思路和分析实战,关注“宏基因组”