数据库|CAZymes在线注释以及本地化全攻略
01
CAZy数据库概述
CAZy数据库目前包括如下六大类家族
Classify | 分类 | number |
Glycoside Hydrolases (GHs) | 糖苷水解酶类 (GHs) | 755496 |
GlycosylTransferases (GTs) | 糖苷转移酶类 (GTs) | 644869 |
Polysaccharide Lyases (PLs) | 多糖裂解酶类 (PLs) | 23725 |
Carbohydrate Esterases (CEs) | 糖水化合物酯酶类 (CEs) | 77255 |
Auxiliary Activities (AAs) | 辅助模块酶类 (AAs) | 13880 |
Carbohydrate-Binding Modules (CBMs) | 碳水化合物结合模块 (CBMs) | 203729 |
CAZy数据库中目前已注释的基因组:
Type | number |
Bacteria | 15626 |
405 | |
357 | |
271 |
数据库注释
dbCAN注释基本流程
02
在线注释
1、序列提交
打开在线注释平台dbCAN(http://bcb.unl.edu/dbCAN2/),选择Annotate->填写邮箱->勾选注释工具->输入或选择序列->Submit。
注意:默认情况下,已选中HMMER,DIAMOND和Hotpep,而未选中CGC-Finder。仅选择HMMER将具有与原始dbCAN服务器相同的结果。选择CGC-Finder将显示基因位置文件上传按钮,您必须上传基因位置文件(如上图右,或者上传GFF或BED格式文件),以使CGC-Finder预测CAZyme基因簇(CGC)。
2、注释结果展示
点击Gene ID,例如prot_00088,得到该蛋白的结构域注释结果。
03
本地化配置
1、数据库和软件下载
http://bcb.unl.edu/dbCAN2/download/Tools/run_dbcan_v3.tar.gz
http://bcb.unl.edu/dbCAN2/download/Databases/CAZyDB.07312019.fam.subfam.ec.txt
http://bcb.unl.edu/dbCAN2/download/Databases/CAZyDB.07312019.fam-activities.txt
软件
HMMER3:
http://www.hmmer.org/download.html
Anaconda3:
2、安装
sh Anaconda3-2019.10-Linux-x86_64.sh -b -p $HOME/anaconda3
export PATH=$HOME/anaconda3/bin:$PATH
HMMER3的安装
conda install -c bioconda hmmer=3.0
3、数据库使用
Hmmpress dbCAN-HMMdb-V8.txt
数据库使用
hmmscan --domtblout xx.out.dm -o xx.out $HOME/dbCAN-HMMdb-V8.txt xx.fa
sh $HOME/hmmscan-parser.sh xx.out.dm > xx.out.dm.ps
-h 显示帮助信息-o <f> 将结果输出到指定的文件中。默认是输出到标准输出。--tblout <f> 将蛋白质序列的结果以表格形式输出到指定的文件中。默认不输出该文件。--domtblout <f> 将蛋白结构域的比对结果以表格形式输出到指定的文件中。默认不输出该文件。--pfamtblout <f> 输出pfam格式的表格和结构域结果。--acc 在输出结果中包含蛋白结构域的编号。--noali 在输出结果中不包含比对信息。输出文件的大小则会更小。-E <x> 设定E_value阈值,推荐设置为1e-5。default:10.0。-T <x> 设定Score阈值。--domE <x> 设定E_value阈值。该参数和-E 参数类似,不过是domain 比对设定的值。default:10.0。 --domT <x> 设定Score阈值。该参数和-T 参数类似,不过是domain 的score值。--cpu 并行分析的CPU数目[默认全部]。
输出结果
输出结果说明:
参考文献
3. The Carbohydrate-Active EnZymes database (CAZy): an expert resource for Glycogenomics. Nucleic Acids Research, 2009.
凌恩生物成立于2014年,专注组学技术在科研领域的应用与研究。公司成立以来,技术团队参与的项目成果成功发表在《Nature》《Cell》《PNAS》等国际顶端学术期刊。
秉承“以客户需求为本,为客户创造价值”的服务宗旨;以高品质、高效率的技术服务,用心打造凌恩品牌,助力您的成功!
长按二维码关注我们