查看原文
其他

生物信息百Jia软件(六):prodigal

2018-04-11 王通 基因学苑

编者按
前面写了专题《手把手教你生物信息分析平台搭建》,然后又介绍了很多《生物神奇网站》资源,也介绍了《生物信息之独孤九剑》Linux操作。那么万事俱备,就开始学习生物信息吧。所以,我们开始新的篇章——《生物信息百jia软件》。百Jia是什么意思呢?可以是百佳,也可以是百家,还可以是百加。从100家中选择100款优秀软件,掌握这些软件,就可以扩展出更多内容,这就是百Jia。

一、功能分类:

原核生物基因预测

二、软件官网:

compbio.ornl.gov/prodigal/

三、软件介绍:

prodigal的全称是Prokaryotic Dynamic Programming Genefinding Algorithm,原核的动态编程基因查找算法,prodigal主要应用于细菌和古生菌的基因预测,不能用于真核生物,如果要对meta样品做基因预测,prodigal还专门提供了meta的版本。 除此之外,prodigal还支持在线提交序列的方式来预测基因预测。也非常的易于使用。而且相对与glimmer基因预测工具,prodigal更加好用,只需一步即 45 28463 45 12957 0 0 2627 0 0:00:10 0:00:04 0:00:06 2627可,而且,软件可以直接输出基因的核酸序列并翻译出的相应的氨基酸序列,这对很多初学者来说是非常方便的。

四、下载安装:

wget https://codeload.github.com/hyattpd/Prodigal/tar.gz/v2.60
tar -zxvf Prodigal-2.6.1.tar.gz
make install

五、软件使用:

软件的使用比较容易,比glimmer要容易很多,只需一步即可,直接敲prodigal命令就会弹出软件帮助信息。

-a 是输出氨基酸文件-c 不允许基因一边断开,也就是要求完整的orf,有起始和终止结构
-d 输出预测基因的序列文件
-f 选择输出文件格式,有gbk,gff,和sco格式可供选择
-g 指定密码子,原核为第11套
-i 输入文件,即需要预测的基因组序列文件
-m 屏蔽基因组中的N碱基
-o 输出文件,默认为屏幕输出
-p 选择方式,是单菌还是meta样品
-q 不输错错误信息到屏幕
-t 指定训练集
-s 输出所有潜在基因以及分值到一个文件中

六、使用案例:

prodigal -a ref.pep -d ref.cds -f gff -g 11  -o ref.gff -p single -s ref.stat -i ref.fna >prodigal.log

七、注意事项:

1、对于原核生物基因预测,我们还需要注意一个问题,就是当样品为支原体时,在密码子选择上要修改一下,因为在支原体中遗传密码中的密码子UGA能够编译成色胺酸,而不是一般的乳白色终止码。

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存