生物信息百jia软件(25):quast
去年这时候制定了一个计划,写100篇生物软件的教程推文,取名字“生物信息百jia软件”,本来以为很快就可以完成,结果没想到由于各种事情,这项计划给搁浅了,只完成了四分之一,半途而废不是我性格,所以,接下来我们继续。当你熟悉Linux操作,熟悉测序原理之后,这部分内容使用起来将异常容易。
应用场景
1、得到不同软件拼接的基因组序列,想比较一下哪个软件拼接效果更好;
2、同一软件,比较不同选项参数拼接的结果,哪个更好;
3、比较拼接得到的基因组,与参考序列的相似性。
软件官网
QUAST: Quality Assessment Tool for Genome Assemblies
QUAST:http://bioinf.spbau.ru/quast
http://quast.sourceforge.net/quast
参考文献
Alexey Gurevich, Vladislav Saveliev, Nikolay Vyahhi and Glenn Tesler,
QUAST: quality assessment tool for genome assemblies,
Bioinformatics (2013) 29 (8): 1072-1075. doi: 10.1093/bioinformatics/btt086
First published online: February 19, 2013
下载安装
1wget https://downloads.sourceforge.net/project/quast/quast-5.0.2.tar.gz
2tar -xzf quast-5.0.2.tar.gz
3cd quast-5.0.2
4python setup.py install_full
bioconda也可以直接安装
1conda install -y quast
选项参数
软件的使用也比较容易,会直接输入要比较的几个基因组即可,fasta格式。
-o --output-dir 输出结果目录
-R 参考序列文件
-G --genes 参考序列基因坐标,一般BED或者GFF格式文件
-m --min-contig 最小contig长度,也就是小于这个阈值的不参与计算
-t --threads 使用线程数目,默认使用四分之一的cpu
--help 列出全部选项参数,大部分情况下,默认这些选项即可
案例介绍
目前有三个基因组序列分别使用SOAPdenovo,SPAdes,Velvet软件拼接,想比较一下哪款软件拼接效果更好,下载参考序列,NC_000962.fna,这个案例中,与参考序列差别越小的拼接效果越好,
1python /ifs1/Software/biosoft/quast-5.0.2/quast.py -R NC_000962.fna -o report soapdenovo.fa spades.fa velvet.fa
结果解读
spades会生成网页版的报告,阅读起来非常容易,而且有很多动态的图。这种可以生成html格式报告的软件就很好,方便阅读。
---------- END ----------
(添加作者微信,请注明单位姓名)
您可能还会感兴趣的
生物信息零基础班(上海站)开课啦
手把手教你生信分析平台搭建专栏合集
生物信息重要资源站点合集
不会编程,如何进行批量操作
一个人全基因组完整数据分析脚本
一个细菌基因组完整分析脚本
如何在Linux下优雅的装X
2019,送给大家一份新年礼物
生物学才是终极学科