凌波微课|Blast的升级版?没错,就是本地blast+
学生信,做分析,就上
凌波微课
本地blast+实操
序列相似性搜索是重要的生物信息学研究之一,常常为新测序基因组或序列片段的功能提供参考,而BLAST是这一系列工具中最流行的相似性搜索工具。
1989年,美国国家生物技术信息中心(NCBI)首次推出BLAST。自第一版以来,NCBI一直在维护和更新BLAST版本。本地BLAST不受网速、序列数目的限制,能够快速、准确的进行序列比对。
NCBI强烈推荐BLAST+(ftp://ftp.ncbi.nlm.nih.gov/blast/executables/blast+/),BLAST程序BLAST+与BLAST相比,有很多改进和提高,可以加快搜索速度,并在输出格式和搜索输入方面提供更大的灵活性,且清晰的模块化将会极大的提高维护者的效率。BLAST程序目前版本不再更新,BLAST+程序版本最新版本更新到2.10.0。
上一期我们为大家介绍了本地BLAST是操作方法(凌波微课|还不会序列比对?试试本地BLAST吧),本期凌波微课为大家带来物种基因组序列进行本地blast+的操作方法。具体操作猛戳上方视频哦~
更多精彩内容加入“凌波微课交流群”,满满的干货不容错过,独乐乐不如众乐乐哦~
环境变量设置方法
将BLAST+完整的程序执行bin文件夹路径(C:\software\blast-2.6.0+)添加到PATH路径之后,在任何地方都可以直接使用程序名运行程序,而不必使用完整的路径名。
Step 2
本地blast+参数说明
1. makeblastdb数据库格式化参数解读
makeblastdb -in .\ref_genome.fasta -dbtype nucl -parse_seqids -out ref
-in:待格式化的序列文件
-dbtype:数据库类型,nucl为核酸,prot为蛋白
-out:输出数据库名,可用于后续-db参数设置
2. BLAST+序列比对参数解读
blastn -query .\AE014075.fasta -db ref -out blast_out1.txt -evalue 1e-5 -outfmt 6
-query:输入文件路径及文件名
-out:输出文件路径及文件名
-db:格式化了的数据库路径及数据库名
-outfmt:输出文件格式,共12种,6是tabular格式对应BLAST的m8格式
-evalue:设置输出结果的e-value值,e值越小最后结果可信度越高
参数 | Blast | Blast+ |
数据库格式化函数 | formatdb | makeblastdb |
输入/输出 | -i / -o | -query / -out |
格式化了的数据库路径及数据库名 | -d | -db |
输出结果的e-value值 | -e | -evalue |
输出文件格式 | -m | -outfmt |
最大目标的数目 | -v / -b | -max_target_seqs |
END
凌波微课,创意于2020年不平凡的春天,由高通量测序及组学研究领域从业近十年的技术团队精心打造。
凌波微课的讲师们,实战经验丰富,旨在通过在线微课程及线下交流,帮助科研学生及科研工作者们由简入繁,掌握科研思路及生信分析的实际操作。凌波微课,用心服务科研用户,打造专业培训品牌,助力科研提升。
关注我
发现更多精彩
关注凌波微课公众号,回复“入群”,即可加入凌波微课课下交流群,更多干货等你呦!