查看原文
其他

凌波微课|还不会序列比对?试试本地BLAST吧

Young 凌波微课 2023-06-15
学生信,做分析,就上


本地blast实操

序列相似性搜索是重要的生物信息学研究之一,常常为新测序基因组或序列片段的功能提供参考,而BLAST是这一系列工具中最流行的相似性搜索工具。1989年,美国国家生物技术信息中心(NCBI)首次推出BLAST。自第一版以来,NCBI一直在维护和更新BLAST版本(ftp://ftp.ncbi.nlm.nih.gov/blast/executables/legacy.NOTSUPPORTED/)。本地BLAST不受网速、序列数目的限制,能够快速、准确的进行序列比对。

本期凌波微课为大家带来物种基因组序列进行本地blast的操作方法。具体操作猛戳上方视频哦~

 

更多精彩内容加入“凌波微课交流群”,满满的干货不容错过,独乐乐不如众乐乐哦~


 





环境变量设置方法




将BLAST完整的程序执行bin文件夹路径(C:\Users\dell\Desktop\Online\Blast\BLAST\bin添加到PATH路径之后,在任何地方都可以直接使用程序名运行程序,而不必使用完整的路径名
计算机 →属性 →高级系统设置 →环境变量 → PATH中添加系统变量或用户变量



 





本地blast参数说明




1. formatdb数据库格式化参数解读
formatdb -i .\ref_genome.fasta -p F -o F
左右滑动查看
-i需要格式化的数据库名称-p文件类型 :默认为蛋白数据库(T),反之为核酸序列数据库(F)-o解析选项:默认解析序列标识并且建立目录(T),反之(F)-n重命名数据库文件



2. blastall序列比对参数解读

blastall -p blastn -i .\AE014075.fasta -d ref_genome.fasta -e 1e-5 -m 0 -o blast_out1.txt
左右滑动查看
-p: 指定要使用何种子程序-d: 数据库,个性数据库或NCBI下载数据库-i: 输入文件自己整理的序列-o: 输出文件名称-e:指定一个实数,过滤掉期望值大于这个数的比对结果,默认10,e值越大随机匹配的可能性越大,因此设置小的e值增加结果可信度。但在引物特异性检验时,应将e值设大些-F:用来屏蔽简单重复和低复杂度序列( T/F) ,默认T-v:输出中每一个query的比对列表最多显示subject个数,默认500(在-m为8~9的情况下)-b:每个query 最多显示的比对条形图,默认250 (在-m为1~6的情况下)


 

 

PS:公众号后台回复“BLAST”,即可获得Blast应用程序和示例文件的下载链接哦~


 



往期精彩





凌波微课,创意于2020年不平凡的春天,由高通量测序及组学研究领域从业近十年的技术团队精心打造。

凌波微课的讲师们,实战经验丰富,旨在通过在线微课程及线下交流,帮助科研学生及科研工作者们由简入繁,掌握科研思路及生信分析的实际操作。凌波微课,用心服务科研用户,打造专业培训品牌,助力科研提升。


关注我

发现更多精彩

关注凌波微课公众号,回复“入群”,即可加入凌波微课课下交流群,更多干货等你呦!


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存