查看原文
其他

生物信息百Jia软件(十七):flash

王通 基因学苑 2022-03-29

编者按
前面写了专题《手把手教你生物信息分析平台搭建》,然后又介绍了很多《生物神奇网站》资源,也介绍了《生物信息之独孤九剑》Linux操作。那么万事俱备,就开始学习生物信息吧。所以,我们开始新的篇章——《生物信息百jia软件》。百Jia是什么意思呢?可以是百佳,也可以是百家,还可以是百加。从100家中选择100款优秀软件,掌握这些软件,就可以扩展出更多内容,这就是百Jia。

一、功能分类:

连接pairend reads

二、软件官网:

http://ccb.jhu.edu/software/FLASH/index.shtml

三、软件介绍:

FLASH 的全称为Fast Length Adjustment of SHort reads。如果两条reads的总长大于原始测序片段的长度就可以使用flash进行连接。连接出来的长片段可以明显改善序列的拼接效果,原来基因kmer 的拼接方法,现在可以使用基于overlap的拼接软件,两种拼接测序完全不一样。然后在利用没有连接的reads之间的overlap关系,构建scaffold,这样就充分利用了数据。在转录组研究中,合并出来更长的片段甚至可以达到一个转录本的全长,可以极大提高分析结果的准确性。

四、下载安装:

tar -zxvf FLASH-1.2.11.tar.gz
cd FLASH-1.2.11/
make

五、软件使用:

要想输出所有选项,可以加--help。每个选项都给出了详细的介绍。
flash --help
-m 连接overlap最小接受的阈值,默认10bp
-M 连接overlap最大接受的阈值
-x 最大允许的错配比率,默认0.25
-O 尝试matepair模式reads方向的连接
-p phred质量值体系,默认为phred 33,早期的illumina测序数据采用phred 64
-r reads长度
-f 片段长度,也就是测序的文库大小
-s 文库的偏差
-o 输出前缀
-d 输出目录
-c 屏幕输出结果
-z 输出压缩格式结果
-t 设置线程数,flash软件支持多线程,速度快。
-q 不输出屏幕信息
-h 输出帮助信息
-v 输出软件版本信息

六、使用案例:

flash read1.fq read2.fq -p 33 -r 250 -f 500 -s 100 -o output

七、注意事项:

1、flash相对与cope软件不能基于kmer方法的连接,但是软件运行速度相对快一些。
2、软件默认会输出很多的结果,包括连接好的reads,分别输出没有用于连接的reads,统计数据等,可用于绘制直方图。

欢迎加入QQ群—基因学院:32798724。

如果觉着不错,欢迎点赞+转发


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存