查看原文
其他

生物信息百Jia软件(五):fastqc

2018-04-09 王通 基因学苑

编者按
前面写了专题《手把手教你生物信息分析平台搭建》,然后又介绍了很多《生物神奇网站》资源,也介绍了《生物信息之独孤九剑》Linux操作。那么万事俱备,就开始学习生物信息吧。所以,我们开始新的篇章——《生物信息百jia软件》。百Jia是什么意思呢?可以是百佳,也可以是百家,还可以是百加。从100家中选择100款优秀软件,掌握这些软件,就可以扩展出更多内容,这就是百Jia。

一、功能分类:

测序质控

二、软件官网:

http://www.bioinformatics.babraham.ac.uk/projects/fastqc/

三、软件介绍:

FastQC是一款功能强大又使用简单的软件,主要用户测序数据的质控。FastQC软件支持多种平台数据的评估,包括illumina、454、pacbio等等。软件可以支持Linux,windows,macos等多种平台,并且可以生成网页格式的报告,方便阅读。

四、下载安装:

wget http://www.bioinformatics.babraham.ac.uk/projects/fastqc/fastqc_v0.11.7.zip
unzip fastqc_v0.11.7.zip

五、软件使用:

fastqc运行起来还是比较简单,如果系统安装有xming的图形化窗口,直接敲命令就会弹出图形界面模式,这个模式下可以直接点鼠标导入数据。这里我们采用命令行模式。
加上-h参数看一下有哪些选项。

这里面选项都比较简单。选择比较重要的
-f 指定输入文件的类型,支持多种格式,
-o 指定输出目录,需要先建立一个输出目录
还有一些指定是否分析kmer,是否压缩数据文件等,都比较简单。
我们拿两条测序reads来做一下演示。
先创建一个数据目录,mkdir result,然后
敲fastqc -f fastq -o result reads.1.fq.gz reads.2.fq.gz;
回车之后程序就开始执行了,运行速度还是比较快的。最终会生成网页文件。

六、使用案例:

mkdir result
fastqc -f fastq -o result reads.1.fq.gz reads.2.fq.gz

报告模板:http://www.bioinformatics.babraham.ac.uk/projects/fastqc/good_sequence_short_fastqc.html

七、注意事项:

1、数据质控是一个综合的评价标准,其中主要指标为碱基质量与含量分布,如果这两个指标合格了,后面大部分指标都可以通过。如果这两项不合格,其余都会受到影响。
2、其中一些指标并不适合所有数据。要根据具体数据类型,具体分析。

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存