【直播】我的基因组53:几个找变异的软件的效果比较
随便找一个SNP-calling的综述就可以找到一大堆软件的评价,我这里强烈推荐A survey of tools for variant analysis of next-generation genome sequencing data :
如果你在找变异这一个知识点还很模糊,甚至可以花点时间来翻译一下,同时欢迎大家交流自己的学习心得( 论坛回帖即可)
我很早以前处理外显子数据的时候,就比较过几个软件的找变异的效果,这里就继续沿用上次的思路!
我比较了gatk,freebayes,bcftools,varscan,都是引用率比较高的而且经受了时间的考验的好软件。
它们的下载安装方法是:
## Download and install bcftools
## http://www.htslib.org/download/
## http://www.htslib.org/doc/bcftools-1.0.html
cd ~/biosoft
mkdir bcftools && cd bcftools
wget https://github.com/samtools/bcftools/releases/download/1.3.1/bcftools-1.3.1.tar.bz2
tar xvfj bcftools-1.3.1.tar.bz2
cd bcftools-1.3.1
make
cp bcftools /home/jianmingzeng/biosoft/myBin
~/biosoft/myBin/bin/bcftools --help
## Download and install freebayes
## https://github.com/ekg/freebayes
## http://clavius.bc.edu/~erik/CSHL-advanced-sequencing/freebayes-tutorial.html
cd ~/biosoft
mkdir freebayes && cd freebayes
## wget -O freebayes-master.zip https://codeload.github.com/ekg/freebayes/zip/master
## unzip freebayes-master.zip
wget http://clavius.bc.edu/~erik/freebayes/freebayes-5d5b8ac0.tar.gz
tar xzvf freebayes-5d5b8ac0.tar.gz
cd freebayes
make
~/biosoft/freebayes/freebayes/bin/freebayes
cd ~/biosoft
## https://sourceforge.net/projects/varscan/files/
## http://varscan.sourceforge.net/index.html
mkdir VarScan && cd VarScan
wget https://sourceforge.net/projects/varscan/files/VarScan.v2.3.9.jar
## GATK有一点特殊,需要注册才能下载,微信公众号后台回复GATK也可以,我传给你哈
我这里就直接秀我以前处理的3个外显子测序结果的这4个软件的差异吧!
明显可以看出,大部分的snp位点都至少有两到三个软件支持。所以,只有测序深度达到一定级别,用什么软件来做snp-calling,其实影响并不大。
如果软件有区别的那些位点,通常我们还是需要在IGV里用肉眼仔细辨别的,毕竟这是关乎于个人健康的大事呀!
参考:
文:Jimmy
图文编辑:吃瓜群众