查看原文
其他

【直播】我的基因组 35:bam格式转化为bw格式看测序深度分布

2016-12-31 生信菜鸟团 生信技能树

我们在之前说到过bam文件还有55G大小,这样的文件,在很多时候都不方便查看和转移。而有些时候,我们只需要我们的测序数据在全基因组的测序深度这一个值,并不需要具体某条reads的碱基序列,碱基质量值。这样就可以把bam文件压缩为bw格式啦!需要了解一些文件格式:

bam文件格式我就不多说了,就是sam的二进制压缩版本,前面我们也花费了大量的笔墨来描述它,而bw格式全称是bigwig格式,就是规定了全基因组数据的每个坐标区间的测序深度,标准释义如下:


Wiggle Track Format (WIG):

bigWig Track Format :

BedGraph Track Format :


这3种文件格式都是UCSC规定的,所以它提供了系列工具进行互相转换,

我这里用deeptools这个软件的bamCoverage工具来完成这个任务,命令如下:


bamCoverage -b P_jmzeng.final.bam  -o P_jmzeng.final.bw

bamCoverage -b P_jmzeng.filter.rmdup.realgn.bam -o P_jmzeng.filter.rmdup.realgn.bw


关于这个软件的用法及安装方法,见我博客:( 复制该地址到浏览器打开)


在IGV里面打开bam和bw文件,就知道这个软件到底做了什么。


首先对bw文件来说,可以在全基因组尺度下看看测序深度的整体情况,这样可以很明显的看到某些染色体的某些区域是不是严重的测序深度过低或者过高(我箭头所指的区域是有问题的,测序深度尤其高)。而对bam文件,需要zoom in到一定程度才能看到比对的reads情况。

通过bw的文件来定位异常区域,再zoom in去看具体是怎么回事,非常好用!可以看到这些区域测序深度高达8万!!!



文:Jimmy、吃瓜群众

图文编辑:吃瓜群众



您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存