其他
【直播】我的基因组 40:不同lane的bam文件的比较
首先要把bam文件根据lane的标记来拆开,前面我们提到了把bam文件根据染色体来拆开的软件是bamtools,它还可以指定 -tag RG 来把这个bam文件按照原来的测序上样品的lane给分离开(因为本身测序文件就是多个,比对后merge的bam)命令如下:
~/biosoft/bamtools/bamtools/bin/bamtools split -in ~/data/project/myGenome/bamFiles/P_jmzeng.final.bam -tag RG
从输出的bam文件的大小,就知道每条lane的上样量不一致。
还是老规矩,先统计平均测序深度及覆盖度,还有测序深度累积曲线。脚本还是用得前面讲到的那些,我就不具体细讲了:
根据结果,统计在excel可以看到:
它们的各种指标都取决于数据量的多少,没有lane的偏好性,证明数据质量比较好。
同时把bw文件打开,看看全基因组尺度的测序深度分布:
从测序是pattern上来看,也出奇的一致:
也反应了我的样本在不同的lane中表现比较好,没有出现lane的差异。
文:Jimmy、阿尔的太阳
图文编辑:吃瓜群众