【直播】我的基因组62:用Delly检测SV
人类单体型(Haplotype)及单核苷酸多态性位点(Single Nucleotide Polymorphism, SNP),能够揭示对药物和环境因子的个体反应差异,是将健康和疾病研究深入到分子水平的重要遗传信息。
以前我对全基因组重测续的研究也大多是找到SNV即可。但这次毕竟是我自己的基因,虽然以前没有做过SV,但还是想看看。
SV(结构变异)指基因组水平上大片段的插入、缺失、倒置、易位等序列。
详细的生物学解释,还有图文并茂的讲述大家可以自行阅读下面的课件和综述。人类基因组中很多结构变异(Structure Variation, SV)是正常的,这种良性 SV 不会导致疾病发生。
工具也挺多,去omictools搜索可以看到一大把,而且看最新的综述(Structural variation detection using next-generation sequencing data A comparative technical review) 里面也有详细列出这些工具和工具的比较!
插入(Insertion, INS)
缺失(Deletion, DEL)
反转(Inversion, INV)
染色体内部易位(Intra-chromosomal Translocation, ITX)
染色体间易位(Inter-chromosomal Translocation, CTX)
我们就是要从PE150bp的测序数据里面找到上面的5种的现象!
使用Delly检测SV
Delly软件的下载地址为https://github.com/dellytools/delly,下载后可以直接使用,无需安装,同时delly支持多线程运算,只需在运行命令行前加 export OMP_NUM_THREADS=8
我的代码如下:
export OMP_NUM_THREADS=5
bam=/home/jianmingzeng/data/project/myGenome/fastq/jmzeng.filter.rmdup.bam
excl=/home/jianmingzeng/biosoft/delly/delly/excludeTemplates/human.hg19.excl.tsv
genome=/home/jianmingzeng/reference/genome/hg19/hg19.fa
~/biosoft/delly/delly_v0.7.6_linux_x86_64bit call -t DEL -g $genome -o DEL.bcf -x $excl $bam
~/biosoft/delly/delly_v0.7.6_linux_x86_64bit call -t DUP -g $genome -o DUP.bcf -x $excl $bam
~/biosoft/delly/delly_v0.7.6_linux_x86_64bit call -t INV -g $genome -o INV.bcf -x $excl $bam
~/biosoft/delly/delly_v0.7.6_linux_x86_64bit call -t TRA -g $genome -o TRA.bcf -x $excl $bam
~/biosoft/delly/delly_v0.7.6_linux_x86_64bit call -t INS -g $genome -o INS.bcf -x $excl $bam
ls *bcf|while read id ;do bcftools view $id >${id%%.*}.vcf ;done
不大记得耗时多久了,反正时间对我来说无所谓,因为读懂它的结果耗时更长,结果如下:
对检测到的SV进行genomic feature的注释
根据样品检测得到的SV变异在参考基因组上的位置信息,对比参考基因组的基因、CDS位置等信息(一般在gff文件中),可以注释SV变异是否发生在基因间区、基因区或CDS区等。对缺失(DEL)、插入(INS)、反转(INV)3种类型的结构变异注释进行注释!
这里我选择的是Bioconductor 的intansv包!
反正我只会用了软件,会跑流程,至于结果怎么看,我真心不懂,还需要持续学习,估计等过了100讲,我会推出SV的续集,敬请期待~
这个,就后续再介绍咯!
文:Jimmy
图文编辑:吃瓜群众