查看原文
其他

【直播】我的基因组62:用Delly检测SV

2017-03-11 Jimmy 生信技能树


人类单体型(Haplotype)及单核苷酸多态性位点(Single Nucleotide Polymorphism, SNP),能够揭示对药物和环境因子的个体反应差异,是将健康和疾病研究深入到分子水平的重要遗传信息。


以前我对全基因组重测续的研究也大多是找到SNV即可。但这次毕竟是我自己的基因,虽然以前没有做过SV,但还是想看看。

SV(结构变异)指基因组水平上大片段的插入、缺失、倒置、易位等序列。


详细的生物学解释,还有图文并茂的讲述大家可以自行阅读下面的课件和综述。人类基因组中很多结构变异(Structure Variation, SV)是正常的,这种良性 SV 不会导致疾病发生。

工具也挺多,去omictools搜索可以看到一大把,而且看最新的综述(Structural variation detection using next-generation sequencing data A comparative technical review) 里面也有详细列出这些工具和工具的比较!


插入(Insertion, INS)

缺失(Deletion, DEL)

反转(Inversion, INV)

染色体内部易位(Intra-chromosomal Translocation, ITX)

染色体间易位(Inter-chromosomal Translocation, CTX)


我们就是要从PE150bp的测序数据里面找到上面的5种的现象!


使用Delly检测SV

Delly软件的下载地址为https://github.com/dellytools/delly,下载后可以直接使用,无需安装,同时delly支持多线程运算,只需在运行命令行前加 export OMP_NUM_THREADS=8


我的代码如下:

  1. export OMP_NUM_THREADS=5

  2. bam=/home/jianmingzeng/data/project/myGenome/fastq/jmzeng.filter.rmdup.bam

  3. excl=/home/jianmingzeng/biosoft/delly/delly/excludeTemplates/human.hg19.excl.tsv

  4. genome=/home/jianmingzeng/reference/genome/hg19/hg19.fa

  5. ~/biosoft/delly/delly_v0.7.6_linux_x86_64bit call -t DEL -g $genome -o DEL.bcf -x $excl $bam

  6. ~/biosoft/delly/delly_v0.7.6_linux_x86_64bit call -t DUP -g $genome -o DUP.bcf -x $excl $bam

  7. ~/biosoft/delly/delly_v0.7.6_linux_x86_64bit call -t INV -g $genome -o INV.bcf -x $excl $bam

  8. ~/biosoft/delly/delly_v0.7.6_linux_x86_64bit call -t TRA -g $genome -o TRA.bcf -x $excl $bam

  9. ~/biosoft/delly/delly_v0.7.6_linux_x86_64bit call -t INS -g $genome -o INS.bcf -x $excl $bam

  10. ls *bcf|while read id ;do bcftools view $id >${id%%.*}.vcf ;done


不大记得耗时多久了,反正时间对我来说无所谓,因为读懂它的结果耗时更长,结果如下:


对检测到的SV进行genomic feature的注释

根据样品检测得到的SV变异在参考基因组上的位置信息,对比参考基因组的基因、CDS位置等信息(一般在gff文件中),可以注释SV变异是否发生在基因间区、基因区或CDS区等。对缺失(DEL)、插入(INS)、反转(INV)3种类型的结构变异注释进行注释!

这里我选择的是Bioconductor 的intansv包!

反正我只会用了软件,会跑流程,至于结果怎么看,我真心不懂,还需要持续学习,估计等过了100讲,我会推出SV的续集,敬请期待~

这个,就后续再介绍咯!


文:Jimmy

图文编辑:吃瓜群众

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存