BGISEQ PCR-free+ONT,大小变异一网打尽!
随着基因组学研究的不断深入,个人基因组测序成本极速下降,如何能够以较低的成本获取最准确、最全面的基因组变异信息愈发重要。基于短读长和长读长测序平台对于变异检测各有所长,华大科技推出了独有的BGISEQ PCR-free + ONT高性价比的完美人全基因组变异检测解决方案,身兼短读长和长读长的优势,可解决如下问题——
01
短读长测序无法有效检测大的结构变异(SV)
短读长测序由于读长和插入片段较短,检测SV具有偏向性,并且无法通过算法升级解决[1]。
为了更直观地看到短读长测序对SV的检测能力,我们采用了delly和manta两个软件对人标准品NA12878的SV进行评估,结果显示各短读长测序平台在SV变异检测能力都不尽如人意,对于缺失和倒位变异检测的真阳性率(50%-60%)已经很低了,而对于重复和插入的检测更是几乎不可能。
图1 短读长测序平台SV检测真阳性率
02
长读长测序无法有效检测小的SNP和InDel
对于单核苷酸错误率为5-15%的单分子长读长测序,准确鉴定DNA序列的突变尤为困难[2]。
今年3月份,《Nature communications》发表了题为《A multi-task convolutional deep neural network for variant calling in single molecule sequencing》的文章,将短读长测序检测出的SNP和InDel表现,与PacBio和ONT平台的检测结果进行比较。研究人员选取每个平台不同训练模型中表现最好的F1 score(F1 score越高表示假阳与假阴越少),发现SNP F1 score短读长比长读长测序平台高出5个百分点,而对于小的InDel,短读长测序平台的检测能力高出长读长测序平台一倍!
图2 短读长和长读长测序平台SNP和InDel变异检测能力
03
建库测序PCR扩增影响短读长测序的变异检测
PCR过程中可能会引入碱基错配,错误频率可达万分之六0.06%[3],降低了DNA序列复制的保真性。对于核酸序列来说,由于其复杂的二级结构或热稳定性不好,会影响到PCR扩增效率,使得不同的基因组序列存在扩增偏向性,从而降低基因组覆盖度[4]。此外,PCR过程会引入错误的InDel[5],当DNA两条链上的嘌呤嘧啶含量不平衡时会增加缺失发生的几率[6],序列中PolyA结构、高GC含量的序列会增加复制滑移,从而增加了引入InDel的几率[7]。因此,PCR建库比PCR-free建库的WGS测序数据多引入3.4万个错误的InDel!
图3 PCR与PCR-free建库数据检测出错误的InDel数量
由此可见,短读长测序技术可以低成本高精准度检测小的SNP和InDel突变,但是缺乏从长片段DNA中读取信息的能力。长读长测序技术,例如Oxford Nanopore或Pacbio技术,可以获得高精准度的SV检测结果,单倍体定型,高同源区域的覆盖,但是对于小的变异检测(SNP、InDel)表现出较低的精准度,且价格昂贵,让很多科研工作者望而却步。
结合短读长与长读长测序平台优势,并基于BGISEQ独有的真PCR-free建库测序技术,华大科技推出的BGISEQ PCR-free +ONT人全基因组重测序变异解决方案,可轻松将大小变异一网打尽!
表1 不同方案成本及变异检测能力比较
参考文献:
【1】Guan P, Sung W K. Structural Variation Detection Using Next-Generation Sequencing Data: A Comparative Technical Review.[J]. Methods, 2016, 102:36-49.
【2】Luo R, Sedlazeck F J, Lam T W, et al. A multi-task convolutional deep neural network for variant calling in single molecule sequencing[J]. Nature communications, 2019, 10(1): 998.
【3】Brodin, J. et al. PCR-induced transitions are the major source of error in cleaned ultra-deep pyrosequencing data. PLoS One 8, e70388, doi:10.1371/journal. pone. 0070388 (2013).
【4】Aird D, Ross M G, Chen W S, et al. Analyzing and minimizing PCR amplification bias in Illumina sequencing libraries[J]. Genome Biology, 2011, 12(2):R18.
【5】Han F, Wu Y, Narzisi G, et al. Reducing INDEL calling errors in whole genome and exome sequencing data[J]. Genome Medicine,6,10(2014-10-28), 2014, 6(10):89.
【6】Kondrashov A S, Rogozin I B. Context of deletions and insertions in human coding sequences[J]. Human Mutation, 2004, 23(2):177–185.
【7】Sjödin P, Bataillon T, Schierup MH (2010) Insertion and deletion processes in recent human history. PloS ONE, 5, e8650.
撰稿:郑小乐
编辑:市场部
相关阅读
近期热文
同1个cell,5倍有效数据!华大5X全长转录组如何实现的?
请继续关注“华大科技BGITech”,
科技君将一如既往为您提供精彩内容!
如有相关问题,欢迎后台留言~~
▼
关注华大科技,尽享精彩科研!