查看原文
其他

BGISEQ PCR-free+ONT,大小变异一网打尽!

郑小乐 华大科技BGITech 2019-12-12
 

随着基因组学研究的不断深入,个人基因组测序成本极速下降,如何能够以较低的成本获取最准确、最全面的基因组变异信息愈发重要。基于短读长和长读长测序平台对于变异检测各有所长,华大科技推出了独有的BGISEQ PCR-free + ONT高性价比的完美人全基因组变异检测解决方案,身兼短读长和长读长的优势,可解决如下问题——


01

短读长测序无法有效检测大的结构变异(SV)

短读长测序由于读长和插入片段较短,检测SV具有偏向性,并且无法通过算法升级解[1]


为了更直观地看到短读长测序对SV的检测能力,我们采用了delly和manta两个软件对人标准品NA12878的SV进行评估,结果显示各短读长测序平台在SV变异检测能力都不尽如人意,对于缺失和倒位变异检测的真阳性率(50%-60%)已经很低了,而对于重复和插入的检测更是几乎不可能。

图1 短读长测序平台SV检测真阳性率

 

02

长读长测序无法有效检测小的SNP和InDel

对于单核苷酸错误率为5-15%的单分子长读长测序,准确鉴定DNA序列的突变尤为困难[2]


今年3月份,《Nature communications》发表了题为《A multi-task convolutional deep neural network for variant calling in single molecule sequencing》的文章,将短读长测序检测出的SNP和InDel表现,与PacBio和ONT平台的检测结果进行比较。研究人员选取每个平台不同训练模型中表现最好的F1 score(F1 score越高表示假阳与假阴越少),发现SNP F1 score短读长比长读长测序平台高出5个百分点,而对于小的InDel,短读长测序平台的检测能力高出长读长测序平台一倍!


图2 短读长和长读长测序平台SNP和InDel变异检测能力

 

03

建库测序PCR扩增影响短读长测序的变异检测

PCR过程中可能会引入碱基错配,错误频率可达万分之六0.06%[3],降低了DNA序列复制的保真性。对于核酸序列来说,由于其复杂的二级结构或热稳定性不好,会影响到PCR扩增效率,使得不同的基因组序列存在扩增偏向性,从而降低基因组覆盖度[4]。此外,PCR过程会引入错误的InDel[5],当DNA两条链上的嘌呤嘧啶含量不平衡时会增加缺失发生的几率[6],序列中PolyA结构、高GC含量的序列会增加复制滑移,从而增加了引入InDel的几率[7]。因此,PCR建库比PCR-free建库的WGS测序数据多引入3.4万个错误的InDel!

图3 PCR与PCR-free建库数据检测出错误的InDel数量


由此可见,短读长测序技术可以低成本高精准度检测小的SNP和InDel突变,但是缺乏从长片段DNA中读取信息的能力。长读长测序技术,例如Oxford NanoporePacbio技术,可以获得高精准度的SV检测结果,单倍体定型,高同源区域的覆盖,但是对于小的变异检测(SNP、InDel)表现出较低的精准度,且价格昂贵,让很多科研工作者望而却步。

图4 如何平衡长读长和短读长测序平台的优劣势


结合短读长与长读长测序平台优势,并基于BGISEQ独有的真PCR-free建库测序技术,华大科技推出的BGISEQ PCR-free +ONT人全基因组重测序变异解决方案,可轻松将大小变异一网打尽!


表1 不同方案成本及变异检测能力比较

BGISEQ PCR-free + ONT人全基因组重测序,大小变异,一个都不能少!

 

参考文献:

【1】Guan P, Sung W K. Structural Variation Detection Using Next-Generation Sequencing Data: A Comparative Technical Review.[J]. Methods, 2016, 102:36-49.

【2】Luo R, Sedlazeck F J, Lam T W, et al. A multi-task convolutional deep neural network for variant calling in single molecule sequencing[J]. Nature communications, 2019, 10(1): 998.

【3】Brodin, J. et al. PCR-induced transitions are the major source of error in cleaned ultra-deep pyrosequencing data. PLoS One 8, e70388, doi:10.1371/journal. pone. 0070388 (2013).

【4】Aird D, Ross M G, Chen W S, et al. Analyzing and minimizing PCR amplification bias in Illumina sequencing libraries[J]. Genome Biology, 2011, 12(2):R18.

【5】Han F, Wu Y, Narzisi G, et al. Reducing INDEL calling errors in whole genome and exome sequencing data[J]. Genome Medicine,6,10(2014-10-28), 2014, 6(10):89.

【6】Kondrashov A S, Rogozin I B. Context of deletions and insertions in human coding sequences[J]. Human Mutation, 2004, 23(2):177–185.

【7】Sjödin P, Bataillon T, Schierup MH (2010) Insertion and deletion processes in recent human history. PloS ONE, 5, e8650.

 


撰稿:郑小乐

编辑:市场部


相关阅读

样本总是“戴错帽子”?解读错配率趋于0的DNA纳米球技术


近期热文

买一送一!Dr. Tom多组学数据挖掘系统放大招啦~

哎呀,外显子测序的这些坑,千万不能再踩了 | 端午节大促

同1个cell,5倍有效数据!华大5X全长转录组如何实现的?

危中有机,大豆能否成为中国农业崛起的支点?

给力!国产芯片助力全球首次实现手机个人全基因组测序分析

优秀!这就是全球首部跑通WGS分析的国产手机!

全球首个手机全基因测序分析成功了!开发团队的下场竟然是……



请继续关注“华大科技BGITech”,

科技君将一如既往为您提供精彩内容!

如有相关问题,欢迎后台留言~~

关注华大科技,尽享精彩科研!


    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存