BGISEQ PCR-free+ONT，大小变异一网打尽！

From: 郑小乐华大科技BGITech 2019-12-12

随着基因组学研究的不断深入，个人基因组测序成本极速下降，如何能够以较低的成本获取最准确、最全面的基因组变异信息愈发重要。基于短读长和长读长测序平台对于变异检测各有所长，华大科技推出了独有的BGISEQ PCR-free + ONT高性价比的完美人全基因组变异检测解决方案，身兼短读长和长读长的优势，可解决如下问题——

短读长测序无法有效检测大的结构变异（SV）

短读长测序由于读长和插入片段较短，检测SV具有偏向性，并且无法通过算法升级解决^[1]。

为了更直观地看到短读长测序对SV的检测能力，我们采用了delly和manta两个软件对人标准品NA12878的SV进行评估，结果显示各短读长测序平台在SV变异检测能力都不尽如人意，对于缺失和倒位变异检测的真阳性率（50%-60%）已经很低了，而对于重复和插入的检测更是几乎不可能。

图1 短读长测序平台SV检测真阳性率

长读长测序无法有效检测小的SNP和InDel

对于单核苷酸错误率为5-15%的单分子长读长测序，准确鉴定DNA序列的突变尤为困难^[2]。

今年3月份，《Nature communications》发表了题为《A multi-task convolutional deep neural network for variant calling in single molecule sequencing》的文章，将短读长测序检测出的SNP和InDel表现，与PacBio和ONT平台的检测结果进行比较。研究人员选取每个平台不同训练模型中表现最好的F1 score（F1 score越高表示假阳与假阴越少），发现SNP F1 score短读长比长读长测序平台高出5个百分点，而对于小的InDel，短读长测序平台的检测能力高出长读长测序平台一倍！

图2 短读长和长读长测序平台SNP和InDel变异检测能力

建库测序PCR扩增影响短读长测序的变异检测

PCR过程中可能会引入碱基错配，错误频率可达万分之六0.06%^[3]，降低了DNA序列复制的保真性。对于核酸序列来说，由于其复杂的二级结构或热稳定性不好，会影响到PCR扩增效率，使得不同的基因组序列存在扩增偏向性，从而降低基因组覆盖度^[4]。此外，PCR过程会引入错误的InDel^[5]，当DNA两条链上的嘌呤嘧啶含量不平衡时会增加缺失发生的几率^[6]，序列中PolyA结构、高GC含量的序列会增加复制滑移，从而增加了引入InDel的几率^[7]。因此，PCR建库比PCR-free建库的WGS测序数据多引入3.4万个错误的InDel！

图3 PCR与PCR-free建库数据检测出错误的InDel数量

由此可见，短读长测序技术可以低成本高精准度检测小的SNP和InDel突变，但是缺乏从长片段DNA中读取信息的能力。长读长测序技术，例如Oxford Nanopore或Pacbio技术，可以获得高精准度的SV检测结果，单倍体定型，高同源区域的覆盖，但是对于小的变异检测（SNP、InDel）表现出较低的精准度，且价格昂贵，让很多科研工作者望而却步。

图4 如何平衡长读长和短读长测序平台的优劣势

结合短读长与长读长测序平台优势，并基于BGISEQ独有的真PCR-free建库测序技术，华大科技推出的BGISEQ PCR-free +ONT人全基因组重测序变异解决方案，可轻松将大小变异一网打尽！

表1 不同方案成本及变异检测能力比较

BGISEQ PCR-free + ONT人全基因组重测序，大小变异，一个都不能少！

参考文献：

【1】Guan P, Sung W K. Structural Variation Detection Using Next-Generation Sequencing Data: A Comparative Technical Review.[J]. Methods, 2016, 102:36-49.

【2】Luo R, Sedlazeck F J, Lam T W, et al. A multi-task convolutional deep neural network for variant calling in single molecule sequencing[J]. Nature communications, 2019, 10(1): 998.

【3】Brodin, J. et al. PCR-induced transitions are the major source of error in cleaned ultra-deep pyrosequencing data. PLoS One 8, e70388, doi:10.1371/journal. pone. 0070388 (2013).

【4】Aird D, Ross M G, Chen W S, et al. Analyzing and minimizing PCR amplification bias in Illumina sequencing libraries[J]. Genome Biology, 2011, 12(2):R18.

【5】Han F, Wu Y, Narzisi G, et al. Reducing INDEL calling errors in whole genome and exome sequencing data[J]. Genome Medicine,6,10(2014-10-28), 2014, 6(10):89.

【6】Kondrashov A S, Rogozin I B. Context of deletions and insertions in human coding sequences[J]. Human Mutation, 2004, 23(2):177–185.

【7】Sjödin P, Bataillon T, Schierup MH (2010) Insertion and deletion processes in recent human history. PloS ONE, 5, e8650.

撰稿：郑小乐

编辑：市场部

相关阅读

样本总是“戴错帽子”？解读错配率趋于0的DNA纳米球技术

近期热文

买一送一！Dr. Tom多组学数据挖掘系统放大招啦~

哎呀，外显子测序的这些坑，千万不能再踩了 | 端午节大促

同1个cell，5倍有效数据！华大5X全长转录组如何实现的？

危中有机，大豆能否成为中国农业崛起的支点？

给力！国产芯片助力全球首次实现手机个人全基因组测序分析