查看原文
其他
     

    随着基因组学研究的不断深入,个人基因组测序成本极速下降,如何能够以较低的成本获取最准确、最全面的基因组变异信息愈发重要。基于短读长和长读长测序平台对于变异检测各有所长,华大科技推出了独有的BGISEQ PCR-free + ONT高性价比的完美人全基因组变异检测解决方案,身兼短读长和长读长的优势,可解决如下问题——


    01

    短读长测序无法有效检测大的结构变异(SV)

    短读长测序由于读长和插入片段较短,检测SV具有偏向性,并且无法通过算法升级解[1]


    为了更直观地看到短读长测序对SV的检测能力,我们采用了delly和manta两个软件对人标准品NA12878的SV进行评估,结果显示各短读长测序平台在SV变异检测能力都不尽如人意,对于缺失和倒位变异检测的真阳性率(50%-60%)已经很低了,而对于重复和插入的检测更是几乎不可能。

    图1 短读长测序平台SV检测真阳性率

     

    02

    长读长测序无法有效检测小的SNP和InDel

    对于单核苷酸错误率为5-15%的单分子长读长测序,准确鉴定DNA序列的突变尤为困难[2]


    今年3月份,《Nature communications》发表了题为《A multi-task convolutional deep neural network for variant calling in single molecule sequencing》的文章,将短读长测序检测出的SNP和InDel表现,与PacBio和ONT平台的检测结果进行比较。研究人员选取每个平台不同训练模型中表现最好的F1 score(F1 score越高表示假阳与假阴越少),发现SNP F1 score短读长比长读长测序平台高出5个百分点,而对于小的InDel,短读长测序平台的检测能力高出长读长测序平台一倍!


    图2 短读长和长读长测序平台SNP和InDel变异检测能力

     

    03

    建库测序PCR扩增影响短读长测序的变异检测

    PCR过程中可能会引入碱基错配,错误频率可达万分之六0.06%[3],降低了DNA序列复制的保真性。对于核酸序列来说,由于其复杂的二级结构或热稳定性不好,会影响到PCR扩增效率,使得不同的基因组序列存在扩增偏向性,从而降低基因组覆盖度[4]。此外,PCR过程会引入错误的InDel[5],当DNA两条链上的嘌呤嘧啶含量不平衡时会增加缺失发生的几率[6],序列中PolyA结构、高GC含量的序列会增加复制滑移,从而增加了引入InDel的几率[7]。因此,PCR建库比PCR-free建库的WGS测序数据多引入3.4万个错误的InDel!

    图3 PCR与PCR-free建库数据检测出错误的InDel数量


    由此可见,短读长测序技术可以低成本高精准度检测小的SNP和InDel突变,但是缺乏从长片段DNA中读取信息的能力。长读长测序技术,例如Oxford NanoporePacbio技术,可以获得高精准度的SV检测结果,单倍体定型,高同源区域的覆盖,但是对于小的变异检测(SNP、InDel)表现出较低的精准度,且价格昂贵,让很多科研工作者望而却步。

    图4 如何平衡长读长和短读长测序平台的优劣势


    结合短读长与长读长测序平台优势,并基于BGISEQ独有的真PCR-free建库测序技术,华大科技推出的BGISEQ PCR-free +ONT人全基因组重测序变异解决方案,可轻松将大小变异一网打尽!


    表1 不同方案成本及变异检测能力比较

    BGISEQ PCR-free + ONT人全基因组重测序,大小变异,一个都不能少!

     

    参考文献:

    【1】Guan P, Sung W K. Structural Variation Detection Using Next-Generation Sequencing Data: A Comparative Technical Review.[J]. Methods, 2016, 102:36-49.

    【2】Luo R, Sedlazeck F J, Lam T W, et al. A multi-task convolutional deep neural network for variant calling in single molecule sequencing[J]. Nature communications, 2019, 10(1): 998.

    【3】Brodin, J. et al. PCR-induced transitions are the major source of error in cleaned ultra-deep pyrosequencing data. PLoS One 8, e70388, doi:10.1371/journal. pone. 0070388 (2013).

    【4】Aird D, Ross M G, Chen W S, et al. Analyzing and minimizing PCR amplification bias in Illumina sequencing libraries[J]. Genome Biology, 2011, 12(2):R18.

    【5】Han F, Wu Y, Narzisi G, et al. Reducing INDEL calling errors in whole genome and exome sequencing data[J]. Genome Medicine,6,10(2014-10-28), 2014, 6(10):89.

    【6】Kondrashov A S, Rogozin I B. Context of deletions and insertions in human coding sequences[J]. Human Mutation, 2004, 23(2):177–185.

    【7】Sjödin P, Bataillon T, Schierup MH (2010) Insertion and deletion processes in recent human history. PloS ONE, 5, e8650.

     


    撰稿:郑小乐

    编辑:市场部


    相关阅读

    样本总是“戴错帽子”?解读错配率趋于0的DNA纳米球技术


    近期热文

    买一送一!Dr. Tom多组学数据挖掘系统放大招啦~

    哎呀,外显子测序的这些坑,千万不能再踩了 | 端午节大促

    同1个cell,5倍有效数据!华大5X全长转录组如何实现的?

    危中有机,大豆能否成为中国农业崛起的支点?

    给力!国产芯片助力全球首次实现手机个人全基因组测序分析

    优秀!这就是全球首部跑通WGS分析的国产手机!

    全球首个手机全基因测序分析成功了!开发团队的下场竟然是……



    请继续关注“华大科技BGITech”,

    科技君将一如既往为您提供精彩内容!

    如有相关问题,欢迎后台留言~~

    关注华大科技,尽享精彩科研!


    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存