《NGS攻略》之PCR-Free传
导语
上一期《NGS攻略》之Dup传,我们跟大家全面剖析了什么是Duplicate Reads (简称Dup),相信大家已经对Dup的产生有了全面清晰的认识。文库构建过程中的PCR和测序前荧光信号放大过程是Dup产生的其中两个原因,那为什么NGS需要做这两步生化反应呢?前者是因为用于NGS测序的核酸样本起始量通常为纳克至微克级别,需要借助PCR等扩增方法来提高文库产量,以满足测序上机装载量的需求,后者则是为了让荧光信号采集单元(DNA Nanoball 或Cluster)的荧光强度放大成百上千倍以便相机可以更容易的捕获荧光信号,提高信噪比(S/N)。但是PCR是把双刃剑,一方面解决了样本起始量低的问题并起到放大荧光信号的作用,另一方面却引入了扩增错误和偏向性,不能完美地呈现基因组序列真实面貌。那么今天我们给大家介绍一种基于NGS平台的全流程PCR-Free测序技术,并探讨其如何“呈现”基因组序列的“原貌”。
温馨提示:全文约4000字,阅读时长8分钟。
1、什么是PCR-Free?
2、PCR-Free有哪些优点?
3、如何实现“真正”的PCR-Free测序?
4、数据测评
NGS文库构建的核心步骤为:基因组打断-末端修复-加接头-PCR-测序前信号放大(如:MGI的make DNB过程,或者I公司生成Cluster的过程)。我们常说的PCR-Free建库,就是不需要PCR的建库过程,即加接头之后跳过PCR步骤,直接进入到测序前信号放大阶段(如下图1 所示)。事实上,这只能算是建库环节的PCR-Free。真正的PCR-Free,应是从建库到测序全流程均无文库扩增过程(例如单分子测序技术)或者无PCR扩增错误累积的测序技术(例如MGI的DNBseq)。
从建库到测序,PCR-Free的优点总结如下:
1.流程简单:
相对PCR建库,PCR-Free建库省去了PCR之前的连接产物QC、PCR、PCR纯化和PCR产物QC四个步骤,简化了文库构建的流程,也更易于自动化建库流程的搭建。以下图1中的MGI文库构建流程为例。
2.节约成本:
PCR建库过程,为尽量降低PCR引入的序列错误,通常需要使用价格昂贵的高保真PCR酶来尽量还原待测基因组的“原貌”。PCR-Free建库则省去了这笔花费,降低了建库成本。
3.无PCR Duplication:
没有了PCR步骤, PCR Duplication也自然就不存在了,虽然正常情况下PCR Duplication不是Duplicate reads产生的主要原因,但是仍可以减少Duplicate Reads,提高Unique Mapping Rate和有效数据利用率(如下表1)。
4.降低Error Rate:
如我们前面提到的,在正式开始测序反应前,PCR扩增主要分为文库构建PCR和测序前信号放大两大部分。
文库构建中的PCR反应受DNA聚合酶保真性、模板重复序列等因素影响,常伴有碱基错配、复制滑动等事件发生,导致转换、颠换、插入、缺失等类型的碱基序列复制错误。且因PCR过程只有第一个扩增循环是以原始DNA模板为参照进行序列复制,在后续的指数扩增过程中,都是以扩增子为模板进行进一步复制放大,那么一旦出现复制错误,这种错误就会一直累积叠加,越变越多。测试数据表明,PCR扩增更容易引入插入和缺失的复制错误,导致InDel测序Error Rate提高。PCR-Free则可避免此类复制错误的产生和累积,降低测序Error Rate。
测序前信号放大步骤若采用指数扩增的方法(如I公司的Bridge PCR生成Cluster过程),则会带来同样的Error Rate 及 Error Rate 的累积。由于单分子测序技术没有测序前信号放大步骤,可以算得上是真正的PCR free测序,然而后续测序过程中单分子测序的高错误率,给这类全流程PCR-Free测序技术的Error Rate大打折扣。DNBseq技术在测序前信号放大过程使用扩增错误率极低的DNA聚合酶进行线性等温滚环扩增,每次扩增都是以原始DNA模板为参照进行序列复制(即使有复制错误也很难累积,此技术降低了测序前信号放大阶段的Error Rate)可视为一种特殊的PCR Free测序,相比单分子测序技术,DNBseq技术的准确率更高,PCR-Free测序更具优势。
5.降低偏向性:
另一方面,对于DNA模板而言,有的二级结构复杂,有的热稳定性差异大,这些因素都会影响PCR扩增效率。因此,并非所有基因组片段都能在PCR扩增文库中得到同等体现,而是存在明显的扩增偏向性。采用PCR-Free则可有效避免这种由PCR扩增产生的偏向性。
图1 “PCR-free”建库 +“DNB seq”测序
如何在文库构建和测序前信号放大这两个关键环节获得“真正”的PCR-Free呢?现在通过图示(见下图2)向大家简单展示NGS领域两种主流PCR-Free建库及测序流程以及展示测序错误累积原理。
图2 两种类型PCR-Free测序错误累积示意图。
A)基于DNBseq技术的PCR-Free B)基于Cluster测序技术的PCR-Free
显而易见,基于DNBseq技术的PCR-Free测序不会在测序前信号放大阶段累积复制错误,而基于指数扩增-Cluster技术的PCR-Free测序则无法避免此类错误。因此,基于DNBseq技术的PCR-Free实现了从文库构建到测序过程中始终保持原始模板DNA的“原貌”,获得真正的PCR-Free数据。
既然PCR-Free测序方案已经选好,那么让我们用真实测评数据来一睹全流程PCR-Free测序的数据表现。
·对不同GC含量物种的适用性
MGI PCR-Free建库技术对不同GC含量物种的WGS测序均可适用,基因组覆盖均一性好。
图3 基于MGI PCR-Free建库技术,三种不同GC含量样本的基因组覆盖均一性比较。
(以100个碱基的大小为窗口,绘制GC含量分布图,越接近中间1.0标注线,表明覆盖深度越均一)
· 有效数据使用率
截取相当产量的raw base后进行过滤和比对分析。相比于其他平台,MGI PCR-Free文库产生的WGS数据具有更低的Duplication Rate和更高的Unique Mapping Rate,从而可获得更高的有效数据使用率。
表1基于不同平台的PCR-Free和PCR测序数据比较
说明:样本为人标准品NA12878
· 基因组覆盖度
MGI PCR-Free文库产生的WGS数据,与PCR文库相比,产生的WGS数据具有更高的基因组覆盖度,对启动子、高GC等区域覆盖更全面。
图4 MGI PCR-Free文库的数据在PUM3基因的高GC区域具有更高的覆盖度、更少的gap。
· InDel检测的精准度和灵敏度
MGI PCR-Free文库对NA12878 InDel的检测精准度和灵敏度分别高达99.4%和98.8%,优于其他平台同类文库结果。
图5:NA12878在不同平台的PCR-Free、 PCR文库对变异检测的精准度和灵敏度比较
· InDel检测的重复性
MGI PCR-Free文库三个重复的SNP和InDel检测一致性高达94%和85%,优于其他平台同类文库结果。
图6:NA12878在不同平台上三个重复PCR-Free文库的SNP和InDel检测一致性
想要了解更多?
欢迎关注ICG卫星会
基因组学技术与应用研讨会
线下注册名额大放送
长按二维码获取详情
参考文献:
[1] Mcinerney P, Adams P, Hadi M Z. Error Rate Comparison duringPolymerase Chain Reaction by DNA Polymerase. [J]. Molecular BiologyInternational, 2014, 2014:287430.
[2] Brodin, J. et al. PCR-induced transitions are the major source oferror in cleaned ultra-deep pyrosequencing data. PLoS One 8, e70388,doi:10.1371/journal. pone. 0070388 (2013)
[3] Aird D, Ross M G, Chen W S, et al.Analyzing and minimizing PCR amplification bias in Illumina sequencinglibraries[J]. Genome Biology, 2011, 12(2): R18.
[4] Costello M, Fleharty M, Abreu J, et al. Characterization andremediation of sample index swaps by non-redundant dual indexing on massivelyparallel sequencing platforms. BMC Genomics, 2018 May 8;19(1):332.
注1:部分图片来自网络,侵删。
注2:文章仅代表作者个人观点。
注3:N_T代表I公司的同类产品
往期精彩内容推荐
最新日程 | ICG卫星会之华大智造基因组学技术与应用研讨会即将开幕