基因组也在玩“P图”? 敢不敢做真实的自己!
“P过”的基因组,
到底好不好?
What?基因组也在玩“P图”?没错!在测序文库制备过程中,我们常通过聚合酶链式反应(PCR)来扩增随机的基因组片段,将微量的DNA大幅增加,以达到上机需求。然而,“P过”的基因组往往丧失了其真正的“颜值“,会带来某些不真实:
1、PCR常有一定的碱基错配发生。一般PCR错误频率为10-6[1]~0.06%[2],碱基错配将降低DNA序列复制的保真性。
2、PCR扩增偏向性会导致覆盖均一性差[3]。对于核酸模板而言,有的二级结构复杂,有的则热稳定性不好,这些因素都会影响PCR扩增效率。因此,并非所有基因组序列都能在PCR扩增文库中同等体现,而是存在明显的偏向性。
研究人员对由恶性疟原虫(基因组大小23Mb; GC含量19%),大肠杆菌(4.6Mb; GC含量51%)和球形红细菌(4.6Mb; GC含量69%)制备的等摩尔DNA混合物进行分析,GC含量的散点图基本上是从6%到90%GC平坦(图1a)。剪切DNA不会导致明显的偏斜(图1b),接头连接也不会导致明显偏移(图1c),从植被琼脂糖凝胶中切除较窄的片段也并未使基因组发生偏斜(图1d),然而,PCR循环后,GC出现偏向性(图1e)[3]。
图1 I平台建库过程中GC偏向性变化[3]
3、PCR扩增引入了大量易出错的InDel[4]。InDel在基因组中分布广泛、密度大、数目众多,就分布密度而言, 仅次于SNP。在人类基因组中, 平均密度为每7.2Kb包含一个InDel,所有序列多态性中有16%至25%是插入缺失[5]。InDel是一种常见的遗传变异形式,已被证明可导致或促成人类遗传疾病和癌症[6],例如孟德尔疾病[7]、急性早期白血病[8]、肺癌[9]、肌肉萎缩症[10]等。
当DNA两条链上的嘌呤嘧啶含量不平衡时会增加缺失发生的几率[11],序列中PolyA结构、 高GC含量的序列会增加复制滑移的几率, 而复制滑移会导致序列发生插入/缺失突变[12],而在这些区域中,PCR扩增会导致明显偏向性,引入大量易出错的InDel。PCR WGS 的InDel中,12%(380/3222)为低质量InDel,高质量InDel占比75%,而对于PCR-free WGS,低质量InDel仅为3%(86/2994),高质量InDel可达86%,这表明PCR-free文库构建可能是提高InDels准确性的一种可能的解决方案[4]。
图2 高质量、中等质量和低质量InDel在
不同建库方法的分布[4]
BGISEQ PCR-free WGS
是从建库到测序真正的PCR-free!
BGISEQ PCR-free WGS(人全基因组重测序)在文库构建过程中未进行PCR(聚合酶链式反应)扩增,从而避免了PCR错误和扩增偏向性的产生。且BGISEQ测序仪利用独特的DNA纳米球(DNB)技术,基于滚环复制(RCR)进行文库扩增,这种线性扩增可以避免常规PCR带来的错误累积,PCR-free建库 + DNB (DNA纳米球)核心测序技术,实现全方位PCR-free,为您还原最真实的全基因组序列。
图3 BGISEQ PCR WGS(a)和
BGISEQ PCR-free WGS(b)建库流程
快来感受“无P图”基因组的真正的“颜值”
○ 避免PCR错误
最大程度还原基因组原始序列信息;
○ 降低PCR扩增偏向性
出色覆盖高GC/AT含量区域、启动子和重复序列等PCR建库方法无法覆盖的区域[13];对低GC区域的覆盖度相比PCR建库提高了63%[14]。
表1 PCR和PCR-free覆盖偏向性比较[14]
标准品NA12878测序结果显示,BGISEQ PCR-free相对于不同测序平台、不同建库方法,GC均一性表现最佳。
图4 各平台PCR-free和PCR GC均一性比较
(以100个碱基的大小为窗口,绘制GC含量分布图,结果越接近中间1.0标注线,表明覆盖深度越均一)
○ 提高InDel检测的精准度和敏感度
在不同平台上,PCR-free WGS InDel精准度和敏感度可高达99%和95%,均比PCR WGS 高出5个百分点,PCR-free建库方法可明显提高InDel calling的准确性。
图5 各平台PCR-free和PCR变异精准度和敏感度比较
○ 无Index hopping担忧
对基于ExAmp(排他性扩增)的测序平台,容易发生index错误分配(index hopping)问题[15]。同时,由于PCR-free的文库起始量高,需要加入更多浓度的index,因此更容易发生index hopping问题,index hopping比例甚至可高达6%[16]。
图6 ExAmp平台PCR-free和PCR index hopping比例[15]
最近的研究表明,基于DNB技术的BGISEQ平台,即便是PCR-free文库,也可以在很大程度上将index污染最小化,与常规PCR文库类似,污染率平均约为0.0004%[17]。
表2 PCR-free 文库index污染比率[17]
【欲了解更多相关信息请点击☞ 样本总是“戴错帽子”?解读错配率趋于0的DNA纳米球技术 】
○ Duplicates低,可用数据量大
BGISEQ duplicate rate非常低(1.22%-1.95%),非BGISEQ平台即便是PCR-free建库,duplicates仍然较高(10%左右)。
图7 各平台PCR和PCR-free duplicate rate比较
【欲了解更多相关信息请点击☞ Duplicates | NGS帝国的Agent Smith】
BGISEQ PCR-free WGS,可降低PCR扩增偏向性,减少GC-bias,从而更全面的检测体细胞突变[18][19],因此也更适合肿瘤基因组的研究,助力精准医学。
超低价发布
4500元(建库+测序100G)
还原基因组最真实的“盛世美颜”!
华大科技
您的首选科技合作伙伴
详询请联系销售代表或拨打4007066615热线
【参考文献】:
[1] Mcinerney P, Adams P, Hadi M Z. Error Rate Comparison during Polymerase Chain Reaction by DNA Polymerase.[J]. Molecular Biology International, 2014, 2014:287430.
[2] Brodin, J. et al. PCR-induced transitions are the major source of error in cleaned ultra-deep pyrosequencing data. PLoS One 8, e70388, doi:10.1371/journal. pone. 0070388 (2013).
[3] Aird D, Ross M G, Chen W S, et al. Analyzing and minimizing PCR amplification bias in Illumina sequencing libraries[J]. Genome Biology, 2011, 12(2):R18.
[4] Han F, Wu Y, Narzisi G, et al. Reducing INDEL calling errors in whole genome and exome sequencing data[J]. Genome Medicine,6,10(2014-10-28), 2014, 6(10):89.
[5] Mills RE, Luttig CT, Larkins CE, Beauchamp A, Tsui C, Pittard WS, et al. An initial map of insertion and deletion (INDEL) variation in the human genome. Genome Res. 2006;16(9):1182–90.
[6] Hasan M S, Wu X, Zhang L. Performance evaluation of indel calling tools using real short-read data[J]. Human Genomics, 2015, 9(1):20.
[7] MacArthur DG, Tyler-Smith C. Loss-of-function variants in the genomes of healthy humans. Hum Mol Genet. 2010;19(R2):R125–R30.
[8] Paschka P, Marcucci G, Ruppert AS, Mrózek K, Chen H, Kittles RA, et al. Adverse prognostic significance of KIT mutations in adult acute myeloid leukemia with inv(16) and t(8; 21): a Cancer and Leukemia Group B Study. J Clin Oncol. 2006;24(24):3904–11.
[9] Sequist LV, Martins RG, Spigel D, Grunberg SM, Spira A, Jänne PA, et al. First-line gefitinib in patients with advanced non–small-cell lung cancer harboring somatic EGFR mutations. J Clin Oncol. 2008;26(15):2442–9.
[10] Ostertag EM, Kazazian Jr HH. Biology of mammalian L1 retrotransposons. Annu Rev Genet. 2001;35(1):501–38.
[11] Kondrashov A S, Rogozin I B. Context of deletions and insertions in human coding sequences[J]. Human Mutation, 2004, 23(2):177–185.
[12] Sjödin P, Bataillon T, Schierup MH (2010) Insertion and deletion processes in recent human history. PloS ONE, 5, e8650.
[13] Kozarewa I, Ning Z, Quail M A, et al. Amplification-free Illumina sequencing-library preparation facilitates improved mapping and assembly of (G+C)-biased genomes[J]. Nature Methods, 2009, 6(4):291-295.
[14] Ross M G, Russ C, Costello M, et al. Characterizing and measuring bias in sequence data[J]. Genome Biology, 2013, 14(5):R51.
[15] Illumina. Effects of Index Misassignment on Multiplexing and Downstream Analysis (white paper). 4 (2017). doi:10.1101/125724.
[16] Costello M, Fleharty M, Abreu J, et al. Characterization and remediation of sample index swaps by non-redundant dual indexing on massively parallel sequencing platforms. BMC Genomics, 2018 May 8;19(1):332.
[17] Li Q, Zhao X, Zhang W, et al. Reliable Multiplex Sequencing with Rare Index Mis-Assignment on DNB-Based NGS Platform. bioRxiv, 2018: 343137.
[18] Nakagawa H, Wardell C P, Furuta M, et al. Cancer whole-genome sequencing: present and future[J]. Oncogene, 2015, 34(49):5943-50.
[19] Craig D W, Nasser S, Corbett R, et al. A somatic reference standard for cancer genome sequencing[J]. Scientific Reports, 2016, 6:24607.
撰稿:郑小乐
编辑:市场部
第三届GCTA大会报名直通车👇
【近期推荐】
请继续关注“华大科技BGITech”公众号,
科技君将一如既往地为您提供精彩内容!
如有相关问题,欢迎后台留言~~
▼
关注华大科技,尽享精彩科研!