查看原文
其他

基因组也在玩“P图”? 敢不敢做真实的自己!

郑小乐 华大科技BGITech 2019-05-10


“P过”的基因组,

到底好不好?

What?基因组也在玩“P图”?没错!在测序文库制备过程中,我们常通过聚合酶链式反应(PCR)来扩增随机的基因组片段,将微量的DNA大幅增加,以达到上机需求。然而,“P过”的基因组往往丧失了其真正的“颜值“,会带来某些不真实:


1、PCR常有一定的碱基错配发生。一般PCR错误频率为10-6[1]~0.06%[2],碱基错配将降低DNA序列复制的保真性。

2、PCR扩增偏向性会导致覆盖均一性差[3]对于核酸模板而言,有的二级结构复杂,有的则热稳定性不好,这些因素都会影响PCR扩增效率。因此,并非所有基因组序列都能在PCR扩增文库中同等体现,而是存在明显的偏向性。


研究人员对由恶性疟原虫(基因组大小23Mb; GC含量19%),大肠杆菌(4.6Mb; GC含量51%)和球形红细菌(4.6Mb; GC含量69%)制备的等摩尔DNA混合物进行分析,GC含量的散点图基本上是从6%到90%GC平坦(图1a)。剪切DNA不会导致明显的偏斜(图1b),接头连接也不会导致明显偏移(图1c),从植被琼脂糖凝胶中切除较窄的片段也并未使基因组发生偏斜(图1d),然而,PCR循环后,GC出现偏向性(图1e)[3]


图1 I平台建库过程中GC偏向性变化[3]


3、PCR扩增引入了大量易出错的InDel[4]InDel在基因组中分布广泛、密度大、数目众多,就分布密度而言, 仅次于SNP。在人类基因组中, 平均密度为每7.2Kb包含一个InDel,所有序列多态性中有16%至25%是插入缺失[5]。InDel是一种常见的遗传变异形式,已被证明可导致或促成人类遗传疾病和癌症[6],例如孟德尔疾病[7]、急性早期白血病[8]、肺癌[9]、肌肉萎缩症[10]等。


当DNA两条链上的嘌呤嘧啶含量不平衡时会增加缺失发生的几率[11]序列中PolyA结构、 高GC含量的序列会增加复制滑移的几率, 而复制滑移会导致序列发生插入/缺失突变[12],而在这些区域中,PCR扩增会导致明显偏向性,引入大量易出错的InDel。PCR WGS 的InDel中,12%(380/3222)为低质量InDel,高质量InDel占比75%,而对于PCR-free WGS,低质量InDel仅为3%(86/2994),高质量InDel可达86%,这表明PCR-free文库构建可能是提高InDels准确性的一种可能的解决方案[4]


图2 高质量、中等质量和低质量InDel在

不同建库方法的分布[4]


BGISEQ PCR-free WGS

是从建库到测序真正的PCR-free!


BGISEQ PCR-free WGS(人全基因组重测序)在文库构建过程中未进行PCR(聚合酶链式反应)扩增,从而避免了PCR错误和扩增偏向性的产生。且BGISEQ测序仪利用独特的DNA纳米球(DNB)技术,基于滚环复制(RCR)进行文库扩增,这种线性扩增可以避免常规PCR带来的错误累积,PCR-free建库 + DNB (DNA纳米球)核心测序技术,实现全方位PCR-free,为您还原最真实的全基因组序列。


图3 BGISEQ PCR WGS(a)和

BGISEQ PCR-free WGS(b)建库流程


快来感受“无P图”基因组的真正的“颜值”


○ 避免PCR错误

最大程度还原基因组原始序列信息;

 

○ 降低PCR扩增偏向性

出色覆盖高GC/AT含量区域、启动子和重复序列等PCR建库方法无法覆盖的区域[13];对低GC区域的覆盖度相比PCR建库提高了63%[14]


表1 PCR和PCR-free覆盖偏向性比较[14]


标准品NA12878测序结果显示,BGISEQ PCR-free相对于不同测序平台、不同建库方法,GC均一性表现最佳。


图4 各平台PCR-free和PCR GC均一性比较

(以100个碱基的大小为窗口,绘制GC含量分布图,结果越接近中间1.0标注线,表明覆盖深度越均一)


○ 提高InDel检测的精准度和敏感度

在不同平台上,PCR-free WGS InDel精准度和敏感度可高达99%和95%,均比PCR WGS 高出5个百分点,PCR-free建库方法可明显提高InDel calling的准确性。


图5 各平台PCR-free和PCR变异精准度和敏感度比较


○ 无Index hopping担忧

对基于ExAmp(排他性扩增)的测序平台,容易发生index错误分配(index hopping)问题[15]。同时,由于PCR-free的文库起始量高,需要加入更多浓度的index,因此更容易发生index hopping问题,index hopping比例甚至可高达6%[16]


图6 ExAmp平台PCR-free和PCR index hopping比例[15]


最近的研究表明,基于DNB技术的BGISEQ平台,即便是PCR-free文库,也可以在很大程度上将index污染最小化,与常规PCR文库类似,污染率平均约为0.0004%[17]


表2 PCR-free 文库index污染比率[17]


欲了解更多相关信息请点击☞ 样本总是“戴错帽子”?解读错配率趋于0的DNA纳米球技术  】


○ Duplicates低,可用数据量大

BGISEQ duplicate rate非常低(1.22%-1.95%),非BGISEQ平台即便是PCR-free建库,duplicates仍然较高(10%左右)。


图7 各平台PCR和PCR-free duplicate rate比较


欲了解更多相关信息请点击☞ Duplicates | NGS帝国的Agent Smith


BGISEQ PCR-free WGS,可降低PCR扩增偏向性,减少GC-bias,从而更全面的检测体细胞突变[18][19],因此也更适合肿瘤基因组的研究,助力精准医学。




超低价发布

4500元(建库+测序100G)

还原基因组最真实的“盛世美颜”!



华大科技

您的首选科技合作伙伴

详询请联系销售代表或拨打4007066615热线


【参考文献】:

[1] Mcinerney P, Adams P, Hadi M Z. Error Rate Comparison during Polymerase Chain Reaction by DNA Polymerase.[J]. Molecular Biology International, 2014, 2014:287430.

[2] Brodin, J. et al. PCR-induced transitions are the major source of error in cleaned ultra-deep pyrosequencing data. PLoS One 8, e70388, doi:10.1371/journal. pone. 0070388 (2013).

[3] Aird D, Ross M G, Chen W S, et al. Analyzing and minimizing PCR amplification bias in Illumina sequencing libraries[J]. Genome Biology, 2011, 12(2):R18.

[4] Han F, Wu Y, Narzisi G, et al. Reducing INDEL calling errors in whole genome and exome sequencing data[J]. Genome Medicine,6,10(2014-10-28), 2014, 6(10):89.

[5] Mills RE, Luttig CT, Larkins CE, Beauchamp A, Tsui C, Pittard WS, et al. An initial map of insertion and deletion (INDEL) variation in the human genome. Genome Res. 2006;16(9):1182–90.

[6] Hasan M S, Wu X, Zhang L. Performance evaluation of indel calling tools using real short-read data[J]. Human Genomics, 2015, 9(1):20.

[7] MacArthur DG, Tyler-Smith C. Loss-of-function variants in the genomes of healthy humans. Hum Mol Genet. 2010;19(R2):R125–R30.

[8] Paschka P, Marcucci G, Ruppert AS, Mrózek K, Chen H, Kittles RA, et al. Adverse prognostic significance of KIT mutations in adult acute myeloid leukemia with inv(16) and t(8; 21): a Cancer and Leukemia Group B Study. J Clin Oncol. 2006;24(24):3904–11.

[9] Sequist LV, Martins RG, Spigel D, Grunberg SM, Spira A, Jänne PA, et al. First-line gefitinib in patients with advanced non–small-cell lung cancer harboring somatic EGFR mutations. J Clin Oncol. 2008;26(15):2442–9.

[10] Ostertag EM, Kazazian Jr HH. Biology of mammalian L1 retrotransposons. Annu Rev Genet. 2001;35(1):501–38.

[11] Kondrashov A S, Rogozin I B. Context of deletions and insertions in human coding sequences[J]. Human Mutation, 2004, 23(2):177–185.

[12] Sjödin P, Bataillon T, Schierup MH (2010) Insertion and deletion processes in recent human history. PloS ONE, 5, e8650.

[13] Kozarewa I, Ning Z, Quail M A, et al. Amplification-free Illumina sequencing-library preparation facilitates improved mapping and assembly of (G+C)-biased genomes[J]. Nature Methods, 2009, 6(4):291-295.

[14] Ross M G, Russ C, Costello M, et al. Characterizing and measuring bias in sequence data[J]. Genome Biology, 2013, 14(5):R51.

[15] Illumina. Effects of Index Misassignment on Multiplexing and Downstream Analysis (white paper). 4 (2017). doi:10.1101/125724.

[16] Costello M, Fleharty M, Abreu J, et al. Characterization and remediation of sample index swaps by non-redundant dual indexing on massively parallel sequencing platforms. BMC Genomics, 2018 May 8;19(1):332. 

[17] Li Q, Zhao X, Zhang W, et al. Reliable Multiplex Sequencing with Rare Index Mis-Assignment on DNB-Based NGS Platform. bioRxiv, 2018: 343137.

[18] Nakagawa H, Wardell C P, Furuta M, et al. Cancer whole-genome sequencing: present and future[J]. Oncogene, 2015, 34(49):5943-50.

[19] Craig D W, Nasser S, Corbett R, et al. A somatic reference standard for cancer genome sequencing[J]. Scientific Reports, 2016, 6:24607.



撰稿:郑小乐

编辑:市场部



第三届GCTA大会报名直通车👇



【近期推荐】

百元外显子,一网打尽才威武!

蛋白君在华大基因 | 蛋白标记定量分析科普版

知识付费?不,华大在线技术知识库,免费!

开学啦,和Dr. Tom一起玩转个性化分析!

Small RNA这样建库,定量更精准!




请继续关注“华大科技BGITech”公众号,

科技君将一如既往地为您提供精彩内容!

如有相关问题,欢迎后台留言~~

关注华大科技,尽享精彩科研!

文章已于修改

    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存