查看原文
其他

最常出现的3个测序问题,就这样轻松解决!

肖正瑜 华大科技BGITech 2023-10-12

高通量测序技术加速了基因组学的发展,不过在测序过程中,相信不少人都会怀疑:我得到的信息是真实有效的吗?不可否认的是,采用传统技术进行测序,下列几个问题常常导致数据无法真实地反映基因组的情况,为研究带来困扰:


1

错误累积

采用PCR技术对DNA进行指数扩增,扩增过程中,由于难以避免的碱基错配等原因会得到错误的DNA序列。这些错误的DNA序列又作为复制模板,进行下一轮的扩增,使得这些错误不断累积。


2

易出现标签跳跃(Index hopping)

多个样本进行pooling测序时,需要加入index标签,将得到的数据与样本一一对应。基于ExAmp(排他性扩增)技术的测序平台,在pooling上机时,易出现index hopping情况,比例高达1%。对于PCR-free文库而言,该比例可高达6.5%[1]导致“张冠李戴”的现象发生。


3

引入重复序列(Duplicate reads)

双端reads同时比对到参考基因组上相同的起始和结束位置的序列称之为重复序列(Duplicate reads,下文缩写为Dup)。文库构建中的扩增、测序前的信号放大、测序过程中的光学过程等都会引入Dup。这些Dup并不能带来额外的基因组信息,反而会影响变异结果的准确性,降低数据的有效性。


这些问题有没有办法解决?



如何避免PCR扩增错误累积和index hopping?


首先可以确定的是,在DNBSEQ平台上,PCR扩增的错误几乎不会得到累积,这是为什么呢?


还记得DNA的半保留复制吗?每次扩增都以不同的DNA分子作为模板进行复制。而DNBSEQ平台基于独特的滚环扩增技术,每次扩增时都以同一个单链环状DNA分子为模板,使用保真性极高的聚合酶完成DNA片段的扩增。即便某次扩增时,某个位置发生了碱基错配,这个错误也不会继续累积,有效避免PCR扩增错误指数累积的问题。


图1 滚环扩增技术示意图


同样,在DNBSEQ平台上,当样品带有index时,index部分发生的PCR扩增错误一样不会累积,避免数据匹配到错误的样本上,解决index hopping问题。


图2 滚环扩增,发生的错误不会累积




如何降低Dup,提高数据准确性和有效性?


对随机挑选的DNBSEQ平台27,873个人重测序商业样本进行Dup率统计分析,Dup率平均值低至2.54%(图3)。相比在其他平台上测序,文库经过环化后在DNBSEQ平台上测序,Dup率更低(图4)。


超低Dup率意味着拿到的数据更加真实,有效数据占比更高。DNBSEQ平台采用DNBSEQTM 技术,主要从以下两个方面降低Dup率:


① 文库构建完成后,我们得到了无数条带有测序接头的双链DNA分子。DNBSEQ平台进行测序准备时,只环化双链DNA分子中的一条,另外一条则被核酸外切酶消化,不用于形成DNA纳米球,降低Dup率。


② DNA纳米球通过特殊蛋白质介导分子结合到“平坦”的芯片表面,酶、dNTP等反应原料在“平坦”的芯片表面的更新效率高,生化反应更加充分,各位点的信号强度相对平均,生化反应不完全的位点信号不会被反应充分的位点信号掩盖,大大降低光学Dup的发生几率。


图3 27,973个人重商业样本Dup率统计

 


图4 其他平台文库在DNBSEQ平台及其他平台上测序Dup率比较


PCR扩增错误不会被积累、不用担心样本之间发生数据污染、超低Dup、数据的有效性超高。最让人担心的3大测序问题,就这样被DNBSEQ平台轻松解决啦!如此优秀的平台,促销正在火热进行中,7.1-8.31送样,前200条lane超低尝鲜价,赶紧扫描下图二维码或点击文末“阅读原文”即刻报名,锁定优惠!




参考文献:[1] Costello M, Flehaty M, Abreu J, et al. Characterization and remediation of sample index swaps by non-redundant dual indexing on massively parallel sequencing platforms. BMC Genomics, 2018 May 8; 19(1):332.

近期热文

CNS三大主刊大满贯,华大自主平台助力发文600余篇!

全球科研人的优选!数据挖掘一键操作,只推荐它

3种RNA测序技术怎么选?Nature子刊综述讲明白了!

为了激活沉默基因,植物竟然做了这些!




请继续关注“华大科技BGITech”

科技君将持续为您提供精彩内容

如有问题,欢迎后台留言~~



点击“在看”,让更多人看到 

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存