高通量测序技术的原理和应用——第三代测序技术
第三代测序技术
以PacBio公司的SMRT技术和Oxford Nanopore Technologies公司的纳米孔单分子技术为代表的新一代测序技术被称为第三代测序技术,与前两代测序技术相比,其最大的特点就是单分子测序,测序过程无需进行PCR扩增,并且理论上可以测定无限长度的核酸序列。
PacBio技术平台
SMRT芯片是一种带有很多ZMW孔的厚度为100nm的金属片,将DNA聚合酶、待测序列和不同荧光标记的dNTP放入ZMW孔的底部。荧光标记的位置是磷酸基团,当一个dNTP被添加到合成链上的同时,它会进入ZMW孔的荧光信号检测区,根据荧光的种类就可以判定dNTP的种类,从而获得核酸的碱基序列信息。
PacBio平台测序原理
每个ZWM孔只允许一条DNA模板进入,DNA模板进入后,DNA聚合酶与模板结合,加入4种不同颜色荧光标记4种dNTP,其通过布朗运动随机进入检测区域并与聚合酶结合从而延伸模板,与模板匹配的碱基生成化学键的时间远远长于其他碱基停留的时间,因此统计荧光信号存在时间的长短,可区分匹配的碱基与游离碱基。通过统计4种荧光信号与时间的关系,即可测定DNA模板序列。
PacBio平台技术关键
DNA聚合酶,该技术得到的序列读长主要跟DNA聚合酶的活性有关,它主要受激光对其造成的损伤所影响。
荧光基团标记在核苷酸3'端磷酸上,在DNA合成过程中,3'端的磷酸键随着DNA链的延伸被断开,标记物被弃去,减少了DNA合成的空间位阻,维持DNA链连续合成,延长了测序读长。
ZMW (零模波导孔),将反应信号与周围游离碱基的强大荧光背景进行区分,在一个反应管中有许多这样的圆形纳米小孔,其外径仅有100nm,激光从底部打出后不能穿透小孔进入上方溶液区,能量被限制在一个小范围里,使得荧光信号仅来自这个小反应区域,孔外其它游离核苷酸单体依然留在黑暗中,从而实现将背景荧光降到最低。
PacBio平台技术优势
1. 近乎完美的一致性和准确性
三代测序单碱基错误率虽然很高,但是这种单碱基的错误是随机发生的,因此,对同一段序列测序覆盖多次就能够进行纠错,一般覆盖到10X以上的深度就能达到99.9%的正确率。
2. 不存在测序的偏好性
因为SMRT技术在样本制备时无需PCR扩增,对于某些具有极端的碱基组成的核酸区域,三代测序也是无偏好性的,同时也不受回文序列的影响。
3. 序列准确比对
二代测序得到的序列由于长度不够,在进行比对时,会出现很多错误匹配,从而造成假阳性SNP位点;而PacBio测序平台得到的序列能够较均匀的覆盖参考基因组,每个序列能够明确的比对到相应的区域,在避免假阳性的同时,得到更加准确的变异位点和类型。
PacBio技术的优缺点
PacBio技术的优点:
无需PCR扩增,不会人为的引入突变;
超长读长,平均读长可达到10Kb,最长读长可以达到40Kb;
覆盖均匀,无GC偏好性;
通过reads的自我矫正,10X以上准确率能够达到99.9%;
可以直接检测到甲基化信息,同步进行表观遗传学识别。
PacBio技术的缺点:
单条序列错误率较高,平均核苷酸准确性不到85%;
测序成本较贵。
PacBio技术的应用
基因组组装
利用PacBio测序平台,可以克服部分序列GC含量高或重复序列多等问题,更好的进行基因组详细描绘,从而进行精细的基因注释等研究。
PacBio测序平台不需要进行PCR扩增,因此可以减少基因组组装过程中的人为错误和偏差。
PacBio测序平台读长较长,因此相比二代测序拼接结果更为准确,同时可以利用其长片段来填补二代数据组装中产生的gap和连接contig为scaffold。
全长转录组测序
利用PacBio测序平台读长较长的特点,进行转录组测序可以直接得到转录本的全长序列,省去了二代测序的拼接过程,使得过程更为简便,结果更为准确。
甲基化分析
PacBio测序的技术原理可以直接检测到发生甲基化的核苷酸,因此可以在进行其它测序分析的同时完成DNA甲基化的分析。
Nanopore技术测序原理
将在某一面上含有一对电极的特殊脂质双分子层置于一个微孔之上,该双分子层中含有很多由α溶血素蛋白组成的纳米孔,并且每个纳米孔会结合一个核酸外切酶。
当DNA模板进入孔道时,孔道中的核酸外切酶会“抓住”DNA分子,顺序剪切掉穿过纳米孔道的DNA碱基,每一个碱基通过纳米孔时都会产生一个阻断,根据阻断电流的变化就能检测出相应碱基的种类,最终得出DNA分子的序列。
Nanopore技术的优缺点
Nanopore技术的优点:
可以检测结构变异和可变剪切;
能直接对RNA分子进行测序;
能对修饰过的碱基进行测序;
测序读长更长,可以达到150kb;
测序数据可以做到实时监控;
运行速度快。
Nanopore技术的缺点:
采用的是水解测序法,不能进行重复测序,因而无法达到一个满意的测序精确度。
Nanopore技术的应用
基因组组装
利用其测序长的特点,可以填补基因组中大片段的gap。
临床应用
对于临床实践,实时获取和分析DNA/RNA序列是一件很重要的事情,对于传统的高通量测序,做到这一点非常困难,但对于Nanopore技术平台,实现实时获取序列相对容易。
Nanopore技术平台体积小、易操作,其通过电流变化检测并识别碱基,这种设计允许用户在测序过程中根据实时结果做出一些判断,对于即时诊疗有重要意义。
基于Nanopore技术的测序平台获得序列时间相比于其它平台要短得多,因此更加适合于临床环境,使得医生能够快速获得检测结果。利用Nanopore技术平台从临床样品准备到发现致病菌只需要6小时,而完成胎儿非整倍体检查只需4小时,这些应用如果利用二代测序平台可能需要数天甚至数周时间。
甲基化分析
Nanopore测序技术可以检测四种胞嘧啶碱基修饰,分别为5-methycytosine、5-hydroxymethycytosine、5-formylcytosine和5-carboxylcytosine,检测准确率为92%-98%。
不同三代测序平台的比较
写在后面:该篇文章并非完全原创,其中部分内容是多年前整理网络上相关文章而得,当时只是留作自学用途,但是由于时间较长,具体参考了那些文章已经忘记了,在此对这些文章的作者深表感谢
高通量测序技术基础简介
基因测序技术的原理和应用
高通量测序技术的研究相关概念
基因组研究相关名词解释
转录调控研究相关名词解释
微生物群落谱研究相关名词解释
宏组学研究相关名词解释