基因测序技术的原理和应用——第一代测序技术
第一代测序技术
1975年由Frederick Sanger所提出的链终止法以及1977年由Walter Gibert所发明的链降解法被称为第一代测序技术。
1977年,Walter Gilbert和Frederick Sanger发明了第一台测序仪,并应用其测定了第一个基因组序列,噬菌体X174,全长5375个碱基。Walter Gilbert和Frederick Sanger也因在测序技术中的贡献获得了1980年诺贝尔化学奖。
技术原理
目前,基于第一代测序技术的测序仪几乎都是采用Sanger提出的链终止法。
链终止法测序的核心原理是ddNTP的2'和3'端都不含羟基,因此在合成核酸链的过程中无法形成磷酸二酯键,从而导致DNA合成反应中断。
在测定待测核酸片段的序列时,向反应体系中加入一定比例的带有放射性同位素标记的4种ddNTP,利用DNA聚合酶来延伸结合在待测核酸模板上的引物,直到掺入一种链终止核苷酸为止,最终会得到一组长度各相差一个碱基的链终止产物,这些产物可通过高分辨率变性凝胶电泳分离并根据其长度排序,凝胶处理后可用X-光胶片放射自显影进行检测,从而确定目的核酸片段各个位置的碱基。
完整的测序过程分为4步:
1. DNA碎片化:
如要利用Sanger测序方法进行完整基因组的测定,首先要将提取得到的样品完整DNA打碎,形成DNA片段,如只是测定单个目的基因的序列,则无需进行DNA碎片化。
2. PCR扩增和体外克隆:
针对特定目的核酸片段的测序,首先要对目的测序区域进行PCR扩增;而针对碎片化DNA的测序,则要将碎片化的DNA片段通过克隆的方式连接到质粒载体中;对于部分PCR产物的测序也可以对其进行克隆,以保证测序样品的纯度和浓度。
3. ddNTP法循环测序:
向得到的待测样品中分别加入4种dNTP和4种ddNTP,从而得到不同位置匹配终止的序列。
4. 凝胶电泳获得序列:
对得到的序列进行凝胶电泳,根据碱基的顺序和位置确定序列信息。
第一代测序技术的优势和劣势
优势:
第一代测序技术的准确性远高于二、三代测序,因此被称为测序行业的“金标准”;
第一代测序每个反应可以得到700-1000bp的序列,序列长度高于二代测序;
第一代测序价格低廉,设备运行时间短,适用于低通量的快速研究项目。
劣势:
第一代测序技术一个反应只能得到一条序列,因此测序通量很低;
第一代测序技术虽然单个反应价格低廉,但是获得大量序列的成本很高。
第一代测序技术的应用
PCR产物测序:
对目的基因的PCR产物进行测序,得到目的基因序列;
重测序:
突变、SNPs、插入或缺失克隆产物的验证;
分型分析:
微生物和真菌分类学鉴定、HLA分型、病毒分型等;
临床应用:
肿瘤突变基因的检测和肿瘤个体化治疗,致病基因位点明确并且数量有限的单基因遗传病检测;
对新一代测序技术的结果进行验证。
第一代测序技术常见问题及解决方法
样品测序无信号
此时测序完全失败,最可能的原因是待测样品出现了降解或引物失效,从而导致测序引物与待测样品无法结合。
此时探索造成测序失败的具体原因并无实际意义,最快速、简便的办法是重新提供质量合格的引物和样品再次进行测序。
样品测序信号差
此种情况可能是引物或模板的质量不高或是引物和模板的匹配性不好引起的,但最有可能的原因是待测样品浓度偏低。
待测样品浓度偏低可能是由于PCR效率较低,也可能是PCR与测序间隔时间过长,导致PCR产物降解。建议PCR完成后尽快进行测序,如果PCR产物浓度本身较低,可以使用PCR产物作为模板进行二次PCR,也可以对PCR产物进行克隆后,再进行测序。
样品测序衰减
可能是由于待测样品包含特殊的核酸结构,如重复序列、回文结构、发卡结构、GC富集区、AT富集区等。
由于是样品本身结构问题,因此,无法通过优化测序反应解决,应从待测样品另一端进行反向测序,之后两端的测序结果拼接得到完整序列。
样品测序中断
此种情况是由于待测样品包含特殊高级结构,导致碱基无法与模板结合,DNA聚合酶无法继续延伸。
此情况与样品测序衰减解决办法相同,均为从待测样品另一端进行反向测序,经拼接后可以得到完整序列。
样品测序移码
测序从起始位置即发生移码是由于引物发生降解,应重新提供引物进行测序;
如测序过程中出现局部移码的现象,则可能是待测样品包含特殊高级结构,应当反向测序后拼接得到完整序列。
样品测序套峰
套峰细分的话有如下几种情形:
全双峰:
如样品为克隆后质粒,则质粒中含有多个引物结合位点;
如样品为PCR产物,则含有非特异性扩增。
前端双峰:
如样品为克隆后质粒,则其含有多个引物结合位点,并且其中一套模板出现测序中断的现象;
如样品为PCR产物,则PCR产物中含有多个引物结合位点,或者PCR产物中含有引物二聚体等小片段污染。
中间双峰:
如样品为克隆后质粒,则质粒并非单克隆;
如样品为PCR产物,则部分产物中具有碱基缺失现象,或目的基因为等位基因导致PCR产物自身不纯。
后端双峰:
如样品为克隆后质粒,则质粒并非单克隆;
如样品为PCR产物,则部分产物中具有碱基缺失现象。
解决办法:
针对二聚体及小片段干扰的情况,可以使用切胶回收的方法纯化PCR产物;
针对含有多个引物结合位点的情况,应当更换测序引物;
针对PCR产物出现碱基缺失的情况,可以使用克隆后测序以排除碱基缺失的产物;
针对非单克隆的情况,应在确认克隆无误的前提下重新挑取单克隆进行测序;
针对PCR产物含有非特异性扩增的情况,应优化PCR反应条件去除非特异性扩增,重新制备样品测序;
针对等位基因具有双模板的情况,应当采用克隆测序以保证单次测序样品序列一致。
样品测序底峰干扰
可能是由于测序引物不纯导致的,应当采用高纯度的引物 (PAGE级) 或重新提供引物进行测序。
图片来源:Shendure J, Ji, Hanlee. Next-generation DNA sequencing[J]. NATURE BIOTECHNOLOGY, 2008, 26(10):1135-1145.
写在后面:该篇文章并非完全原创,是多年前整理网络上相关文章而得,当时只是留作自学用途,但是由于时间较长,具体参考了那些文章已经忘记了,在此对这些文章的作者深表感谢!
高通量测序技术基础简介
基因测序技术的原理和应用
第一代测序技术
第二代测序技术
第三代测序技术
高通量测序技术的研究相关概念
基因组研究相关名词解释
转录调控研究相关名词解释
微生物群落谱研究相关名词解释
宏组学研究相关名词解释