新型冠状病毒疫情爆发以后,早期诊断成为控制疫情的关键,而荧光PCR技术成为首选的初筛检测手段。目前核酸检测率只有30-40%,使得检测试剂盒的灵敏度备受关注。本期推荐林镜中博士从引物探针设计的角度对试剂盒灵敏度的分析,以飨读者。
1、前言
新型冠状病毒疫情爆发以后,早期诊断成为控制疫情的关键,而荧光PCR技术成为首选的初筛检测手段。到目前为止已经有数家企业获得了新型冠状病毒荧光PCR检测试剂的临床注册批文,还有近百家企业开发了类似的产品。近期有诸多声音反映现有的新型冠状病毒荧光PCR检测试剂盒灵敏度较低,目前检出率只有30-40%,多次出现漏检的情况。业界对此进行了广泛的讨论,一个共识是造成检出率低,假阴性率高有很多原因,包括试剂盒的灵敏度、试剂盒原材料的质量、核酸提取的效率、仪器设备的质量、操作误差等,但是对试剂盒的灵敏度低的原因没有系统的分析。笔者认为,引物探针设计是决定试剂灵敏度的关键,设计上存在的问题是内在缺陷,很难通过优化试剂盒组分和调整实验条件来得到显著改善。
早期诊断的灵敏度事关新型冠状病毒疫情防控的成败,同时今后将有一大批企业申报该产品的注册批文,最终推向检测市场,对人民健康产生深远的影响。疫情爆发后,世界卫生组织(WHO)发表了多个国家设计的新型冠状病毒荧光PCR引物探针序列。笔者常年从事分子检测试剂的研究开发,特别是荧光PCR技术。新型冠状病毒疫情爆发后,我们也进行了相关产品的研发,我们发现WHO发布的来自不同国家的引物探针设计,有些存在比较明显的缺陷。本文以美国CDC设计的N基因引物探针为例,论述Taqman荧光PCR引物和探针设计的基本原则,并提出一些建议,供同行们参考,避免走弯路,浪费资源,也算是为抗击疫情尽一份力量。
任何技术都有优缺点,站在不同的角度,侧重点不一样,或者使用的参数或算法或软件不一样,结论也可能各有所异。理论分析毕竟与临床样本检验的结果不可同日而语。产品的灵敏度最终都得经过临床试验,达到注册检验要求为标准。文中观点难免偏颇,欢迎批评指正。
二、Taqman探针法荧光PCR的基本原理
实时荧光PCR是一种实时监控特定核酸目标序列PCR扩增的技术。Taqman探针法是实时荧光PCR中应用最广泛的技术。它的基本原理是在反应中加入一对特异的引物及一条经荧光标记的Taqman探针,探针的5’端用报告荧光基团标记,3’端用淬灭荧光基团标记。在探针完整时,由于荧光共振能量转移(FRET)的作用,报告基团的荧光被淬灭基团吸收发出不同于仪器收集波长的荧光,不能检测到扩增信号,因此探针必须依赖Taq酶的5’-3’的外切活性,在引物结合到模板后随着合成双链的进程,将已经与模板结合成双链的探针切割,使报告荧光基团脱离淬灭基团的屏蔽而发出仪器应检测的荧光信号。常用的报告基团包括HEX、FAM、ROX、JOE、VIC等,淬灭基团包括TAMRA、BHQ等。
三、Taqman探针法荧光PCR引物探针的设计
一些最基本的原则可以参考美国ABI(赛默飞)的PrimerExpress 3.0指南(表1)。
表1:Taqman荧光PCR探针和引物设计指南(PrimerExpress 3.0, ABI)
根据我们的经验,最重要的参数包括引物探针的位置、Tm值、发夹结构、二聚体。以下以WHO发表的美国CDC的N基因引物探针(表2)为例加以详细论述。
表2: 美国CDC设计的引物探针序列
01
引物探针的位置
引物探针的设计原则中,最重要的是要避免假阴性(漏检),同时保证特异性(避免假阳性),所以要选择组内(需要检出的序列)保守(即尽量避开突变或采用简并序列)、组间(对照序列)特异的区域。此外,为了获得最佳的扩增效果,还应尽量满足表1中的基本要求。
用SARS和蝙蝠CoV的N基因序列作为对照,对新型冠状病毒的N基因序列排序,从图1、2、3中可见,在美国CDC的设计中,除了第二套的上游引物不特异外,其余探针和引物的位置都是选择了组内保守组间特异的区域。第二套的探针和下游引物都是在特异的区域,所以也不会产生非特异的扩增。
图1:美国CDC 2019-nCoV 第一套引物探针位置
图2:美国CDC 2019-nCoV 第二套引物探针位置
图3:美国CDC 2019-nCoV 第三套引物探针位置
第三套设计的探针N3P对2019-nCoV不特异(可同时结合到蝙蝠CoV),5’端第二个位置设置为Y即T/C简并,恰恰不能区分新型冠状病毒、蝙蝠冠状病毒和SARS病毒。但是上下游引物均为2019-nCoV特异,可能不会产生非特异性(假阳性)扩增。
02
Tm值
Taqman探针法荧光PCR通常采用二步法,即在94℃左右变性,60℃退火和延伸。所以,通常引物的Tm值设计在60±2℃,探针在70±2℃。
图4: 美国第一套设计的Tm值
图5:USCDC N基因第二套Tm值
图6a: USCDC N基因第三套Tm值,探针5’端第二个序列为C
图6b: USCDC N基因第三套Tm值,探针5’端第二个序列为T
从图4、5、6中可见,这三套设计中的Tm值基本符合表1中的要求。第三套的探针N3P 5’端第二个序列设计为Y(T/C简并),此处为C时(图6a),探针N3P的Tm值略高,但通过优化应该不会成为主要问题。
03
引物和探针的发夹结构
稳定的二级结构(二聚体或发夹)降低引物探针利用效率的重要因素,特别是探针的发夹,容易造成探针利用率降低,从而使荧光信号偏低,影响检测灵敏度。通常应控制发夹的dG≥-1.0 (注:dG是一个用于衡量裂解二聚体或发夹所需要能量的参数,二级结构越稳定,裂解所需的能量越多,dG越小)。
采用DNA Star软件对美国CDC设计的三套引物探针的发夹结构进行分析,结果(图7)发现,第一套的下游引物N1R具有一个稳定的发夹结构(dG=-2.3kc/m),第三套的探针N3P具有一个稍微稳定的发夹结构(dG=-1.3kc/m),其余引物和探针均没有稳定的发夹。
图7:USCDC引物和探针的发夹结构
04
二聚体
设计时通常将二聚体(自身二聚体或配对二聚体)控制在dG>-5.0kc/m, 最好dG>-3.6 kc/m。从图8显示的三套引物探针的自身二聚体可见,第二套的探针具有一个非常稳定的自身二聚体(dG=-13.1kc/m),第二套的上游引物N2F有一个稳定的自身二聚体(dG=-9.3kc/m),第三套下游引物具有一个比较稳定的自身二聚体(dG=-7.0kc/m)。
图9显示,美国CDC的第二套引物探针具有比较稳定的配对二聚体(dG=-9.0kc/m)。图10显示第三套有两个比较稳定的配对二聚体(dG=-10.1kc/m)。
图8:美国CDC基因引物和探针的自身二聚体
此外,当采用一管多检(多重PCR)时,即一管同时检测多个位点或多种病菌时,还要考虑不同位点之间的引物探针的配对二聚体。例如第一套和第二套组合时(图11),第一套的正向引物和第二套的探针有一个相对稳定的配对二聚体(dG=-8.3kc/m)。第一套和第三套组合时(图12),第一套的探针和第三套的正向引物有一个稳定的二聚体(dG=-12.2kc/m)。第二套和第三套组合时,第二套的上游引物和第三套的上、下游引物各有一个比较稳定的二聚体(dG=-7.0kc/m图13)。
图11:美国CDC N基因第一套和第二套配对二聚体
图12:美国CDC N基因第一套和第三套配对二聚体
图13:美国CDC N基因第二套和第三套配对二聚体
综上所述,美国CDC设计的三套引物探针,位置的选择及Tm值的设计均比较合理,但是二级结构比较稳定。第一套的反向引物N1R存在一个非常稳定的发夹(dG=-2.3kc/m,图7)。第二套探针的自身二聚体非常稳定(dG=-13.1kc/m,图8),上游引物自身二聚体也比较稳定(dG=-9.3kc/m,,图8),比较稳定的配对二聚体比较多(dG=-6.8 ~ 9.0kc/m,图9),引物和探针的利用效率会比较低。第三套探针N3P具有一个相对稳定的发夹(dG=-1.3kc/m,图7),探针和引物值均有相对稳定的配对二聚体(图10)。
四、结果的判断
美国CDC提出对结果的判断意见,认为只有当三个位点同时扩增曲线超过域值才能判断为阳性(如图11)。
笔者认为这种判别是没有理论依据的。Taqman探针法荧光PCR除一对特异的引物以外还有一条特异的探针,基于设计的非特异性扩增的理论概率是非常小的。在新型冠状病毒检测中,以美国CDC的第一套引物探针为例,从图1可见,上游引物处SARS病毒有一个3-bp的插入,是不可能扩增的,蝙蝠病毒在上游引物有4个突变,探针有1个突变,下游引物有5个突变,理论上由于错配检测出最接近的蝙蝠序列(假阳性)的概率为(1/4)10=9.5367x10-7。如果出现假阳性,最大可能性是交叉污染或气溶胶污染。正确的判断应该是,上述三个位点至少一个位点的扩增曲线超过了域值,即可判断病例为阳性。目前市场上常见的荧光PCR检测试剂大多数也只使用一个位点。
五、结论和建议
引物探针的设计原则中,最重要的是要避免假阴性(漏检),同时保证特异性(避免假阳性),所以要选择组内(需要检出的序列)保守(即尽量避开突变或采用简并序列)、组间(对照序列)特异的区域,同时尽可能提高反应中引物和探针的利用效率。笔者认为参数的重要性依次是引物探针的位置、探针的发夹结构、探针对上游引物的相对位置、Tm值、引物发夹、二聚体。
笔者对WHO发表的来自七个国家设计的引物探针进行了详细分析,发现均存在一定的缺陷,有些缺陷比较明显,主要体现在:
1) 不特异(德国的E基因、香港大学Orf1b基因);
2) 探针的发夹结构稳定(中国CDC Orf1ab基因的探针、德国的SARS RdRP基因探针P1、香港大学N基因的探针);
3) 引物和探针的相对位置不合理(中国CDC的N基因、德国的E基因、香港大学的Orf1b基因及E基因(设计在反链上)、日本的N基因);
4) Tm值不合理(中国CDC的N基因及Orf1ab基因、德国的SARS RdRP基因及E基因、香港大学的Orf1b基因及N基因、日本的N基因、泰国的N基因);
5) 引物的发夹结构稳定(美国CDC N基因第一套的反向引物、香港大学Orf1b基因的正向及反向引物、香港大学N基因的正向引物);
6) 引物探针的自身二聚体稳定(中国CDC Orf1ab基因反向引物、美国CDC的N基因第二套的探针N2P、德国的E基因探针P1、香港大学的N基因正向引物及探针);
7) 引物探针的配对二聚体稳定(中国CDC的N基因、美国N基因第二和第三套、德国的E基因)。
笔者认为存在稳定的发夹结构的探针基本不可以用。探针离上游引物太远的扩增效率低,很难通过优化来提高效率,应该尽可能避免。其他二级结构可能通过添加PCR促进剂或加入过量的组分(引物探针、Taq酶等)得到改善,Tm值不理想可以通过调整退火和延伸的温度,但是象以上一些设计的引物和探针Tm值几乎一样,是不合理的,应该避免。
实际上,新型冠状病毒的基因组与最接近的蝙蝠冠状病毒的差异达到4%,与SARS病毒的差异达到20%,而目前的数据显示武汉新型冠状病毒内部的差异非常小,约为十万分之三(3.3x10-5),在基因组中或在N基因及Orf1ab基因中均有很多区域可以设计特异的、高效率的引物探针用于荧光PCR检测试剂的开发应用。
磨刀不误砍柴工,在科学技术面前没有真正的捷径可走。科学地设计引物探针是开发荧光PCR检测试剂的基础,是保证试剂盒灵敏度及特异性最基本的要素。为了避免走弯路,浪费资源,建议行业内的厂家,严格按照荧光PCR技术引物探针设计的原则开发新型冠状病毒荧光PCR检测试剂。
作者简介:林镜中,加拿大多伦多大学博士,美国加州大学博士后。深圳市海外高层次B类人才。现任深圳市赛格诺生物科技有限公司首席科学家/总经理。曾任深圳市太太基因工程有限公司创始人/总经理,美国Lynx医药公司高级研究员。
供稿、编辑:弋水 | 校对:Bonnie | 责编:孙旭光