7分钟!轻松掌握qPCR验证RNA-Seq定量结果(附案例)
做完RNA-Seq之后,往往要采用qPCR来验证二代测序的定量结果。作为经过千锤百炼的科技君,常年被各种qPCR验证的刁钻问题挑(nuè)战(dài),如何在众多有(biàn)趣(tài)的问题面前屹立不倒,最终成为一代“站神”?科技君现在就带你过关斩将,突破这8道问题,“一站到底”!
本文约2500字,阅读需7分钟。如需转载请后台留言取得授权。
突围战
1 什么是qPCR呢?
qPCR即实时荧光定量PCR,广泛用于基因表达研究,它是指在PCR反应体系中加入荧光基团,利用荧光信号累积实时监测整个PCR进程,最后通过标准曲线对待测模板进行定量分析的方法。图1 为qPCR的定量原理。
图1 qPCR定量原理
初始的DNA量越多,荧光达到某一值(阈值)时所需要的循环数越少;Log浓度与循环数呈线性关系,根据样品扩增达到阈值的循环数就可以计算出样品中所含的模板量。
2 qPCR定量方法的种类有哪些?
qPCR验证基因的表达水平通常有绝对定量和相对定量两种方法,见图2。其中绝对定量可以精确的计算初始反应的模板浓度,它是通过标准品进行定量;而相对定量则可以计算不同样本中目的基因表达量的差异,它是通过内标进行定量,内参基因的一般选择的是管家基因,例如β-actin、GAPDH等。例如肿瘤组织和正常组织相比,某个基因的表达量改变了多少倍,这个就是相对定量。使用qPCR验证差异表达基因,目前最多的还是相对定量。
图2 绝对定量和相对定量图示
3 qPCR验证RNA-Seq测序结果一般挑选多少个基因呢?
一般情况下,需要验证的基因的数目建议不低于20个。
4 qPCR实验怎么挑选验证的基因呢?
通过RNA-Seq测序找出的差异基因一般有成千上万个,验证的时候一般只需要验证目标基因。具体选择哪些基因,取决于做RNA-Seq的初衷,或者说您要解决的生物学问题,然后结合GO富集和KEGG富集的结果入手,看看您关注的基因是否存在表达量的差异。所以RNA-Seq测序得到的高通量的数据,不是所有的信息都可以用的上,最好可以结合生物学意义进行深入的研究。
超级战将
5 挑选基因的原则是什么呢?
建议选择表达量高、样本间表达差异倍数大的基因进行验证。选择很低表达量的基因进行qPCR验证时,出现与测序结果不符合的概率会上升。从图3我们可以看出,低表达量的基因,定量结果的重复性降低,也就是降低了准确度[1]。华大科技内部的测试结果也显示,低表达量的基因与qPCR之间的相关性会较低。 2014年Nature Review的一篇文章[2]提到,如果对低表达量基因感兴趣,建议在实验设计时一方面增加测序深度,以检测更多的基因;另一方面,尽量增加样品重复的个数。
如果把前10%和25%的高表达的基因去除的话,相关性逐渐变低,因此说明表达量越高的基因进行相关性分析,相关性系数也会越好。
6 qPCR验证与RNA-Seq测序结果不一致的原因是什么?
两种方法之间本身就存在差异,具体如下:
第一:两者实验上存在差异。qPCR选择的目的基因的扩增区域、扩增效率、qPCR试剂等原因均会影响最终的表达量结果;RNA-Seq测序可能存在的GC偏好等也会影响最终的表达量结果。
第二:数据分析上存在差异。由于RNA测序经历了建库、测序和信息分析等复杂的过程,各种参数的改变通常会造成结果的差异。从图4我们可以看出不同的数据库,最后检测到的基因和junction数目都不相同[1]。这也可以部分解释,有些老师用同样的数据,在不同公司进行分析,得出不同的结果。
图4 基因的鉴定和junction的发现
所以使用qPCR验证的RNA-Seq定量结果,由于两种技术本身的差异及表达量计算原理的差异,所以建议关注两种基因表达的检测结果变化趋势总体是不是一致,具体表达量的值及差异倍数数据作为参考。
7 RNA-Seq测序中,增加生物学重复个数和单个样本数据量对差异分析有没有作用呢?
毫无疑问,增加生物学重复个数和单个样品数据量,都可以改善定量的结果,
Robles JA的文章[3]可以解答我们的疑问。
表1 采用DESeq方法来检测生物学重复数量对差异表达的影响
随着生物学重复数(n)的增加,差异分析的假阳性率(FPR)变化不大,但真阳性率(TPR)在不断提高。即提高生物学重复数,差异表达基因的检测更加敏感。
表2 不同生物学重复数量和测序深度对TPR的影响
随着生物学重复数的增加,差异分析的真阳性率(TPR)在不断提高;而测序深度的提高对真阳性率(TPR)的提高没有生物学重复增加明显。
PS: 要获得全范围的转录本,对于人来说,大约需要200M的paired-end reads,也就是说如果是PE150测序,就需要60G数据量!![4]
终极站神
8 qPCR验证与RNA-Seq测序结果上下调不一致怎么办?
先检查是否存在以下这几种情况:样本对比关系弄反了、做验证的基因表达量偏低、没有用测序的样本来做验证等。这些都是比较常见的导致验证结果上下调不一致的原因。如果大部分基因都验证上了,只有少数基因不一致,那其实是很正常的现象。我们来看2015年BMC Genomics杂志的一篇RNA测序的文章[5]的验证结果,这篇文章中验证的58个基因,有50个qPCR和RNA-Seq测序结果一致,一致性是86.2%,这个结果对于杂志来说,通常是可以接受的。
图5 qPCR和RNA-Seq测序检测的差异基因的比较
如果以上问题都不存在,您挑选的基因全部都验证不一致,那就拿起电话打给测序公司吧,得看一下数据分析是不是有问题。
问答环节结束!作为有追求的“站神”,附送一篇2015年发表的转录组的文章的验证结果,供大家参考。
案例:转录组测序分析发现灿烂弧菌感染海参免疫通路相关基因[6] 本文主要验证的是转录组测序得到的36个免疫相关基因的表达水平。实验分3步走:
采用Primer5软件设计引物,β-actin基因作为内参基因;
进行qPCR的反应,实验完成之后进行溶解曲线分析来确定PCR反应的特异性;
目标基因的相对表达量采用2−∆∆Ct方法进行计算。
图6 22个抗病基因的RNA-Seq和qPCR的比较
图7 14个易感基因RNA-Seq和qPCR的比较
从图6和图7,我们可以看到35个上调和下调的基因的表达量是和转录组测序结果一致,只有PAR6-like基因是例外的,后续的研究需要进一步验证这些基因的功能。
参考文献:
[1]SEQC/MAQC-III Consortium. A comprehensive assessment of RNA-seq accuracy, reproducibility and information content by the Sequencing Quality Control Consortium. Nat Biotechnol. 2014 Sep;32(9):903-14.
[2]Sims D1, Sudbery I1, et al., Sequencing depth and coverage: key considerations in genomic analyses. Nat Rev Genet. 2014 Feb;15(2):121-32.
[3]Robles JA, Qureshi SE, et al., Efficient experimental design and analysis strategies for the detection of differential expression using RNA-Sequencing. BMC Genomics. 2012 Sep 17;13:484.
[4]Sonia Tarazona, Fernando García-Alcalde, et al., Differential expression in RNA-seq: A matter of depth. Genome Res. 2011 Dec; 21(12): 2213–2223.
[5]Zhang W, Chen J, et al., Comparative transcriptomic analysis of immune responses of the migratory locust, Locusta migratoria, to challenge by the fungal insect pathogen, Metarhizium acridum. BMC Genomics. 2015 Oct 26;16(1):867.
[6]Gao Q, Liao M, et al.,Transcriptome Analysis and Discovery of Genes Involved in Immune Pathways from Coelomocytes of Sea Cucumber (Apostichopus japonicus) after Vibrio splendidus Challenge. Int J Mol Sci. 2015 Jul 17;16(7):16347-77.
撰稿:王 艳
编辑:市场部
题图来自Pixabay
请继续关注“BGI华大科技”公众号,
科技君将一如既往地为你提供精彩内容!
▼
关注华大科技,尽享精彩科研!