查看原文
其他

美国FDA告诉你:RNA-Seq完胜表达谱芯片!

2017-05-23 赵青 华大科技BGITech

对于生物基因表达的相关研究,基于芯片的Microarry和基于测序的RNA-Seq是近十几年来最热的技术。基因表达定量对于科研的重要性不言自明,特别是在精准医疗火热的大背景下,监管决策需要严格的评估,且各利益相关者之间需要达成共识。


在此背景下,去年,由美国FDA( Food and Drug Administration美国食品药品监督管理局)领导的测序质量控制联盟(SEQC)发表了一篇综述文章[1],综合评估了RNA-Seq的技术表现。此文主要通过5个相互独立但在内容上又互补的SEQC项目(图1),分别评估了检测基因的数量、准确性、低丰度基因的准确性、可重现性和信息含量、不同技术间的兼容性等指标。(详见发现1~6)

总的来说,RNA测序优势更大,更广的检测范围、低表达基因有更高的敏感性,在可变剪切和基因融合检测更具优势。


图1 SEQC项目整体研究设计

A、基于标准样品的核心定量研究。在3个测序平台和11个实验室评估RNA测序的准确性、

可重现性和信息含量。华大基因作为主要参与机构。

B、500个神经母细胞瘤预后研究[2]。华大基因作为主要参与机构,发现1、2和3。

C、27种化学处理超过100只大鼠肝脏的毒理研究[3],发现4和5。

D、利用RNA-Seq构建最完整大鼠表达谱。

E、芯片与RNA测序数据是否可以通用?[4],发现6。

F、更多研究


发现1

检测基因数量:RNA-Seq是芯片的2倍以上[2](图1B)


RNA测序鉴定出超过48,000个基因,而芯片不到一半,仅约21,000个。RNA测序中,4.52%的reads为新发现的外显子和Junction。注释出48,415个基因、204,352个转录本和319,231个外显子和Junction(图2)。


图2 RNA测序注释结果

(a reads比对比例、b 注释出的基因、转录本和Junction)


发现2

检测差异表达基因数量:RNA-Seq是芯片的2倍左右[2]


RNA测序检测出21,315个差异表达基因,而芯片仅有测序的一半,11,688个(图3)。RNA测序独特检测出的差异表达基因高达11,715个,而芯片仅有测序的18%,2,088个。


图3 RNA测序和芯片差异表达基因鉴定数


发现3

转录本变异体差异表达检测数量,RNA-Seq是芯片的8倍[2]


一个基因有多种转录本变异体,表达情况有时就比较复杂有两种情况,(1)一个变异体差异表达,而另一个没有差异表达;(2)一个变异体上调,另一个下调。结果发现RNA测序在检测复杂转录本上比芯片更具优势。在RNA测序检测出的21,315个差异表达基因中,65.9%是情况1。这其中包含一些癌症基因,比如NF1和MDM4(图4)。RNA测序能鉴定出1,073个情况2的差异表达基因,而芯片只有129个(图5)。


图4 MDM4基因的转录变异体差异表达

(A S型转录本在ST4上调,B S型和FL型比值在ST4比值增高)


图5 癌症基因不同转录本差异表达检测的RNA测序和芯片比较

(A 根据注释情况、结构复杂性和蛋白编码能力分类,B 复杂调控的差异表达基因维恩图)


发现4

低丰度基因检测准确性,

RNA-Seq的qPCR验证率是芯片的5倍[3](图1C)


RNA测序在低丰度转录本检测上有更高的精确度。RNA测序比芯片在差异表达基因qPCR验证率上更优,93%比75%。分成高表达和低表达来看,两个平台在高表达的差异表达基因上与qPCR的一致性都很高,不过RNA-Seq更高一些,94%,芯片88%。但测序在低表达的基因qPCR验证率上远胜芯片,89%,而芯片仅有17%(图6)。


图6 不同丰度的差异表达基因, qPCR验证率的RNA测序和芯片比较


发现5

差异表达倍数准确性,RNA-Seq与qPCR相关性比芯片高14%[3](图1C)


差异表达倍数变化的响应上,RNA测序与qPCR相关性更好,R2=0.97,芯片相关性R2=0.85,高14%。在回归斜率上,RNA测序接近1,但芯片偏离1,向x轴倾斜(图7)。


图7  差异表达基因差异倍数与qPCR相关性的RNA测序和芯片比较


发现6

芯片与RNA测序数据是否可以通用?[4](图1E)


同样来自于SEQC/MAQC Consortium研究,标题为“An investigation of biomarkers derived from legacy microarray data for their utility in the RNA-seq era”(在RNA-seq时代,遗留的芯片数据产生的biomarker可用性调查)。

标题中毫不客气地指明这是RNA测序时代。测序取代芯片是必然的,然而在生物医学研究领域遗留了芯片提供的大量数据、预测模型和biomarker,这些是否可以直接用于RNA测序数据?文章利用两个大的临床数据集,498个神经母细胞瘤样品和175个急性骨髓性白血病样品,证实芯片和RNA测序数据biomarker研究是可以相互转移的(图8)。在即将到来的RNA测序时代,遗留下来的大量芯片数据持续可用于RNA测序数据。


图8 跨平台可转移性评估流程图


测序时代,您还在用表达谱芯片吗?


引用文献4标题来说,这是一个“RNA-seq era”(RNA测序时代)。

与基因芯片技术相比,RNA-Seq技术无需预先设计探针,即可对任意物种的任意细胞类型的转录本进行检测;能够提供更精确的数字化信号、更高的检测通量以及更广泛的检测范围。

过去测序价格昂贵,而近年来随着测序成本骤减,且数据质量和速度大大提升。再加上您以前做过的芯片数据可用于测序数据分析中,现在正是您做测序最好的时机。

选择我们,999元,15个工作日,含建库+测序20M clean reads +信息分析,我们等着您。


参考文献

[1] Xu J, Gong B, Wu L, et al. Comprehensive Assessments of RNA-seq by the SEQC Consortium: FDA-Led Efforts Advance Precision Medicine. Pharmaceutics. 2016 Mar 15;8(1). pii: E8.

[2] Zhang W, Yu Y, Hertwig F, et al. Comparison of RNA-seq and microarray-based models for clinical endpoint prediction. Genome Biology. 2015 Jun 25;16:133.

[3] Wang C, Gong B, Bushel PR, et alThe concordance between RNA-seq and microarray data depends on chemical treatment and transcript abundance. Nature Biotechnology2014 Sep;32(9):926-32.

[4] Su Z, Fang H, Hong H, et al. An investigation of biomarkers derived from legacy microarray data for their utility in the RNA-seq era. Genome Biology. 2014 Dec 3;15(12):523.





撰稿:赵    青

编辑:市场部



猜你喜欢

在这个看脸的时代,它一心一意做好“定量”

首篇文章发表!BGISEQ-500 RNA-Seq,不能错过的还有这些……

喜报!WGS首篇,BGISEQ-500平台第三篇文章发表!

BGISEQ-500 PE100测序数据,到EBI一键下载!

7分钟!轻松掌握qPCR验证RNA-Seq定量结果(附案例)

【新品】单细胞RNA-Seq测序服务重磅来袭


近期热文

可增加蛋白质可溶性!走心了ATP

用了就能变好看!Sequel转录组强势来袭

新观点∣癌细胞的能量源竟然是它!

看懂这4个W,带你走进label free的世界。

全能干细胞也有bug!

不了解单细胞分离的科研人员不是一个好司机

又双叒叕《Nature》封面——最强大麦基因组,华大助力!





请继续关注“华大科技BGITech”公众号,

科技君将一如既往地为您提供精彩内容!

如有相关问题,欢迎后台留言~~

关注华大科技,尽享精彩科研!

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存