查看原文
其他

百迈客Nanopore全长转录组实测数据汇总

百迈客 OxfordNanopore 2019-12-11

经授权全文转载自百迈客基因公众号


忽而今夏,恍若流年。不知不觉,从去年百迈客与Oxford Nanopore Technologies公司达成长期合作(百迈客与Oxford Nanopore公司合作-斥巨资引进Nanopore全测序平台)至今,已经整整一周年的时间。在这一年时间中,有过质疑,受过诋毁,但也因此迅速成长。Nanopore全长转录组的推广,在业界激起了千层浪。在这一年的时间中,小编见证了各个部门的积极全力配合,从生产到研发,投入大量的人力物力,一步一个脚印,不断更新优化流程,以更高、更新、更优的技术服务广大客户。

为了纪念Nanopore全长转录组面市一周年,请跟随小编的脚步,一起来看看这一年转录组方面的技术成果和实测数据吧!

质量篇

Nanopore在经过软件算法的更新升级后,对下机的raw data过滤短片段和低质量数据,其统计结果如下表所示:测序物种数据量在6G~20G左右,其N50在1500bp左右,测序的平均长度在1~2kb之间,平均质量值Q9以上。

表1  数据质量统计

 定量分析篇

01

饱和度统计

Nanopore平台融合了二代和三代的优势,其既可对转录本和基因进行定量分析,也能进行可变剪接等基因结构的鉴定。其中,能够准确定量的重要原因之一就是,测得的数据能够达到饱和。对于Nanopore全长转录组的不同测序数据量,我们均评估过其测序数据的饱和度。
在基因层面,无论是2G还是常规6G,对于二倍体来说,除极低丰度表达基因未达到饱和外,其他表达水平的基因均可以测得饱和,这与二代的数据饱和度相似。而对于多倍体生物,尤其是异源多倍体生物,若想让数据达到饱和,则需要加大数据量才能满足后续分析要求。实测数据饱和评估图如下。

图1 数据饱和度评估


02

不同物种转录丰富度

全球物种成千上万,进行科学研究的物种,也是多种多样,物种基因组大小由Mb到Gb不等。然而,不管基因组相差多少倍,从转录组水平,我们可以看出,差别都是在Mb级别。因此,对于常规二倍体来说,不管基因组多大,在2G左右测序数据量的情况下,除极低表达丰度的基因外,其他基因基本能达到饱和水平(实测数据如下图所示)。

表2 物种转录组丰富度统计

图2 不同物种饱和度统计

03

表达量分析

在这一年中,我们推出过不同测序数据量的Nanopore全长转录组测序,无论2G、4G还是6G的数据量,其基因层面表达量的相关性均在0.999以上,这表明从2G开始,定量结果不会随着数据量的增加而发生变化。同时ONT平台和Illumina平台在基因表达量上也具有高度的相关性,相关系数大于0.8。


图3 表达相关性统计


Nanopore除了和二代一样,能在基因层面进行定量外,还能对同一基因的不同转录本进行定量分析
众所周知,二代测序由于测序读长短,会存在多比对效率问题,尤其是对不同基因间存在的高度保守区域,短reads无法区分到底是来源于哪个基因,从而使得鉴定模糊,而长读长测序,由于其测序读长长,可以跨越5'端到3'端的全长转录本,从而使得多比对效率极低(与基因组多比对效率1%以下)。与此同时,二代测序由于测序片段短,且存在桥式扩增,会有GC含量和PCR碱基偏好性,在定量上并不能真实的反映转录本的表达情况。我们通过实测数据,将Nanopore与Illumina平台进行比较,发现Nanopore测序数据的GC含量偏好性要明显小于Illumina,因此,ONT平台可以更真实的反映生物体内转录本的表达情况,定量更为准确。

图4 利用二代与Nanopore平台组装全长转录本  (ONT官方白皮书)

图5 GC含量偏好性

04

差异表达分析

由于Nanopore可以定量,因此使用该技术,既可以找到差异表达基因(DEGs),也能鉴定差异表达转录本(DETs)。通过实测数据,我们将同一物种在不同平台的检测结果进行统计分析,发现其鉴定到的基因总数基本持平(2G ONT (20,990) vs. 6G Illumina (21,158)),而两个平台鉴定到的共同差异表达基因,其上下调关系完全一致。

表3 ONT与Illumina平台在相同数据量下差异表达基因鉴定

   基因结构篇   

01

转录本数量和种类的鉴定

通过实测项目可得,目前Nanopore全长率基本在70%以上,全长率较高,且过滤后的clean data与基因组比对效率高于80%,比对效果优于二代测序技术。


表4  不同物种全长转录本鉴定


此外,在某植物物种中,该物种同时做了Pacbio三代和ONT三代比较分析,通过测序数据发现,2G 的Nanopore测序技术鉴定到的转录本总数与20G的Pacbio鉴定的全长数量持平,经注释分析后,ONT平台鉴定到的已知基因数和新基因,其数据丰富度要高于Pacbio平台。


表5 ONT与PB平台鉴定全长转录本水平比较


02

基因结构准确鉴定

与二代相比,Nanopore全长转录组不仅可以鉴定可变剪接类型,同时还能将不同剪接类型的全长转录本呈现出来,这是二代所不能比拟的,其在可变剪接、融合基因等结构分析鉴定,更为精确和丰富。如下图所示,在鉴定可变剪接转录本方面,除了可以鉴定到基因组已知转录本,还能鉴定到很多新的转录本;同时数据统计可得,动物中可变剪接事件以外显子跳跃为主,植物中以内含子保留为主,该结果也符合前人已有报道。

图6 人基因结构鉴定

图7 可变剪接类型鉴定


值此Nanopore全长转录组一周年之际,为了回馈广大科研工作者,特推出暑期优惠活动:

邂逅夏天,清凉“价”到:

Nanopore 2G 全长转录组暑期相随!



我们的目标:

使任何人,在任何地点,

能对任何生物进行分析。


相关阅读:

NTT大会海报召集令

【邀请函】解锁测序新篇,NTT,中国十二时辰

Happy RNA Day! Nature 综述:RNA测序科技 | 7大纳米孔社区RNA&转录组突破

前瞻,Direct RNA 测序 | 我们可以做什么

【指南下载】为什么选择Nanopore cDNA 测序&如何开始 


网上订购:请浏览:https://store.nanoporetech.com/cn


NanoporeEvent服务号用于会议、讲座、资料下载,OxfordNanopore订阅号发布最新技术 、 科研、 资讯等。


媒体查询:media@nanoporetech.com

销售联系:微信号NanoporeMedia或tbray91ONT (Thomas)


如欲了解更多产品信息,请长按二维码关注我们


    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存