查看原文
其他

找了好久的案例竟然都在这里! | 三代全长转录组(上)

2016-11-16 王艳 华大科技BGITech



说起最新的测序技术,

三代PacBio单分子测序技术是较为亮眼的一种。

随着该技术的不断成熟,

其也受到越来越多科研工作者的认可。

近几年关于三代测序全长转录组的文章不断增加,

很多文章都发表在SCI高影响因子的期刊上。

近期科技君对全长转录组应用的文章进行梳理归纳,

发现全长转录组发表的文章涉及七方面的应用,

今天科技君主要介绍三代全长转录组

在发现新的转录异构体、鉴定融合基因、

补充已注释基因组的基因注释结果三个方面的应用,

其它四个应用将在下期的微信中分享,敬请期待!




应用一
1全长转录组测序,可以发现新的转录异构体


案例1  三代单分子测序技术研究了人的转录本的结构(Nature Biotechnology, IF=43.113)


  • 2014年6月,第一次采用单分子测序技术研究人的全长转录组,样本为20个人体组织和器官的混合样本;

  • 通过三代测序得到了476,000个CCS序列,大部分的全长转录本的分子只有1.5kb, 5′端有轻微的丢失,但是内含子结构是被保留的;

  • 将这些序列与 GENCODE 序列进行比对,最后鉴定得到了约 14,000个转录异构体,其中有10%是前所未见的。

 
图1 转录本的结构分析结果展示


Sharon D, Tilgner H, et al. A single-molecule long-read survey of the human transcriptome. Nature biotechnology, 2013, 31(11): 1009-1014.



案例2 三代测序结合二代测序研究人的胚胎干细胞的转录异构体(PNAS, IF=9,423)


  • 尽管基于二代测序的RNA-Seq可以研究mRNA的表达情况,但是全长mRNA的转录异构体是没有办法捕获到。另外一方面,尽管三代测序读长很长,但是存在准确性差和通量低的问题;

  • 本文通过三代测序结合二代测序,鉴定了人的胚胎干细胞(hESC)的转录异构体。研究得到8,084个RefSeq注释的转录异构体,以及5,459个预测的转录异构体。通过IDP工具预测的转录异构体超过1/3是新的,其中的273个是由216个没有注释的基因位点转录而来;

  • 后续深入的研究发现,这些新的位点是只在多能性的细胞中表达,但是不在胎儿和成人的组织中表达。这些研究结果显示,尽管是研究透彻的人细胞系及组织,基因的发现离完成还是很远的。


 
图2  hESC样本中转录异构体的检测和预测


Au KF, Sebastiano V, Afshar PT, et al. Characterization of the human ESC transcriptome by hybrid sequencing. Proc Natl Acad Sci U S A. 2013 Dec 10;110(50).





应用二
2全长转录组测序,可以鉴定融合基因现象


案例3  三代测序结合二代测序鉴定乳腺癌融合基因(Nucleic Acids Research, IF=9,202)


  • 本文通过三代测序结合二代测序技术对乳腺癌细胞系进行了测序,并首次开发了IDP-fusion来检测融合基因并鉴定和定量融合转录本;

  • 采用IDP-fusion来检测MCF-7乳腺癌细胞系样本的Illumina和PacBio的数据,并和现有的数据进行比较,结果显示IDP-fusion软件有更高的精度和更低的假阳性率;

  • 结果显示IDP-fusion是揭示肿瘤发生过程中融合基因的有效工具。

 


图3 不同软件检测融合基因的精度比较


Weirather JL, Afshar PT, et al. Characterization of fusion genes and the significantly expressed fusion isoforms in breast cancer by hybrid sequencing. Nucleic Acids Res. 2015 Oct 15;43(18):e116. doi: 10.1093/nar/gkv562.


案例4  三代测序鉴定前列腺癌融合基因(Molecular and Cellular Endocrinology, IF=3.859)


  • 为了全面的研究RLN1和RLN2基因的转录本多样性,本文采用长的cDNA- Cap和SMRT测序技术对前列腺癌LNCaP细胞系进行测序;

  • 研究结果发现三代测序得到的CCS序列和GENCODE Version 19 注释的RLN1基因能够很好的匹配,但有趣的是,没有CCS比对到注释的RLN2基因;

  • 研究结果发现RLN2和RLN1间基因融合的现象,产生了两个新的融合转录本RLN1-RLN2-1和RLN1-RLN2-2。

 


图4 采用SMRT测序技术对LNCaP细胞系检测到的RLN1-RLN2融合基因


Tevz G, McGrath S, et al. Identification of a novel fusion transcript between human relaxin-1 (RLN1) and human relaxin-2 (RLN2) in prostate cancer. Mol Cell Endocrinol. 2016 Jan 15;420:159-68. 





应用三
3全长转录组测序,可以补充已注释基因组的注释结果


案例5  三代全长转录组测序发现鸡的新的基因和转录本(PLoS One, IF=3.057)


  • 通过对鸡的心脏样本进行了三代单分子测序,发现了在以前注释Ensembl数据库中没有的注释结果,其中新增注释9,221个,新基因539个;

  • 此次的研究成果将对依赖鸡参考基因组注释结果的研究者提供资源,并且希望该研究方法可以为想改善其它模式生物研究者提供帮助。

 


图5 发现了新的基因和转录本


Thomas S, Underwood JG, et al. Long-read sequencing of chicken transcripts and identification of new transcript isoforms. PLoS One. 2014 Apr 15;9(4):e94650. 


案例6 三代全长转录组测序改善小麦基因组注释结果 (BMC Genomics, IF= 3.867)


  • 分别取小麦颖果、开花后5天,15天和25天的谷粒样本,上述样本混合,采用PacBio平台进行测序,每个样本分别采用HiSeq2000平台进行测序;

  • 将三代测序得到的高质量的Reads比对到参考基因组,发现了13,162个已知基因、3,026个新基因,以及9,591个新转录本;

  • 结合4个籽粒发育时期的二代转录组数据,发现了6,030个基因在籽粒发育不同阶段中呈现表达差异,对后续研究发育过程奠定了重要的基础;

  • 找出了72个不同的小麦面筋蛋白基因的全长转录本,为小麦基因注释带来了重大提升。 



图6 高质量的FLNC reads和参考基因组比对的结果


Dong L, Liu H, et al. Single-molecule real-time transcript sequencing facilitates common wheat genome annotation and grain transcriptome research. BMC Genomics. 2015 Dec 9;16:1039. 



预告

上篇就先分享这6篇经典文献,科技君将在接下来的微信中,继续为大家分享全长转录组在鉴定组织特异性isoform及lncRNA、检测APA位点、辅助真核物种基因预测等方面的应用的文章,不见不散!


联系我们

如果您对产品有任何疑问,欢迎留言给科技君,或咨询当地科技代表,当然也可以通过如下方式联系我们:

电话:400-706-6615
邮箱:info@bgitechsolutions.com
网站:www.bgitechsolutions.com
地址:深圳市盐田区洪安三街21号华大综合园7栋,518083
*最终解释权归深圳华大基因股份有限公司所有。


撰稿:王    艳

编辑:市场部


猜你喜欢

关于全长转录组的8个问题,你都问对了吗?

基因行业上市公司Q3财报新看点!

这种消息怎么不早点告诉我?!

做研究疾病?就不要错过它

在最全的BGISEQ-500专题面前,我却被一个小游戏撩到了……



请继续关注“BGI华大科技”公众号,

科技君将一如既往地为您提供精彩内容!

如有相关问题,欢迎后台留言~~

关注华大科技,尽享精彩科研!

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存