查看原文
其他

3+2经典汇总 | 全长转录组方案设计策略

武雅文 百迈客基因 2019-12-12

快速出文章,数据丰富不划水,全长转录组测序可以满足您的需求!今日我们总结了比较经典的全长转录组方案,下文以其中某个比较经典的为例(3代全长转录组+2代转录组测序),篇幅有限,更多方案详情及经典案例可以在下方给小编留言哦~~^_^

一,简介


全长转录组测序:利用三代测序平台对某一物种的mRNA进行测序研究,因其可直接获得从5’端到3’端的高质量转录组信息而称为全长转录组测序。全长转录组测序无需组装,直接获得单分子全长mRNA信息,同时可准确鉴定基因的可变剪接、APA、融合基因、基因家族和非编码RNA等信息。


二、二代和三代比较


三代测序由于其读长较长,对于转录本的结构相关分析具有优势,但是因为其成本较高,数据量并不能达到计算转录本表达量的目的,因此关于样本中表达量的差异比较还是需要借助二代测序。

而二代测序读长较短,许多和结构相关的测序解果并不准确或者不能分析,例如可变剪接、APA、融合基因、基因家族这类的分析,则需要三代测序结果来辅助研究。


三、研究应用方向


1. 基因结构的研究:可变剪接、APA[1]、融合基因、基因家族、lncRNA及其靶基因预测。

2. 完善基因组注释:对于做基因组组装研究的,可以做三代转录组测序辅助基因组注释,对于基因组注释结果不好的,同样也可以利用三代结果来完善注释。

3. 基因功能研究:要获得整个转录本全长,获得CDS区域以及这个转录本所能够编码的蛋白,则需要做RACE实验的,而RACE成功率低且价格贵,这时候可以通过三代测序获得全长,无需RACE实验。

4. 与蛋白组联合分析:构建完善的蛋白搜索库;可变剪接事件的相互验证。


四、经典方案设计策略


1. 三代全长(单个样本)+2代测序(单个样本)


以某个种类的动物或者植物,不同发育阶段的组织或者相同发育阶段的不同组织进行混样测序(混样建议不超过6个,混样太多需要加大数据量),混合好的样本分别进行三代全长测序、二代转录组测序,以二代数据对三代数据的结果进行矫正,以三代数据结果为重点分析讨论基因结构相关研究[2~3]。


2.三代全长+2代测序(多个二代测序样本)


和上一个经典方案比较,这个方案有了不同组织的表达量的分析,并且因为有三代的数据,可以更加准确的对不同isoforms进行分析,区别在于,如果仅仅是做了二代转录组测序,那么只能对基因表达量分析。通过这样的isoforms差异表达量分析结果,结合我们的功能注释分析,就可以找到和研究相关的一些基因了。更加丰富了文章的数据结果,对于转录本表达量的分析也更加准确[4~6]。

3. 三代全长(多个样本)+2代测序(多个样本)


这里的路线图大部分和第2个方案相同,不同的是,用多样本做三代全长,可以分析到不同样本中可变剪接的变化[7];或者通过通过Iso-seq技术手段研究少数近缘物种间的亲缘关系以及不同物种或亚种间的mRNA序列差异,挖掘明显受到正向选择或负向选择的基因[8]。


4. 三代全长+二代测序+蛋白/代谢/甲基化


 第4种方案呢,则是加上了其他组学,例如:分析DNA层面的甲基化修饰,可以分析表观修饰对AS的影响,也可利用三代的结果结合二代,准确分析关键转录本的表达量的变化情况[9];从转录本到蛋白的角度去联合分析,可以用转录组的结果构建蛋白库,如果是做了多个样本的三代全长,则还可以分析不同可变剪接形式所产生的蛋白丰度变化等等[10];而代谢是最接近表型的结果,转录组和代谢的联合分析思路当然也可以应用在这里。


5. 三代全长+全转录组测序

(或者挑其中的miRNA、lncRNA来做)


mRNA和非编码的联合分析我们已经熟知,当然如果再结合三代来做则数据更加丰富,且有三代作为结构上的参考定量结果更为准确,因此这样的联合分析思路也是一个不错的方案[9]。


五、数据量推荐和送样标准


单个组织测高丰度转录本:8G;

混合样本建议不超过6个:15G~20G;

样品类型:总RNA、组织样;

样品浓度:总RNA浓度≥  50 ng/ul;

样品体积:> 10 ul;

样品总量:总RNA用量> 10 ug ;

样品纯度:OD260/280≥1.8,OD260/230≥1.0,260nm处有正常峰值;

RNA完整性:总RNA的RIN值≥8.0,28S/18S≥1.5;图谱基线无上抬;5S峰正常。


延伸阅读

         ......


【参考文献】

[1] Abdel-Ghany S E, Michael H, Jacobi J L, et al. A survey of the sorghum transcriptome using single-molecule long reads:[J]. Nature Communications, 2016, 7:11706.

[2] Chen S Y, Deng F, Jia X, et al. A transcriptome atlas of rabbit revealed by PacBio single-molecule long-read sequencing[J]. Scientific Reports, 2017, 7(1):7648.

[3] Dong J, Wang Y, Liu Y, et al. SMRT sequencing of full-length transcriptome of flea beetle Agasicles hygrophila (Selman and Vogt)[J]. Scientific Reports, 2018, 8(1):2197.

[4] Wang B, Elizabeth T, Michael R, et al. Unveiling the complexity of the maize transcriptome by single-molecule long-read sequencing:[J]. Nature Communications, 2016, 7:11708.

[5] Dong L, Liu H, Zhang J, et al. Single-molecule real-time transcript sequencing facilitates common wheat genome annotation and grain transcriptome research[J]. Bmc Genomics, 2015, 16(1):1-13.

[6] Xu Z, Peters R J, Weirather J, et al. Full-length transcriptome sequences and splice variants obtained by a combination of sequencing platforms applied to different root tissues of Salvia miltiorrhiza and tanshinone biosynthesis[J]. Plant Journal, 2015, 82(6):951-961.

[7] Kuang Z, Boeke JD, Canzar S. The dynamic landscape of fission yeast meiosis alternative-splice isoforms[J]. Genome Research, 2017, 27(1):145-156.

[8] Ding N, Wang A, Zhang X, et al. Identification and analysis of glutathione S-transferase gene family in sweet potato reveal divergent GST -mediated networks in aboveground and underground tissues in response to abiotic stresses[J]. Bmc Plant Biology, 2017, 17(1):225.

[9] Wang M, Wang P, Liang F, et al. A global survey of alternative splicing in allopolyploid cotton: landscape, complexity and regulation.[J]. New Phytologist, 2018, 217(1):163.

[10] Zhu F, Chen M, Ye N, et al. Proteogenomic analysis reveals alternative splicing and translation as part of the abscisic acid response in Arabidopsis seedlings[J]. Plant Journal, 2017, 91(3):518-533.


    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存