转录组专题-可变剪接
定义
常见类型
研究方法
生物学意义
定义
可变剪接(英语:Alternative splicing;又称“选择性剪接”)是基因表达的方式。真核细胞的基因序列中,包含了内含子与外显子,两者交互穿插。其中内含子在基因转录成mRNA前体后会被RNA剪接体移除,剩下的外显子才是能够存在于成熟mRNA(之后再进一步转译成蛋白质)的片段。
一条未经剪接的RNA,含有的多种外显子被剪成的不同组合,可转译出不同的蛋白质。就能将同一基因中的外显子以不同的组合方式来表现,使一个基因在不同时间、不同环境中能够制造出不同的蛋白质(基因表达调控),可增加生理状况下系统的复杂性或适应性。
常见类型
1、外显子跳跃(Exon Skipping, ES)
2、内含子保留(Intron Retention, IR)
3、5'端可变剪接(Alternative 5' splice Site, A5SS)
4、3'端可变剪接(Alternative 3' splice Site, A3SS)
5、最后一个外显子可变剪接(Alternative Last Exon, ALE)
6、第一个外显子可变剪接(Alternative First Exon, AFE)
7、互斥可变外显子(Mutually Exclusive Exon)
(黄色方块表示内含子;蓝色方块表示外显子;折线表示发生剪接:方块上的折线表示正常剪接的位置,方块下的折线表示可变剪接的位置)
研究方法
1.基于EST(表达序列标签)数据
可以发现新的可变剪切位点,准确程度依赖于EST序列数据的质量,并且对于结果还要进行生物学的分析验证。
2.基于芯片技术
剪接连接点芯片技术和外显子芯片技术。
3.基于新一代测序技术
RNA-seq 定量更准确、可重复性更高、检测范围更广、分析更可靠。转录组高通量测序对于研究可变剪切和它的调节来说是一个强而有力的实验工具,但是同时必须要有特殊的分析方法和工具。RNA-Seq测序提供了深度的转录组数据,可以用于识别比对组之间差异的可变剪切事件。
主要步骤:
(1)从RNA-Seq数据内预测并构建出外显子与内含子结构序列,并识别出可变剪切模式;
(2)对每份样本数据出现的每类可变剪切模式进行可变剪切异构体的表达量计算,并在样本群体中进行比较;
(3)利用非参数检验方法计算组别之间存在的显著差异的可变剪切模式,并用FDR控制假阳性结果。
预测软件:
使用Cufflinks软件,与基因原有的剪接模型进行比较,对Mapped Data中的跨内含子Reads,进行新可变剪接事件预测。
使用SpliceGrapher软件对预测到新的可变剪接事件的基因做模式图,可以根据测序序列预测可变剪切模型,也可以用已知的基因注释文件生成可变剪切模型。
生物学意义
多肽序列的小变化可能改变配体结合,酶活性,变构调节以及蛋白质的定位。可变剪切会对细胞发育进程产生影响,包括性别决定、凋亡、轴突导向、细胞激活和收缩等。
许多疾病的发生往往也是由于可变剪切的错误调节引起的。有些剪接产物特异性表达于癌性组织,可以作为疾病的生物标记,也可以作为疾病治疗的靶目标。与疾病相关的几种典型剪接变异:
1.点突变:地中海贫血;
2.与疾病相关的短重复元件突变:Alport综合症;
3.单核苷酸多态性:阿兹海默症;
4.可变剪接产生蛋白质亚型的比例改变:神经退化性疾病;
5.剪接因子的缺失:脊髓型肌萎缩。
参考资料
1.维基百科:可变剪接;
2.赤云追月的博客:基因的可变剪切;
还有更多文章,请移步公众号阅读
如果你生信基本技能已经入门,需要提高自己,请关注上面的生信技能树,看我们是如何完善生信技能,成为一个生信全栈工程师。
如果你是初学者,请关注下面的生信菜鸟团,了解生信基础名词,概念,扎实的打好基础,争取早日入门。