查看原文
其他

Sci Adv︱王泽峰/汪洋团队发现癌症中普遍存在一种全新的长度依赖性异常剪接模式

张思蕊 岚翰生命科学 2023-03-10

撰文︱张思蕊

责编︱王思珍,方以一

编辑︱方以一


人类基因组90%以上的基因都需要经历可变剪接(Alternative Splicing, AS),通过RNA的可变剪接,单个基因能够产生多个转录本,是蛋白组学多样性的主要原因[1]。可变剪接受到多种顺式调控元件和反式作用因子的严格调控,而其错误调控会导致多种人类疾病,尤其是癌症[2,3]。越来越多的证据表明,RNA剪接异常与人类癌症密切相关,广泛的剪接失调是癌症的分子标志之一[4,5]因此,系统性的研究癌症中可变剪接异常调控将为癌症治疗提供新的思路。


随着高通量测序技术的发展,利用大规模的转录组数据对癌症中的异常可变剪接进行系统性分析成为了研究癌症中剪接调控的重要方法,尤其是对TCGA(The Cancer Genome Atlas)数据库中的海量癌症组学数据进行深度挖掘[6]。之前已经有很多研究工作通过对TCGA数据的深度挖掘发现了一些基因突变或错误调节的剪接因子可作为致癌基因或肿瘤抑制因子[7-9]。然而,仍缺乏对癌症中异常剪接调控的共性研究。


2022年8月17日,中国科学院上海营养与健康研究所王泽峰课题组和大连医科大学肿瘤干细胞研究院汪洋课题组合作在Science Advances杂志上发表了题为A widespread length dependent splicing dysregulation in cancer的研究论文。该研究发现了在癌症普遍存在一种全新的长度依赖性选择性剪接异常调控模式。

 


该研究首先对TCGA数据库中大规模的癌症转录组数据进行了系统性分析,在18种癌症类型中鉴定出了每种癌症中发生异常剪接的外显子。研究人员发现在不同类型的癌症中均有一个普遍的特征,即癌症中发生异常剪接的外显子长度均偏向于更短,并且这些短外显子在癌症中更倾向于被跳过(图1)从癌症中剪接异常的外显子长度分布中看出,在60nt处,癌症相关的外显子与所有人类外显子的长度差异达到了最大值,故研究人员以60nt作为阈值,共筛选出了494个癌症相关的短外显子(cancer-associated short exons,CASE),并进行了进一步的深入研究。


图1 CASE鉴定流程

(图源:Zhang S et al., Sci Adv, 2022)


通过对CASE的序列及功能特征分析,研究人员发现CASE两侧的内含子长度较长,剪接位点强度较弱,具有更强的保守性且其上下游序列中富集着一些短的基序可能作为剪接调控元件参与CASE的剪接调控。和其他外显子相比,CASE更倾向于维持原有的读码框, 且功能富集在ATP酶活性相关的基因中。


研究人员利用CASE的剪接开发了一个用于癌症预测的随机森林模型,可以对癌症样本进行准确的预测,在TCGA数据中模型的AUC可达到0.9左右。研究人员还在不同人群的癌症样本中测试此机器学习模型,AUC仍可达到0.88左右,表明CASE具有很强的癌症预测作用此外,该研究还发现与较长的外显子相比,CASE的剪接与癌症病人的预后更为相关,并提出了一种利用CASE剪接计算risk factor的方法来预测癌症病人的预后,在TCGA数据集及其他独立癌症数据集中均具有较好的预测结果(图2)

 

图2 利用CASE剪接预测癌症病人的预后

(图源:Zhang S et al., Sci Adv, 2022)


在机制的研究上,该研究提出了两种影响CASE剪接的机制。首先,由于癌症中癌细胞快速地生长增殖需要更快的转录过程,所以癌症中异常的转录可能会对剪接产生影响。研究人员通过对具有不同转录延伸速度的细胞系中可变剪接的分析发现短的外显子对速度的变化更为敏感,更容易受到转录速度变化的扰动而发生外显子的跳跃,并通过甲基化位点分析、新生RNA测序分析以及实验验证证明了异常的转录对CASE剪接具有重要的调控作用(图3)

 

图3 异常的转录速率影响CASE剪接

(图源:Zhang S et al., Sci Adv, 2022)


转录对剪接的影响是广泛的无选择性的,该研究进一步发现特定的短外显子在癌症中发生跳跃是受到多种剪接因子的调控。通过分析ENCODE数据库中大量RNA结合蛋白(RNA binding protein, RBP)基因敲除的RNA测序结果以及这些RBP结合位点的eCLIP-seq数据,研究人员建立了RBP对CASE剪接的直接调控网络,并鉴定出了多个调控CASE剪接的RBP,包括RBFOX2,AQR,U2AF2和PTBP1(图4)由于CASE上下游的内含子中富集着这些RNA结合蛋白的结合基序,这些结合蛋白对CASE具有更为特别的调控作用。

 

图4 RBP对CASE的调控网络

(图源:Zhang S et al., Sci Adv, 2022)


文章结论与讨论,(未来)启发与展望
综上所述,该研究首次发现了癌症中的长度依赖性的剪接调控模式,根据此调控模式建立了用于癌症诊断和预后预测的机器学习模型,为癌症中可变剪接异常调控研究提供了新的思路。由于癌症相关的短外显子(CASE)长度较短的特性,在临床检测上更加简单且可信,所以此研究对癌症的精准诊断与治疗具有极大的应用价值。然而,癌症中选择性剪接的异常调控是非常复杂的,对于长度依赖性的剪接失调具体机制还需要更进一步的研究。


原文链接:https://www.science.org/doi/10.1126/sciadv.abn9232


中国科学院上海营养与健康研究所王泽峰和大连医科大学肿瘤干细胞研究院汪洋为该论文的共同通讯作者,中国科学院上海营养与健康研究所张思蕊博士为该论文的第一作者。本研究主要受自然基金委的重点项目资助。


第一作者:张思蕊(左);通讯作者:汪洋(中)、王泽峰(右)

(照片提供自:王泽峰/汪洋团队)


往期文章精选

【1】Autophagy︱杨倩课题组揭示转录因子TFEB入核调控新机制

【2】Cell Death Discov 综述︱刘晓丹团队总结坏死性凋亡对慢性阻塞性肺病气流受限的影响

【3】Cell Death Differ︱夏晓波团队首次揭示“铁死亡”与青光眼发病机制之间的相互关系

【4】J Exp Med︱蒋典华团队揭示HER2是调控肺成纤维细胞侵袭和肺纤维化新靶点

【5】Nat Commun︱罗永伦团队主导开发新型高通量CRISPR脱靶检测方法

【6】Nat Commun︱彭岳青团队发现新的控制非快速动眼睡眠的脑区

【7】Nature︱徐华强/蒋轶/张抒扬团队合作揭秘自身免疫性甲亢甲减的分子机制

【8】Sci Adv︱张毅课题组发现调节药物成瘾行为的重要神经元

【9】EMBO J︱田爱国团队揭示在果蝇中肠里通过病原性细菌的伤害诱导成肠细胞分裂来产生干细胞的新机制

【10】Mol Ther 综述︱于涛团队评述非编码RNA的靶向递送在动脉粥样硬化治疗方面的最新进展

优质科研培训课程推荐【1】培训课程︱R语言临床预测生物医学统计专题培训【2】宏基因组与代谢组学R语言分析及可视化实操研讨会(8月27日 腾讯会议)
欢迎加入“岚翰生命科学”

 ”岚翰生命科学“ 诚聘副主编/编辑/运营岗位 (在线办公)


参考文献(上下滑动阅读) 

[1] Pan, Q., et al., Deep surveying of alternative splicing complexity in the human transcriptome by high-throughput sequencing. Nat Genet, 2008. 40(12): p. 1413-5.

[2] Wang, Y., et al., Splicing dysregulation in cancer: from mechanistic understanding to a new class of therapeutic targets. Sci China Life Sci, 2020. 63(4): p. 469-484.

[3] Wang, Z. and C.B. Burge, Splicing regulation: from a parts list of regulatory elements to an integrated splicing code. RNA, 2008. 14(5): p. 802-13.

[4] Wang, Y., et al., The splicing factor RBM4 controls apoptosis, proliferation, and migration to suppress tumor progression. Cancer Cell, 2014. 26(3): p. 374-389.

[5] Song, X., et al., Alternative splicing in cancers: From aberrant regulation to new therapeutics. Semin Cell Dev Biol, 2018. 75: p. 13-22.

[6] Miller, M.L., et al., Pan-Cancer Analysis of Mutation Hotspots in Protein Domains. Cell Syst, 2015. 1(3): p. 197-209.

[7] Kahles, A., et al., Comprehensive Analysis of Alternative Splicing Across Tumors from 8,705 Patients. Cancer Cell, 2018. 34(2): p. 211-224 e6.

[8] Sebestyén, E., et al., Large-scale analysis of genome and transcriptome alterations in multiple tumors unveils novel cancer-relevant splicing networks. Genome Res, 2016. 26(6): p. 732-44.

[9] Seiler, M., et al., Somatic Mutational Landscape of Splicing Factor Genes and Their Functional Consequences across 33 Cancer Types. Cell Rep, 2018. 23(1): p. 282-296 e4.


本文完

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存