文献阅读(十四)、肿瘤科医师狂喜,15分RNA修饰数据挖掘
往期回顾
文献阅读(一)、人类肠道微生物的代谢网络与疾病
文献阅读(二)、肥胖与减肥干预状态下的肠道微生物组及血清代谢物变化
文献阅读(三)、单细胞测序解析糖尿病肾病中肾小球的动态变化
文献阅读(四)、单细胞测序技术解析健康人与T2D患者的胰岛差异
文献阅读(五)、只有5页的文章(IF=7.307)
文献阅读(六)、小鼠全肾单细胞测序开篇之作
文献阅读(七)、一篇不花钱就能白嫖的文章文献阅读(八)、不会吧不会吧,Nature都能白嫖?文献阅读(九)、一文了解GSVA原理
文献阅读(十)、DKD 这一篇就够了文献阅读(十一)、高氧下小鼠肺发育损伤的ScRNA图谱
文献阅读(十二)、IgAN & STRT-Seq
文献阅读(十三)、老树开新花——EGFR、肿瘤、免疫+scRNA-Seq
写在前面
与这个系列的前面一些论文类似,这次给大家推荐的是一篇纯生物信息学数据挖掘的文章,换句话说,这又是一篇不需要支出科研经费(白嫖)的论文。一般来说,纯数据挖掘、没有实验验证的文章影响因子普遍比有实验验证的文章低一些。尤其是肿瘤领域的TCGA数据挖掘,铺天盖地的1分、2分、3分的文章;大量的灌水导致了目前纯生信文章的影响因子贬值。更离谱的是,大家似乎都喜欢蹭热度,最近一窝蜂的研究单基因套路、细胞焦亡、铁死亡诸如此类的,现在恨不得把门捷列夫的元素周期表挨个都“死”一遍。一方面可能这些话题确实研究价值巨大,不过另一方面我个人不太喜欢这种趋之若鹜的follow。这次的这篇文章便是在去年各类“死亡”火热时另辟蹊径,通过RNA修饰研究结直肠癌(colorectal cancer,CRC)并发表影响因子高达15分的文章(Molecular Cancer),也许对各位临床工作人员会有些许的启发,愿大家都能冲出“ 低分陷阱”。
doi:
10.1186/s12943-021-01322-w链接:
https://molecular-cancer.biomedcentral.com/articles/10.1186/s12943-021-01322-w
Abstract
01
RNA修饰
RNA表观修饰主要有m6A,m1A,alternative polyadenylation,adenosine-to-inosine RNA editing这四种,共涉及26种酶。02
主要发现
通过对这些基因的无监督式聚类可将这26种基因分为两类并对样本进行分型。并创造了一种关联分析方法“WM_Score”,一方面来说可以将肿瘤与健康样本相区分;另一方面在肿瘤患者内部对肿瘤微环境、免疫应答等方面产生差异并影响患者的生存期。高WM_Score与低WM_Score类群之间在各类通路确实存在各类差异,因此可作为良好的诊断指标。Introduction
01
RNA修饰
CRC的地位及流行特征这里就不做重点介绍了,各位一定比我了解,这是目前是癌症死亡率中排第名二的杀手。目前,CRC已被证实与RAS-MAPK、WNT、PI3K等信号通路相关,但表观遗传学影响着免疫应答与CRC的病因学。而RNA修饰又是表观遗传学的重要组成部分,与CRC存在潜在联系(仍未被研究透彻)。这一区域的空白,将由这篇论文填写。02
四种最常见的RNA修饰
RNA修饰的种类共有170种,本研究不可能涵盖所有,各类修饰之间也存在竞争性,而腺苷酸修饰是RNA修饰中最常见的,因此作者挑选了其中最主要的四种,并对这几种修饰过程与CRC之间做了关联研究。整理并研究了涉及这四种修饰过程中涉及的26种酶(下文统称为writer)。03
免疫&RNA修饰
目前immune checkpoint blockade(ICB)疗法存在相应效率低下的问题,而RNA修饰与免疫反应、肿瘤免疫微环境具有潜在联系,因此“writer”的研究十分有必要。免疫功能素来与肿瘤的发生具有联系,与RNA修饰相关的网路图谱有待构建。Result
01
基因及转录本差异
在确定writer的表达量对CRC的影响之前,首先应排除基因突变/序列差异带来的影响。经基因组序列确实发现ZC3H13、PCF11、KIAA1429在样本中的突变确实与生存期相关,并整理出突变类型、比例、分类、位置等信息如下图所示,不难看出,这些基因在人群中存在一定程度的突变。不可否认的是,通过生存分析的确发现这些writer的突变对患者生存期具有显著影响:
不仅是突变,拷贝数变异(CNV)同样需要在表达量分析前被排除。CNV分析后发现CSTF1、CPSF1/4、ZC3H13、KIAA1429存在广泛的CNV。
在解析完结构变异后作者统计了26种writer基因的表达量在tumor与normal组中的表达量,其中多数writer在normal组中上调,并且多数上调基因伴随着cnv gain,这里可以初步证明CNV只是影响基因表达的因素之一,尤其是一些cnv loss的writer表达量也上升了,因此CNV并不是决定性因素。RNA修饰在基因表达中也同样值得被研究。作者这里也交代的很清楚,基因结构方面的差异已经完完全全展示给大家,后面就该展示writer的表达量了。
02
writer表达量分群与免疫浸润
首先,这些writers在一千多个样本中的表达量能够通过非监督式的聚类被分为两种模式(727个cluster_1,968个cluster_2):Cluter1与cluster2之间差异基因的的富集分析也显示出前者富集于stromal and carcinogenic activation,TGF-β singnaling pathway和cell adhension通路,而cluster2富集于proliferation and apoptosis,mismatch repair pathways等通路:
并且两种cluster在CRC的生存期上具有显著不同,cluster1患者的生存率更低,初步可以证明writer的变化会引起一些与肿瘤相关基因集的变化并且确实可以引起患者生存率的显著差异。
此处作者通过CIBERSORT软件(这一软件我们之前有花篇幅介绍过:什么?不做单细胞也能分析细胞类群和免疫浸润?)利用去卷积算法以对CRC中的免疫浸润情况进行打分,通过对support vector regression判断免疫细胞类型。发现其中一些writer与免疫细胞浸润密切相关:
其中M2 macrophage、Tregs、T follicular helper cells、T γδ cells在cluster1中更高;DCs、NKC、M1 Mac浸润在cluster2中更高。不难看出,cluster1浸润的免疫细胞主要是免疫抑制细胞,这可能是cluster1预后较差的原因之一,并且Mac的极化在免疫进程中十分重要:
03
差异基因功能
作者对cluster1与cluster2之间进行组间差异分析,对得到的差异基因进行富集分析,发现通路主要集中于DNA replication、cell cycle、tRNA metabolic process、p53、Il-17等信号通路。对这些差异基因分为两类cluster后,发现clusterA的预后性更差:
04
WM_Score
为了考虑到数据集的异质性与复杂性,作者此处创建了一个“WM_Score”的概念,以帮助区分样本。这一分值在cluster1高于cluster2,证明WM_Score可以用来区分writer的状态,并且cluster.gene.A中的WM_Score要高于cluster.gene.B,即DEG是受到writer的影响并能够通过WN_Score来评估的,初步证明了WM_Score这一评分机制科学有效。将样本按VM_S高低进行分组后,免疫浸润情况也出现了此前cluster1、2之间的类似差异,再次证明了这一评分机制的准确性。
为了验证write聚类、gene聚类、WM_Score高低之间的一致性,作者对这些变量进行了交叉分析。韦恩图与柱状图也显示cluster_1/2,cluster_gene_A/B与VM评分具有较好的一致性,即WM_Score high能够对应Cluster_1及gene.cluser_A,反之亦然。
生存分析与风险评估(多元回归COX分析)也显示VM_S的划分对CRC预后存在影响(通过AUC曲线可判断WM_S的模型的拟合程度,一般0.5~0.7达标、0.7~0.8良好、0.8~1优秀):
COX回归分析通常与生存分析如影随形,可用于评估自变量对因变量的影响程度,并能够校正其他混杂因素。对连续数值型变量、离散型分类变量、顺序变量均可建模分析。取某一自变量系数为e的幂数,得到的值即为HR值(风险比例),当HR>1则为危险因素,当系数<1则为保护因素。即高WM_Score为风险因素,WM_Score低为保护因素。
CRC具有四种亚型:CMS1-4,为了探寻VM_S是否能够帮助区分亚型分类,进行VM评分后发现在某些亚群之间具有显著差异(但在数据集之间重复性较差)。随着分期进程,WM_S逐渐攀升。(CMS4主要在晚期被诊断出)。
此外WM_S在,CRC诊断时的分期、转移与非转移之间也存在差异,这进一步证明WM_S与CRC的预后存在关系:
这时,又一个热度极高的分析出现了——miRNA。上文WM_S的评分对象仅为26个writer,为了探寻RNA转运、定位、翻译等转录后生物过程。作者整理出WM_S高低组的差异miRNA并整理网络关系如下,与此前结果相一致的是EMT、Apoptosis、Cell circle相关的基因通路依然能被富集到。也就是说,WM_Score发挥作用时,这些miRNA也逃不了干系。
对于APA与A→I这两种修饰,在两个数据集间按照高低程度进行差异分析,APA依据长短,A→I根据发生频率,发现不同的修饰程度会影响生存曲线,但A→I通过RNA-Seq较难捕捉,可信度成疑。
05
在治疗应用方面得潜在贡献
作者建立了WM_S这一良好的评价指标,期望其能够用于指导临床治疗。利用GDSC进行药物敏感性预测,与WM_S进行相关性分析,其中24种药物敏感性与WM_S具有相关性,这些抑制剂与对应的通路相对应。如MEK inhibitor Selumetinib, mTOR inhibitor LJI308, EGFR inhibitor AZD3759。18种耐药性与WM_S相关, including cell cycle checkpoint kinase inhibitor AZZD7662, Bcl-2 inhibitor AZD5991。与WM_S高组敏感性关联的通路包括 MAPK, mTOR, and VEGF signaling pathways.与WM_S低组敏感性关联的通路包括 apoptosis and cell cycle signaling pathway. 因此通过WM_S鉴别RNA修饰模式并预测敏感性用于临床具有指导意义:最后,作者聚焦于PD1疗法,证明WM_S高低在bladder cancer间具有生存差异,并且在四个分期之间具有明显不同,分期之间的比例也与此前CRC类似。随着免疫程度的上升,WM_呈现下降的趋势,最终在PD-L1疗法中,WM_S高组也无法收获较好的疗效。也就是说,WM_Score的上升在膀胱癌中也有助于“免疫逃逸”。
总结
RNA修饰的研究其实也不算少,本文的亮点主要是通过大量的分析(八个数据集共1697个样本)评估了RNA腺苷酸修饰与CRC预后、治疗方案的潜在关系,并成功构建了WM_Score这一评分概念。经过多次的验证,我不由得觉得这26种writer理应被制作成芯片以快速得对CCR病人进行检测分型,从而起到个性化治疗的目的。因此,这篇推送我们会将这篇文章拆解开来,详细的转述一番,建议大家耐心看完,有必要时推荐阅读原文。
如何联系我们
答疑公约
笑一笑也就算了