多组学 | 3大维度9大组学技术,揭开迄今为止最大、最全面的人类肺鳞状细胞癌分子图谱
肺癌是我国发病率和死亡率增长最快,对人群健康和生命威胁最大的恶性肿瘤之一。肺癌的种类很多,大致可分为小细胞肺癌和非小细胞肺癌,而非小细胞肺癌又可分为腺癌、鳞状细胞癌和大细胞癌。小细胞肺癌占约20%,虽然其发病率低,且化疗及放疗效果好,但因其恶性程度高,确诊时癌细胞很可能已经广泛扩散,往往很难治愈。
图1 肺癌的组织学分类
肺鳞状细胞癌(lung squamous cell cancer, LSCC)属于非小细胞癌,发病率高,占原发性肺癌的40%~51%,多见于老年男性,与吸烟密切相关。虽然其恶性程度相对较低,但化疗和放疗对其效果不佳,相关途径的靶向治疗研究也未见成效,只有免疫疗法相对成功。鉴于目前仍缺乏可行的靶点,对LSCC进行包括翻译后修饰(PTMs)谱在内的蛋白基因组全面表征,从而进行生物学标志物的鉴定和精准的分子分型显得十分重要。
近日,麻省理工学院和哈佛大学团队在Cell上联合发表了题为“A proteogenomic portrait of lung squamous cell carcinoma”的文章。该研究利用搜集到的108例原发性LSCC患者的肿瘤组织和99例对应的癌旁正常组织(NATs)进行了蛋白基因组特征分析,并首次涵盖了包括磷酸化、乙酰化和泛素化在内的PTMs数据,全面揭示了LSCC的蛋白质组学特征,并发现了多个新的治疗靶点,具有极为重要的临床指导意义。
01
研究方案
研究人员利用基因组、转录组和蛋白质组学3个维度共计9种技术,对原发性LSCC患者的肿瘤组织和对应的NATs的蛋白基因组数据进行了深入的分析。
主要技术包括:全基因组测序(WGS)、全外显子组测序(WES)、甲基化芯片分析(EPIC array)、转录组测序(包括RNA-seq和miRNA-seq)、常规蛋白质组学和3种修饰蛋白质组学(磷酸化、乙酰化和泛素化)分析。
图2 主要组学技术
02
主要结论
A
结合蛋白基因组学数据对LSCC进行分子分型
通过多组学的关联分析,研究人员用蛋白质组数据过滤鉴定到的CAN(拷贝数变异)-mRNA,进一步选择“癌症相关基因”并最终确定了NSD3等35个存在显著拷贝数变异的基因。NSD3与FGFR1均位于LSCC核心的复发性扩增子上,但针对FGFR1的靶向疗法并未成功,暗示NSD3可能才是有效的治疗靶点。而最近的文章也表明NSD3可以介导染色质的变化,是LSCC发生的重要调节因子。
研究人员利用CAN、转录组、蛋白组及蛋白修饰组学(泛素化除外)的数据,进行了基于非负矩阵分解(NMF)的单组学和多组学无监督聚类分析,将LSCC分为B-I、EMT-E、Classic、I-S、和P-P-NMF共计5种亚型。EMT-E亚型为上皮向间质转化富集型(Epithelial to mesenchymal transition-enriched),显示出EMT、血管生成和肌生成途径的上调,具有黏液样组织特征和成纤维细胞浸润,并显著富集于Wnt信号途径(生物体生长发育重要途径,失调可能诱发肿瘤等疾病)。EMT和CAF(癌症相关成纤维细胞)类蛋白的一致高表达,以及成纤维细胞的高度增殖等迹象暗示CAF类蛋白在肿瘤上皮中的重要作用。
图3 LSCC的分子分型
B
修饰蛋白质组学间的cross-talk调节LSCC肿瘤代谢
研究人员基于乙酰化、泛素化和磷酸化修饰蛋白质组的数据,对LSCC中PTMs间cross-talk进行了进一步分析,发现肿瘤组织相较于NATs,其PGK1和PKM(均为糖酵解关键酶)上多个抑制位点乙酰化水平降低,相关调节蛋白磷酸化水平增加,酶活得到增强的PGK1和PKM会增强糖酵解代谢过程,促进肿瘤细胞生长。肿瘤组织中的TXN1(氧化还原调节因子)表达量增加同时泛素化水平降低,这在Classic亚型中极为显著,同时伴随着其激活子TXNRD1的表达量增加和抑制子TXNP的表达量降低,从而共同响应细胞快速生长带来的肿瘤内部的氧化应激。
图4 LSCC修饰蛋白质组学间的cross-talk
C
筛选LSCC预后、诊断和治疗的生物标志物
基于肿瘤组织与NATs的蛋白质组学数据,研究人员发现了502个差异表达蛋白,利用TCGA LSCC数据库的数据检查了它们与总生存期(OS)或无病生存期(DFS)的关系,发现了4个与OS显著相关的基因以及15个与DFS显著相关的基因。敲低这些肿瘤生物标志物降低了16个LSCC细胞系的适应力,说明了这些蛋白在关键的细胞转化和增殖过程中的重要地位。此外,LSCC中27种激酶活性增强,包括MAPK14和已用作靶向药物的激酶(DCK、EGFR和SRC)。
该研究主要发现还包括:
1)除NSD3外,研究人员还发现了生存素、LSD1和EZH2等潜在的治疗靶点,并讨论了miR-205、TP73和SOX2作为治疗靶点的可能性;
2)针对CDK4/6抑制剂在临床上治疗有限的情况,研究人员发现Rb1的表达量和磷酸化水平会影响前者的疗效;
3)基于蛋白基因组学绘制LSCC免疫学全景图,研究人员发现部分肿瘤亚型对免疫治疗敏感,一定程度上解释了免疫疗法相对成功的原因。
图5 文章整体结果
03
科技君点睛
总体上来看,本文通过基因组、转录组和蛋白质组学技术,对LSCC(肺鳞状细胞癌)进行了多维立体的分析。首先对LSCC进行了相对细致的分子分型,有利于对LSCC不同亚型进行更精准的治疗;接着对目前LSCC已知靶点的靶向治疗效果不佳的原因进行了分析,并提供了更多可供选择的治疗靶点;最后通过深入的免疫学分析,为目前LSCC免疫疗法的进一步研究提供了基础。
本文从中心法则的三个维度:DNA、RNA和蛋白质,运用9种组学技术,对200多例肿瘤组织样品进行了全方位,多层次,宽领域的数据获取与分析,丰富的组学数据为之后的LSCC相关研究奠定了坚实的基础。
华大基因在疾病多组学研究领域处于领先地位,可提供基因组、转录组、蛋白质组、修饰蛋白组、代谢组以及多组学关联分析等全面的检测服务;多组学全贯穿,让疾病研究更透彻!
截至2021年11月,华大基因质谱平台共计发表文章250+,累计影响因子1,200+,包括Nature Medicine、Nature Communications等高水平文章。华大基因不仅提供高质量的检测分析服务,还提供专业的技术支持,可为广大科研用户提供完善的方案设计。欢迎咨询!
欲知更多详情,
请联系华大科技当地销售代表↓↓↓
热线电话:400-706-6615
邮箱:info@genomics.cn
近期热文
取得新进展!DIA蛋白定量分析助力发现晚发型子痫前期潜在生物标志物
关注“华大科技BGITech”,获取更多信息!
点击“阅读原文”查看文献,了解更多