Cancer Cell:蛋白基因组学又一力作!研究揭示前列腺癌的多组学图谱
景杰学术/解读
前列腺癌(prostate cancer)是指发生在前列腺的上皮性恶性肿瘤,是全世界男性最常见的非皮肤恶性肿瘤。前列腺癌最常见的诊断方式,主要是通过直肠指检筛查以及检测前列腺特异性抗原的血清水平。目前接受手术和放疗的患者高达75%,而实际上前列腺癌患病概率远低于诊断概率,也即存在着严重的过度诊断问题,因此急需开发更合适的诊断方式。
前列腺癌的基因组、表观基因组和转录组已经得到了很好的研究。已知许多突变会驱动局部前列腺癌的发生和侵袭,涉及的通路包括低氧反应、雄激素信号和DNA修复等。但这些突变对肿瘤蛋白质组的影响方式,目前仍知之甚少。
值得一提的是,最近对乳腺癌、卵巢癌和结直肠癌等的研究表明,转录组并不能有效代表蛋白质组,只有10%-20%的蛋白质丰度变化能够被mRNA丰度解释。前列腺癌蛋白质组的早期研究主要集中在临床特征不一致的患者群上,没有多组学整合分析的报道。
为了填补这一空白,来自加拿大多伦多大学等多家合作单位的研究者通过整合并分析了76例局部中危前列腺癌的多组学信息(基因组、表观基因组、转录组和蛋白质组数据),发现前列腺癌的基因组亚型集中在五个蛋白质组亚型上,具有不同的临床发展轨迹。其中ETS基因融合是影响蛋白质组和转录组的不同基因和通路的最主要因素之一。
研究针对疾病组织开展系统的蛋白基因组学研究,不但深入剖析了前列腺癌的生物学机制,并且证实了基于转录组来解释基因组变异的影响是非常有限的,增加蛋白质组分析是充分理解基因组变异影响的关键。蛋白质学特征可用于预测前列腺癌复发,有效地改善患者预后,从而实现前列腺癌的精准诊断与治疗。文章2019年3月18日发表在国际知名期刊Cancer Cell上(点击“阅读原文”可阅读完整文章)。
1. 可治愈前列腺癌的蛋白质组学分析
本文的研究对象为可切除的前列腺癌,通过冰冻切片获得完整的疾病组织样本。作者选取76名临床上同质性较好的患者,对其实施根治性前列腺切除手术,以及平均6.8年的随访。对患者的组织样品进行以下多组学分析:①基于微列阵的拷贝数变异(CNA);②基于全基因组测序的基因组重排、单核苷酸位点变异(SNVs)、染色体碎裂和局部高变区;③基于微列阵的DNA甲基化;④基于ChIP-seq的组蛋白H3K27Ac调控;⑤基于高通量测序和微列阵的mRNA定量;⑥基于质谱的蛋白质定量(图1A)。其中蛋白质组学是本研究的重点。
图1、76名前列腺癌患者的多组学研究示意图
蛋白质组学结果一共检测到7054个蛋白质,其中3397个能够在76名患者中同时检测并定量到,包括对应于经典前列腺癌相关基因的蛋白质,如前列腺特异性抗原基因KLK3和DNA损伤修复基因ATM。聚类分析将蛋白分成4个簇(即P1、P2、P3和P4;图2A),将患者分成5个亚型(即C1、C2、C3、C4和C5;图2A)。蛋白簇P1和P3富含免疫相关基因,而P2和P4中未检测到明显富集的途径。
在五个不同的患者亚组中,C2和C3与生化复发率的增加相关(图2B)。因为CNAs与患者的预后密切相关,作者将5个亚型分别与之前描述的基因组亚型和TCGA前列腺癌亚型进行了比较,结果显示基因组亚型和蛋白质组亚型在很大程度上是相互独立的(图2C)。这表明核苷酸特征不能很好地代表蛋白质组多样性。
2. ETS基因融合与转录组和蛋白质组的关系
ETS基因融合现象是影响转录组和蛋白质组的最重要因素之一。作者集中研究了与ETS基因融合状态显著相关的245个mRNAs和68个蛋白质。结果发现,多数基因与ETS基因融合的相关性,仅体现于mRNA丰度或者蛋白丰度,而非两方面都有。
通路富集分析也显示出ETS融合相关的转录组与蛋白质组间的巨大差异,例如作者发现mRNA水平上,基因主要富集于细胞迁移、肌动蛋白结合和磷脂结合等通路,而在蛋白质水平上,基因主要富集于溶酶体相关通路。这些差异表明,当仅基于转录组来解释基因组变异的影响是非常有限的,增加蛋白质组分析是充分理解基因组变异影响的关键。
此外,作者还系统地计算了所有基因的mRNA和蛋白质丰度之间的相关系数,结果显示出较弱的相关性(斯皮尔曼中位数 ρ = 0.21),表明mRNA丰度并不能很好的预测蛋白质丰度。
3. 基因组和转录组变化的顺式和反式作用
有研究表明,前列腺癌在基因组层面主要受CNAs的驱动,而非SNVs。因此作者研究了CNAs对于mRNA和蛋白质丰度的顺式和反式调节作用。结果发现RNA水平均能检测到很强的顺式和反式作用。但蛋白质水平上则较弱。例如,mRNA水平上受CNAs顺式调控的基因约为10%,但蛋白水平仅有2%;mRNA水平上发现的反式作用基因数目平均为593 ± 528个,而蛋白水平仅为10±31个。
4. 前列腺癌中的复杂信息流分析
为了更好地量化从癌症基因组到蛋白质组的复杂信息流,作者计算了前列腺癌研究中五类分子数据之间的交互信息(MI):CNAs、甲基化、组蛋白H3K27乙酰化、RNA丰度和蛋白质丰度(图3A)。正如所料,不同的分子对在信息内容上有不同程度的冗余。例如,与其他分子数据类型相比,CNAs的预测能力较弱。CNAs与蛋白质的相关性略强于与mRNA的相关性。甲基化也表现出类似结果。
为了确定生物分子对之间的调节关系是否能够区分特定的基因功能群,作者进行了聚类分析并划分了六个亚群(标记为MI1 – 6;图3B)。MI6亚群的特征是在CNA-H3K27Ac、CNA-蛋白质、CNA-RNA和CNA-甲基化层面有较高关联,并且富含与细胞应激反应相关的基因。相比之下,MI1的较高关联体现在H3K27Ac-蛋白质、RNA-蛋白质和甲基化-蛋白质层面,并富含细胞外外泌体。上述结果在TCGA的患者群中得到了一定的验证(图3C)。
5. 蛋白质组学特征可用于临床预测,有效地改善患者预后
为了评估蛋白质组学特征的潜在临床重要性,作者进行了基因与治疗后疾病复发的相关性分析。总体来看,大多数基因的mRNA和蛋白质水平的风险比(HRs)之间相关性较差(斯皮尔曼 ρ = 0.25;图4)。这表示某些基因在mRNA水平上与复发相关,而另一些基因在蛋白质水平上与复发相关。
图4、mRNA水平和蛋白质水平风险比的相关性检测
作者进一步通过AUC评估不同类型的分子生物标记对预后诊断的准确性。结果显示由CNAs或甲基化数据生成的生物标记具有相似的性能(图5B)。相比之下,由蛋白质丰度产生的生物标记优于其他类型数据。因此,蛋白质组比基因组、表观基因组或转录组对疾病预后更有意义。此外,配对数据类型产生的生物标记要明显优于单独的基因组数据,并且低MI值的配对数据也优于高MI值的配对数据(图5C)。
参考文献:
Ankit Sinha, et al., 2019, The Proteogenomic Landscape of Curable Prostate Cancer. Cancer Cell.
往期精彩回顾
蛋白基因组学研究:Nature重磅综述: 基于质谱的蛋白基因组学在临床的应用前景
前列腺癌分型:Nat Commun:原发性前列腺癌整体表观遗传学分类研究
前列腺癌与多维组学:【必看】Cell:多维组学分析推动前列腺癌精准治疗
蛋白基因组学:“再下一城”---利用蛋白基因组学揭示淋巴瘤的生物标志物和潜在药物靶点
蛋白基因组学:“众里寻她千百度”——蛋白基因组学揭示乳腺癌药物治疗的靶标
肝癌:喜见花开凤凰飞,中国人类蛋白质组计划发现肝癌精准治疗新靶点
多维组学与胃癌:Cancer Cell:多维组学整合分析,揭示早期胃癌的分子特征
胃发育:重磅!北京蛋白质组研究中心团队绘制小鼠胃发育过程的多组学图谱
精准医学与蛋白组学
蛋白组学前沿动态
深度解读最新文章