查看原文
其他

癌症研究新篇章,Cell | 高深度蛋白质组学补全「癌细胞系百科全书」

落落 精准医学与蛋白组学 2022-04-16

本文由景杰学术团队报道解读

欢迎点击上方蓝字“精准医学与蛋白组学”关注我们

并点击右上角“...”菜单,选择“设为星标"


众所周知,蛋白质是生物过程必不可少的介质,是生命活动的主要承担者。然而迄今为止,包括癌细胞系百科全书(CCLE)在内的细胞系集合大规模分析,多数集中在遗传信息分析上,对蛋白质组的深入研究仍远远不足。虽然蛋白质和RNA表达差异背后的转录后调控与翻译后修饰等机制已被解析,但是关于基因和蛋白质表达各自的局限性以及两者之间的差异仍存在疑惑。

癌细胞系百科全书(Cancer Cell Line Encyclopedia,CCLE)由美国Broad研究所、Dana-Farber癌症研究所和Novartis生物医学研究所的多个课题组于2012年合作完成,对覆盖三十多种组织来源的947种人类癌细胞系进行了大规模深度测序,整合了DNA突变、基因表达和染色体拷贝数等遗传信息。随着多组学测序技术和癌症精准医学向纵深发展,CCLE数据库也不断在癌细胞系数量和测序信息维度等方向上进行着更新,增加了组蛋白谱,RNA-seq,DNA甲基化,microRNA(miRNA)谱,全基因组测序和代谢产物谱等分析。在最新版本中,CCLE包括通过反相蛋白质阵列对蛋白质进行定量,缺乏深度蛋白质组分析

2020年1月23日,Cell在线发表了题为:Quantitative Proteomics of the Cancer Cell Line Encyclopedia的最新研究成果。来自美国哈佛医学院Steven P. Gygi、David P. Nusinow等研究人员通过质谱法,CCLE中375种不同来源细胞系的数千种蛋白质进行定量蛋白质组分析,为癌细胞百科全书增添了全新的篇章。


文章发现,跨样本基因的蛋白水平和转录水平相关系数较低,暗示了利用RNA-seq数据推测蛋白表达水平具有一定的局限性。通过生物学途径与功能基因注释富集分析发现,蛋白质表达的主要变化是围绕生物学途径进行的,并且在不同的途径的组成成分之间存在一定的相关性。同时,研究者还利用本次定量蛋白质组学数据详细解读微卫星不稳定microsatellite instable, MSI )细胞系与一些特定蛋白复合物表达之间的联系,探究了MSI状态下对基因敲低与突变具有敏感性的蛋白复合物的表达情况,为癌症基因组学和癌症精准治疗发展提供新思路。


文章亮点

对来自CCLE中不同谱系的375个癌细胞系的蛋白质组进行分析;

分析了多种途径中相关蛋白质的表达;

微卫星不稳定性细胞系中,复杂蛋白复合体下调表达;

分析了与基因敲低和突变敏感性相关的蛋白复合物。



研究速读


1、高深度、高广度的蛋白质组定量分析

文章从CCLE中选择了以实体器官为主的22个谱系来源的375个细胞系(样本策略)用于定量蛋白质表达谱分析(组学策略),并成功分析了不同来源样品之间的蛋白质表达的差异。TMT10-plex和仪器对样品的多路复用,实现了良好的检测覆盖深度,并且定量分析样品之间的重叠程度很高。检测的蛋白类别覆盖面广,包括了大部分丰富蛋白质(如核糖体),以及较低丰度的蛋白质(如转录因子)的一部分。

图1 375种不同癌细胞系的蛋白质组学定量分析

2、生物学途径决定了相关蛋白的表达,与组织谱系无关

文章采用主成分分析法将层次聚类的结果降维分析(图2A),剔除了离群的造血和淋巴细胞系,可以看到组织谱系重叠度较高(图2 B)。为确定这种组织谱系的共变化是否影响蛋白表达,文章通过GSEA分析富集到了超过200个生物学途径(图2C和4B),各途径成员具有共变化的特征。这些具有共变化特征的蛋白质,可以将它们大致分为蛋白质复合物和非蛋白质复合物基因集合。后者包含了如MAPK(丝裂原激活的蛋白激酶),糖酵解途径,细胞分化相关的生物学途径;以及细胞-细胞和细胞-基质黏附途径相关,如KRAS和p53信号标记物。有意思的是,糖酵解与氧化磷酸化途径在不同的聚类上,成相反关系。这与Warburg效应(即癌细胞具有高糖酵解速率)的特征相符合。

大量数据表明生物学途径决定了相关蛋白的表达,其相对表达量在很大程度上与组织谱系无关,后续的GO聚类分析也验证了这一发现(图4A和4C)

图2 蛋白质表达的主要变化是由蛋白复合物的协调表达和细胞途径所决定

3、蛋白质组学与转录组学数据相关性较低,RNA表达水平不能反应稳态蛋白质组的变化

对蛋白质组的直接定量分析,相比于此前基于RNA-Seq数据推测分析基因表达水平,其显著优势在于避免由于转录后调控及翻译调控等因素的影响。本文研究者对蛋白质组与转录组数据进行分别聚类分析与两者之间的相关性分析,发现两者均呈现不完全的聚类。而在相关性分析上,对于同一细胞系来源的蛋白质数据与RNA数据高度相关。例如皮肤和造血-淋巴细胞系比其他细胞系(图3A和3B,分别为紫色和橙色星号)具有最大的相关性,这与前人报道的反相蛋白阵列基因芯片(RPPA)数据结果有很大不同。而跨样本的基因蛋白水平与RNA水平之间的相关系数平均在0.5以下,这与此前的研究结果类似。对于某些基因,RNA的表达水平能够代表蛋白质表达水平(例如EGFR)。而对于另一些基因,RNA所能提供的信息很少(例如BRAF)。 

图3 蛋白质与RNA表达之间的相关性

另一方面,文章同样采用PCA法对RNA数据降维后进行GSEA富集分析,得到了较少的生物学途径与GO聚类,其中一部分与蛋白质数据的富集结果重叠(图4B和4C)。在结合每个基因RNA水平与蛋白水平的相关性后发现,大多数生物学途径相关性不高,只有少数途径,其蛋白表达水平与RNA表达水平具有非常高的相关性,如KRAS和p53信号标记物,以及介导细胞接触的细胞表面蛋白。GO聚类结果也类似。而后结合转录因子结合靶标数据库,在RNA水平富集到了100多个转录因子靶标,而蛋白质水平却没有。因此说明,尽管在一定程度上RNA的量能代表蛋白质的水平,但对于稳定蛋白质组来说,前者并不能反映后者的变化水平。

综合而言,用RNA-Seq数据推测蛋白质表达水平这一方法存在很大缺陷,而用蛋白质组学数据反应细胞功能状态则更为直观

图4 跨生物学过程的协调表达与细胞蛋白质组中的主要变化有关

另外,文章还通过此次定量蛋白质组学数据,深度挖掘了与癌症发展相关基因的表达情况,如对所有蛋白质的表达与上皮细胞粘附分子(EPCAM)和波形蛋白(VIM)进行蛋白质网络分析,发现1/3-1/2的蛋白与该上皮-间质标志物的调控和翻译后修饰相关。在许多药物靶点如EGFR,以及基因敲除靶点PIK3CB和ZEB2的筛选与分析上,蛋白组学数据提供了极大的帮助。

文章还构建了一个基于固态器官源头的癌细胞系蛋白组数据的蛋白质互作网络,包含了3777蛋白,41600个相关关系(FDR为1%),其中40000个正相关调控,这为组织和探索大规模蛋白质表达提供了有力数据。而对于MSI细胞系,本文研究者也进行了多方位信息挖掘,发现多种蛋白复合物在MSI细胞系中差异表达,以及对不同蛋白复合物组成成员间的表达进行了相关性分析。这些数据与CCLE原有的多维组学数据相结合,极大地促进了癌细胞行为的探索与癌症治疗的研究。

参考文献

David P. Nusinow, et al., 2020, Quantitative Proteomics of the Cancer Cell Line Encyclopedia. Cell.

本文景杰学术团队原创,欢迎转发到朋友圈。如有转载、投稿、等其他合作需求,请文章下方留言,或添加微信ptm-market咨询。


蛋白质组学CNS精选




2020.02 2020开年红!Cell | 贝勒医学院章冰/西北太平洋国家实验室刘涛等解析子宫内膜癌蛋白质组学图谱
2019.10 Nature重大突破:全新组蛋白乳酸化修饰调控癌症和炎症等疾病
2019.10 蛋白基因组学文章再登Cell!深度揭示肾透明细胞癌特征
2019.10 Cell | 樊嘉/周虎/高大明团队合作报道HBV相关肝癌蛋白基因组最新研究
2019.10 Science同期三连发,蛋白组学/磷酸化修饰组揭示睡眠需求机制
2019.10 蛋白组学研究再登Cell,揭示肺癌EGFR突变引起酪氨酸磷酸化信号重塑的分子机制
2019.09 肠道微生物也挑食?Cell:蛋白质组学揭示肠道菌群种间竞争对饮食纤维的选择性机制
2019.09 暗藏玄机,Cell | 蛋白质组学揭示黑色素瘤响应免疫治疗的线粒体依赖性
2019.05 Nature主刊!卵巢癌及附近基质的大队列蛋白质组学分析
2019.04 最新Cell!首次报道结肠癌大样本队列的蛋白基因组学研究
2019.04 寻找阿喀琉斯之踵!Nature | 整合蛋白质组学研究揭示“癌症之王”治疗新靶点
2019.03 Nature:蛋白质组学研究揭示糖皮质激素竟会促进乳腺癌的转移
2019.03 你的情绪影响你的基因表达!Nature最新报道:神经递质5-羟色胺通过新型组蛋白修饰发挥调控作用
2019.02 Cell:亚硝基化修饰介导肠道微生物对宿主的影响
2019.02 喜见花开凤凰飞,Nature:中国人类蛋白质组计划发现肝癌精准治疗新靶点
2019.01 Nature最新突破,大脑皮质神经元投射的亚细胞转录组和蛋白质组研究
综述及其他
2019.07  Nature综述 | 哈佛医学院施扬组综述组蛋白甲基化在动物发育中的作用和调节
2019.06  NATURE新闻特写 | DNA,请挪步:轮到古蛋白登场揭示人类史了
2019.01 Nature Reviews:Spatial Proteomics,细胞生物学研究利器


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存