Nat Commun | 血浆蛋白可提前7年预测癌症风险!大型前瞻性研究揭示血浆蛋白与癌症风险的多重关联
蛋白质是大多数生物过程的组成部分,包括许多导致癌变的过程。前瞻性研究已确定多种病因性癌症蛋白,例如胰岛素样生长因子-1是乳腺癌、结直肠癌和前列腺癌的因果危险因素。虽然新的多重蛋白质组学方法能够同时检测数千种蛋白质,但许多蛋白质尚未评估其与多个癌症部位风险的相关性。由于存在混淆和偏差,仅使用前瞻性数据识别癌症风险的病因标志物可能具有挑战性。
血液循环中许多蛋白质的丰度可以部分用遗传变异来解释,许多这些遗传变异位于蛋白质的同源基因(称为顺式-pQTL)。这种基因分析可以提高识别最有可能在癌症发生和发展中起因果作用的蛋白质的能力。
近日,牛津大学Keren Papier教授团队及合作者使用综合多组学方法鉴定了血液蛋白和癌症风险之间的多重关联。通过分析UK Biobank参与者的1463种血浆蛋白与19种癌症和9个癌症亚部位的发病率的关联,研究团队利用顺式-pQTL和外显子组全蛋白质遗传评分(exGS)两种遗传方法确定了618种蛋白质-癌症关联,其中107种在抽血7年后确诊的癌症病例中持续存在,其中4个得到长期诊断的支持:肺癌与SFTPA2 ,非霍奇金淋巴瘤与TNFRSF1B和CD74,白血病与ADAM8。该研究成果已发表在Nature Communications上,文章题为“Identifying proteomic risk factors for cancer using prospective and exome analyses of 1463 circulating proteins and risk of 19 cancers in the UK Biobank”。
观察性结果
研究团队前瞻性分析了4921例恶性肿瘤病例,平均随访时间为12年。在分析的1463种蛋白质中,确定了371种蛋白质与至少一种癌症的风险相关,相当于618种蛋白质-癌症关联(图1-2)。分析显示,约50%的关联(304个)与组织或候选癌症起源细胞中mRNA表达富集的蛋白质(大于总表达量的10%)有关。对于83种蛋白质-癌症关联,其同源基因在组织或候选起源细胞中表达最多(即> 50%)的蛋白质。其中许多关联与B/T细胞中高mRNA表达的血液癌症风险相关蛋白质有关。
同时,研究还发现与癌症风险相关的蛋白质在肝脏、肺、结直肠、肾脏、脑、胃、食道和子宫内膜中具有大多数或丰富的mRNA表达。例如131种蛋白与肝癌风险相关,51种蛋白与肾癌风险相关,还确定了28种与肺癌总体风险和/或至少一种组织学亚型相关的蛋白等。在经过多次校正后,研究数据中几乎没有观察到蛋白质与胰腺癌、甲状腺癌、口腔癌或黑色素瘤相关的证据。
图1.研究设计、观察和遗传性蛋白-癌症关联、途径分析和药物靶点图谱的概述。
根据抽血和诊断之间的时间进行分层分析
蛋白质与癌症风险的关联分析
利用939个顺式-pQTL(代表294个独特蛋白质),研究了在主要分析中经过多次检测后确定的498个蛋白质-癌症关联,其中编码较高TNFRSF14的三个顺式pQTL在多次检测校正后与较低的非霍奇金淋巴瘤风险相关(图4)。利用exGS,研究团队通过324种独特蛋白质研究了533种蛋白质-癌症关联,确定了28种相关性,包括24种与非霍奇金淋巴瘤相关,2种与白血病相关(SRP14、TREML2), 1种与肝癌(KRT18)和肺癌(TNR)相关,相关性最强的是SRP14与白血病的关联(图4)。
图4.使用顺式-pQTL和exGS进行基因预测蛋白浓度和癌症风险关联。
在主要分析中,研究确定了4种与癌症风险相关的蛋白质,并且在所有三个附加分析(即长(> 7年)诊断时间,顺式-pQTL和exGS分析)中具有方向性一致的显著支持:肺癌与SFTPA2 ,非霍奇金淋巴瘤与TNFRSF1B和CD74,白血病与ADAM8(图5)。
图5.SFPTA2与肺癌风险、CD74和TNFRSF1B与非霍奇金淋巴瘤风险、ADAM8与白血病风险的前瞻性和遗传相关性
整合现有公开可用的药物靶标数据集
结语
在这项涉及1463种蛋白质(与19种癌症风险相关)的大型前瞻性研究中,发现了血液蛋白和癌症风险之间的多重关联。研究团队确定了371种与至少一种癌症风险相关的血浆蛋白质标记物,其中107种与抽血7年后诊断的癌症有关,并获得了补充遗传分析的证据支持,这可能表明其在病因学中起作用。值得注意的是,大多数蛋白质-癌症关联是癌症部位特异性的(371种蛋白质中的225种),并且许多蛋白质在癌症起源的细胞或组织中也具有大多数mRNA表达。研究还发现了可能在已确定的癌症风险变异携带者中标记早期癌症过程的蛋白质,这些蛋白质可能作为风险分层和早期诊断的潜在生物标志物。
文章第一作者、通讯作者Keren Papier教授表示:
“为了挽救更多癌症患者的生命,我们需要更好地了解疾病的最早期阶段发生了什么。来自数千名癌症患者的数据揭示了血液蛋白质如何影响癌症风险的令人兴奋的见解。现在我们需要深入研究这些蛋白质,看看哪些蛋白质能够可靠地用于预防。”
文章作者、牛津大学Ruth Travis教授表示:
“该研究提供了关于多种癌症的病因和生物学的新线索,包括对癌症诊断前几年发生的情况的分析。我们现在有技术可以观察数千例癌症病例中的数千种蛋白质,确定哪些蛋白质在特定癌症的发展中起作用,哪些蛋白质可能对多种癌症类型有共同影响。”
文章共同第一作者、牛津大学流行病学家Joshua Atkins指出:
“我们与生俱来的基因以及由基因产生的蛋白质,对癌症的发生和发展有着巨大的影响。感谢UK Biobank参与者提供的血液样本,我们正在构建一个更全面的关于基因如何影响癌症发展的图景。”
参考资料:
1. 15
2.https://www.insideprecisionmedicine.com/topics/oncology/studies-find-blood-proteins-that-may-predict-cancer-seven-years-before-it-is-diagnosed/?_ga=2.33546366.1740830633.1715840759-849232800.1681975868
热文推荐