查看原文
其他

SynEcoSys数据库公共数据挖掘专题(一):完美复现Nature乳腺癌数据挖掘文章


三阴性乳腺癌是影响女性的最致命疾病之一,目前临床上靶向治疗较少,并存在转移率高,预后差等特点。众所周知,癌细胞在细胞膜上表达CD47,PD-L1和B2M等信号蛋白来逃避免疫细胞的清除进而实现免疫逃逸(1)。靶向“Don’t eat me”信号的临床治疗方案已经在不同的癌症中展现出了治疗潜力(2,3)。然而CD47,PD-L1这些免疫逃逸机制还是无法解释目前治疗中的免疫抑制现象,因此研究人员们推断是否还有未知“Don’t eat me”的信号存在。

2019年,来自斯坦福大学的Weissman教授团队(1)在探索公共数据库后,从NCBI上下载了来自Ellisen等人2018年发表的三阴性乳腺癌(TNBC)样本的单细胞RNA测序原始数据(4),再通过标准分析得到表达矩阵,QC,降维聚类分群和细胞注释等一系列复杂的生信分析流程,注释出肿瘤细胞(Tumour)和肿瘤相关巨噬细胞(TAM)并检查其中基因表达后,发现了在Tumour和TAM之间可能存在特异性高表达的受配体基因对(CD24和SIGLEC10)(1)。在其他免疫抑制信号表达无特异性的情况下,提示TNBC中这一对互作基因可能是造成巨噬细胞免疫抑制的信号来源(图1)。

图1 TNBC样本中,CD24,SIGLEC -10,CD47和PD-L1在肿瘤微环境细胞类型中的表达分布

SynEcoSys数据库内收录了Ellisen 2018 TNBC数据集(4),经过标准化重分析和注释,可以直接对数据进行可视化浏览和探索性分析(图2A),并可与其它收录的大量TNBC以及更多乳腺癌亚型样本数据相互验证。使用SynEcoSys还原Weissman 2019文献分析步骤,在TNBC样本肿瘤微环境中调查CD47、PD-L1等抗吞噬信号表达,发现没有细胞类型特异性的高表达,符合原文结论,提示出抑制巨噬细胞吞噬功能的可能有其他信号。调查CD24和SIGLEC10的表达情况,发现CD24在肿瘤上皮细胞中高表达,且特异性较高,进一步还原原文结论(图2B)。在SynEcoSys数据库中,我们还可以进一步查看样本间基因在不同细胞类型中的表达热图,发现CD24在除了癌细胞外其他细胞类型中表达较弱,表明CD24有作为肿瘤特异性标志物的潜力(图2C)。而肿瘤相关巨噬细胞(TAM)整体特异性高表达SIGLEC10,提示CD24-SIGLEC10相互作用可能造成肿瘤微环境中巨噬细胞免疫抑制。这一点,原文中在之后的细胞和动物实验中进行了验证,发现通过敲除或抑制CD24可以提高吞噬细胞能力进而减缓肿瘤细胞的生长。

图2 使用SynEcoSys数据库展示CD24, CD47和 SIGLEC10在TNBC样本中表达分布

作者想知道SIGLEC-10是否只在吞噬细胞上表达,于是使用流式实验分析了乳腺癌TAM和正常腹膜内巨噬细胞,得到乳腺癌TAM特异性高度表达SIGLEC-10,而在正常腹膜巨噬细胞中低表达(图3A)。使用SynEcoSys数据库就能免去实验验证的步骤,可以直接从大量的单细胞数据中搜索包含breast和normal_tissue的数据集,发现在其他包含乳腺癌的数据集中,SIGLEC10在正常吞噬细胞,甚至整个髓系细胞中低表达,而在乳腺癌样本中高表达(图3B),符合原文结论。

图3 A, 流式分析乳腺癌和正常腹膜巨噬细胞表达(1)  B, SynEcoSys数据集中查询乳腺癌和正常组织中巨噬细胞表达

由于文中数据样本较少且缺乏正常组织中CD24表达情况,在结论上还缺乏更缜密的证据支持。我们可以使用SynEcoSys数据库对原文的发现进行延申扩充,搜索包含正常组织和乳腺癌组织的数据集得到CD24的表达分布(图5)。在乳腺癌整体中,CD24除了在乳腺癌肿瘤细胞中高表达,在正常的上皮细胞中也是高表达的。另外,我们还发现CD24只在TNBC中肿瘤细胞表达高于正常上皮细胞,提示CD24-SIGLEC10信号通路可能是一种亚型特异性靶点,并不适用于除TNBC之外的其他乳腺癌亚型(图5B,C)。

图4 CD24在正常组织和不同亚型乳腺癌中表达分布

另外作者从原数据中单独提取出了TNBC细胞,并对不同样本进行了分群,检查了不同样本间TNBC肿瘤细胞的异质性(图5A)。可以看到虽然整体是肿瘤细胞,但是病人与病人之间具有较强的瘤间异质性。使用SynEcoSys数据库,不需要经过复杂的生信分析,只需在页面上选择使用样本标签着色,就可以得到相同的结果(图5B)。

图5 肿瘤细胞在不同样本之间存在异质性A,原文分群 B,SynEcoSys数据集分群

总之,如果使用SynEcoSys数据库进行研究初期数据挖掘步骤,不再需要深厚的生信分析能力,简便的网页操作可以快速得到数据可视化图表,把数星期才能完成的繁重分析步骤缩短到了几分钟,节约时间也减少难度。同时,基于大量的单细胞数据的支持,可以免去部分实验的必要,缩减了实验时间和成本。另外,在复现文献结果的同时,SynEcoSys数据库有力支持了数据集的横向比较,可以更好的扩展延申结论,助力研究者们得到更清晰,更全面的数据结果。
好消息!SynEcoSys于近日版本更新中,纳入了TCGA、GTEx和CCLE中的bulk RNA数据,实现在SynEcoSys中一站对比兴趣基因在细胞类型、组织、肿瘤、和肿瘤细胞系中表达情况的横向对比验证。

预先整合4个来源样本的肠炎(IBD) core dataset和几十个新增高质量临床研究数据集也已上线,感兴趣请登录www.synecosys.cn一键获取试用资格,也可以戳SynEcoSys小助手咨询各类问题!

欢迎扫描二维码来添加小助手微信~

参考文献

1. Barkal AA, Brewer RE, Markovic M, et al. CD24 signalling through macrophage Siglec-10 is a target for cancer immunotherapy. Nature. 2019;572(7769):392-396. doi:10.1038/s41586-019-1456-0

2. Krish Patel, Michael B. Maris, Bruce D. Cheson, Jeffrey A. Zonder, Alexander M. Lesokhin, Gottfried Von Keudell, Erlene Kuizon Seymour, Gloria H.Y. Lin, Tina Catalano, Yaping Shou, Swaminathan Padmanabhan Iyer, and Radhakrishnan Ramchandren. Journal of Clinical Oncology 2020 38:15_suppl, 3030-3030

3. Chen S, Zhang Z, Zheng X, et al. Response Efficacy of PD-1 and PD-L1 Inhibitors in Clinical Trials: A Systematic Review and Meta-Analysis. Front Oncol. 2021;11:562315. Published 2021 Apr 16. doi:10.3389/fonc.2021.562315

4. Karaayvaz M, Cristea S, Gillespie SM, et al. Unravelling subclonal heterogeneity and aggressive disease states in TNBC through single-cell RNA-seq. Nat Commun. 2018;9(1):3588. Published 2018 Sep 4. doi:10.1038/s41467-018-06052-0

- THE END -

往期推荐







您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存