100篇泛癌研究文献解读之上皮细胞-间充质细胞转化
写在前面:
这个月读了100多篇TCGA数据库挖掘方面的研究,有四大水刊也有CNS级别的,抽时间把其中30多篇文章写了读书笔记,陆陆续续在生信技能树分享了,另外的70篇还在慢慢整理和编辑,这里召集一下志愿者,把我发在公众号的所有的泛癌研究文献的笔记按照下面的格式整理一下:
100篇泛癌研究文献解读之核受体基因家族探索
https://mp.weixin.qq.com/s/gPraooyvlfSK3iBzmYLExg
100篇泛癌研究文献解读之使用EXPANDS和PyClone量化肿瘤内部异质性
https://mp.weixin.qq.com/s/2qJbyRVwtqCw5kmijPw7hw
发邮件 jmzeng1314@163.com 给我你整理的目录,有惊喜哈!
邮件开头,请以: 我帮你整理了目录,我希望你可以认识我!
为了分析不同类型、组织起源肿瘤的共性、差异以及新课题。TCGA于2012年10月26日-27日在圣克鲁兹,加州举行的会议中发起了泛癌计划。参考:https://www.ncbi.nlm.nih.gov/pmc/articles/PMC6000284/ 为此我也录制了系列视频教程在:TCGA知识图谱视频教程(B站和YouTube直达)
今天要介绍的是发表于 Dev Dyn. 2018 Mar;的研究,题目是:Pan-cancer survey of epithelial-mesenchymal transition markers across the Cancer Genome Atlas. 系统性的分析了32个癌症的一万个病人的数据,主要集中于 16-gene signature of canonical EMT markers 跟前面的 Sci Rep. 2013 Oct 和 Nat Commun. 2014 Sep ,还有 Nucl Receptor Res. 2015 Dec 类似的地方,都是研究固定有生物学意义的基因集。
这16个基因是:13 mesenchymal marker genes (VIM, CDH2, FOXC2, SNAI1, SNAI2, TWIST1, FN1, ITGB6, MMP2, MMP3, MMP9, SOX10, GCS) and three epithelial marker genes (CDH1, DSP, OCLN).
文献解读属于100篇泛癌研究文献系列,首发于:http://www.bio-info-trainee.com/4132.html
EMT背景知识
上皮细胞-间充质细胞转化(EMT)——上皮肿瘤细胞失去黏附能力获得间充质细胞迁移性能力以促进转移和耐药性的过程,EMT程度不同的细胞就会呈现出不同的转移性质。
皮肤癌和乳腺癌组织中至少存在7中EMT状态不同的癌细胞亚群:从完全上皮化(分化)到完全的间充质化(未分化)状态,中间是各种杂化状态。参考:Identification of the tumour transition states occurring during EMT, Nature (2018)
全局看EMT表达热图
可以看到EMT基因的表达量异质性:
不同的EMT打分算法的相关性
EMT scores based on part A (referred to here as the “Creighton” EMT signature, as previously featured in (Creighton et al., 2013)) with EMT scores based on another previously published signature by Byers et al. (Byers et al., 2013).
如下图:
还算是比较一致。
EMT得分和肿瘤纯度的相关性
这里作者选择了 “Creighton” EMT signature来代表EMT,跟肿瘤纯度是负相关。
所以作者又检查了这EMT基因集里面的基因之间的表达量相关性,校正肿瘤纯度前后看区别。
EMT基因和转录因子相关基因的表达量相关性
An initial set of 377 genes with Gene Ontology annotation of “transcription factor complex” or “transcription factor binding” were selected
有107个基因跟EMT signature score相关性很高,
EMT基因和肿瘤免疫相关基因的表达量相关性
首先看重要的免疫靶点,如下:
然后可以在XCELL下载64种免疫指数,然后计算相关性
生存分析
这16个基因的EMT值,高的EMT值非常显著的与坏的生存相关,而且是跨越癌症种类的。
后记
从流程图来看,本研究并不复杂,也很容易复现出来,后面我们会在GitHub公布数据复现的代码。
当然了,如果你想超脱于他们的泛癌计划已经发表的研究,那么就非常有必要跟着我读完这100篇泛癌文献!
详见我的100篇泛癌研究文献解读目录:http://www.bio-info-trainee.com/4132.html
TCGA教程长期更新列表
TCGA的28篇教程-使用R语言的cgdsr包获取TCGA数据(cBioPortal)
TCGA的28篇教程-使用R语言的RTCGA包获取TCGA数据 (离线打包版本)
TCGA的28篇教程-使用R语言的RTCGAToolbox包获取TCGA数据 (FireBrowse portal)
TCGA的28篇教程-批量下载TCGA所有数据 ( UCSC的 XENA)