原发肿瘤和转移瘤的哪个多组学层面的差异大?
前面我在癌旁的正常组织都是naive的CD4和CD8阳性T细胞吗? 提到过肿瘤单细胞研究最容易想到的就是疾病进展相关,从患者正常血液组织到癌旁到原位肿瘤的分组,或者加入淋巴结,器官转移。其实在没有单细胞技术之前,也是这样的实验设计,上一个热点就是多组学,比如TCGA数据库的多个癌症队列的肿瘤外显子,转录组,蛋白质组的结合。
2020年11月的文章《 Integrated Omics of Metastatic Colorectal Cancer》就是多组学肿瘤研究的佼佼者,基于多组学的分析对来自长海医院(中国上海)的146例中国结直肠癌(CRC)的患者,包括70例转移性 CRC (mCRC)患者和76例早期非转移性 CRC (非 mCRC)患者,取样非常丰富:
原发肿瘤组织(T) 远端正常组织(N) 癌旁组织(P,正常邻近组织) 匹配的外周血细胞(BC) 其中43个病人有可用的远处肝转移组织(LM)
让我奇怪的是这个文章的结论是:突变图谱显示原发肿瘤和转移肿瘤之间高度一致,但原发肿瘤和转移肿瘤在蛋白质组水平上可以清楚地区分开来。
第一个结论是突变(点突变以及拷贝数变异)层面差异不大
如下所示:
但是我看了看文章的配图,我个人感觉差异应该是存在,但是差异大不大就很难下结论了:
上面的图A里面的可以看到每个病人的原位肿瘤和转移部位突变位点是不可能是百分比一致的,哪怕是取同一个病人的原位肿瘤的两个相邻区域也会有差异因为有肿瘤内部异质性,肿瘤是不断地克隆进化的混合物。而且,就算是同一个肿瘤样品两次不同时间不同测序仪得到的突变位点也会有差异,因为不同数据分析流程不同软件参数都会有影响。但是如何界定两次突变是否差异大,这个确实目前没有公论,上面的图A里面的每个病人的原位肿瘤和转移部位突变位点共有突变在50%附近徘徊,而且动态变化很大,实在是不好说它差异不大,而且确实原位肿瘤的突变数量多一点,虽然统计学显著性没有达到。
所以作者这个时候把CRC癌症特有突变以及肿瘤相关重要的基因突变拿出来对比,发现差异就没那么大了,如下所示:
但是这个差异不大居然是队列层面,而不是具体的某个病人配对的原发肿瘤和转移瘤的差异。
如果你也有类似的肿瘤外显子测序数据,可以看《肿瘤外显子》专栏的目录(节选)如下:
(一)读文献并且下载测序数据 (二)质控与去接头 (三)比对 (四)比对结果的质控 (番外篇)bam文件载入igv可视化 (五)GATK的最佳实践 (六)vcf文件的注释及ANNOVAR的使用 (七)maftools可视化 (八)不同注释软件的比较(上):安装及使用 (八)不同注释软件的比较(中):注释后转成maf文件 (八)不同注释软件的比较(下):可视化比较maf文件
通常肿瘤外显子测序数据是病人相关的,很难直接开放fastq测序数据给大家下载,也就没有办法走上面的《肿瘤外显子》专栏教程。不过也有很多文章会开放maf文件格式的点突变数据信息,也可以做很多统计可视化的。
然后是蛋白质产物层面差异很大
如下所示:
蛋白质组本质上也是得到表达量矩阵,所以它的绝大部分分析都是跟转录组类似,也是最简单的质量控制图表,比如PCA图,确实很明显看到原发肿瘤和转移瘤这两个分组差异很大,可以说是泾渭分明了:
既然原发肿瘤和转移瘤这两个分组差异很大,就可以做差异分析富集分析,然后可视化各个分组特异性高表达量的基因及其生物学功能注释信息了。
参考:
https://zhuanlan.zhihu.com/p/237325751 https://www.bilibili.com/read/cv10975806/ https://www.seqchina.cn/12591.html
其它层面组学呢?
虽然上面的文章《 Integrated Omics of Metastatic Colorectal Cancer》说明了突变(点突变以及拷贝数变异)层面的信息,不如蛋白质产物层面信息能区分原发肿瘤和转移瘤。但是并没有比较其它层面信息,比如甲基化信号情况,单细胞水平的细胞亚群比例情况等等。
但是这样的原发肿瘤和转移瘤对比实验设计实在是太简单了,肯定是可以找到其它组学层面数据进行对比汇总。
我比较疑惑的是这个是结直肠癌原位肿瘤以及各个病人配对的肝转移组织(LM)的转录组或者蛋白质组层面表达当然是有差异,因为器官都不一样,起码器官特异性表达就足以区分原发肿瘤和转移瘤的两个分组了。然后结直肠癌原位肿瘤的突变(点突变以及拷贝数变异)很容易理解,就是肿瘤对比正常组织的差异,但是肝转移组织(LM)的突变就有点难以理解,是直肠癌原位肿瘤细胞跑到了肝部位定居并且扩大呢,还是直肠癌原位肿瘤跑到了肝部位然后源源不断的驯化肝部位的细胞癌变呢?从作者的结果来看,应该是直肠癌原位肿瘤细胞跑到了肝部位定居并且扩大这些肿瘤细胞,并没有影响肝部位本身的细胞。
文末友情宣传
强烈建议你推荐给身边的博士后以及年轻生物学PI,多一点数据认知,让他们的科研上一个台阶:
数据挖掘(GEO,TCGA,单细胞)2022年暑期班(收官之作),快速了解一些生物信息学应用图表 生信入门课-2022年暑期班(收官之作),你的生物信息学第一课