多组学探索卵巢癌耐药(逆向收费读文献2019-14)
上一次发布文献阅读笔记已经是小半年前了:NPC的突变特性(逆向收费读文献2019-13)这个是我将来会制作的生物信息学入门200篇NGS文献导读书籍的素材,虽然暂时还没有成书,但希望干货满满的解读能对你有所帮助!
高级浆液性卵巢癌(HGSC)是常见的上皮性卵巢癌,也是最致命的卵巢癌之一。这种类型的卵巢癌患者,确诊后的5年存活率只有30%。但由于缺乏临床应用(从诊断到患者生存率预后)的生物标志物,我们对HGSC仍然知之甚少。
本次要分享的文献发表于 Nature. 2015 May ,截止到目前(2019-09-29 )被引用超600了,算是比较火爆的文献。题目是:Whole-genome characterization of chemoresistant ovarian cancer.
背景知识
关于HGSC high-grade serous ovarian cancer
卵巢癌比较完整分类,参考:April 2019 文献 https://doi.org/10.1038/s41591-019-0422-6
borderline tumors (BTs; non-carcinoma) 约占15%
primarily of serous BT (SBT)
mucinous BT (MBT) subtypes
type I (carcinomas)
low-grade serous (LGS)
mucinous(MC)
endometrioid (END)
clear cell (CCC) carcinomas
type II tumors (carcinomas)
high-grade serous (HGS) tumors
HGS的来源:
fimbria of the fallopian tube (FT)
surface epithelium (OSE)
关于高级别卵巢癌中 PARP抑制剂
卵巢癌一种基因组变化复杂及高异质性的癌种,因而通过其基因表达情况来准确判断表征不同亚型是十分困难的。但推动肿瘤分子分型对于临床实践应用价值巨大,PARP抑制剂在同源重组修复缺陷肿瘤中的应用即为分子分型价值提供了良好佐证。通过了解不同亚型的生物学机制,临床工作者将为患者提供更加具有针对性的治疗。
测序数据存放
WGS以及RNA-seq这样的NGS数据肯定是在European Genome-phenome Archive (EGA) 啦,需要申请才可以下载,其它芯片类的数据公布在GEO,是可以免费下载的:
GSE61568 | Whole genome characterisation of chemoresistant ovarian cancer [Illumina_Omini 2.5-8_SNP] |
---|---|
GSE65819 | Whole genome characterisation of chemoresistant ovarian cancer [NanoString miRNA] |
GSE65820 | Whole genome characterisation of chemoresistant ovarian cancer [Illumina_450K_Methylation] |
其中甲基化芯片信号矩阵可以直接下载:ftp://ftp.ncbi.nlm.nih.gov/geo/series/GSE65nnn/GSE65820/matrix/GSE65820_series_matrix.txt.gz
拷贝数芯片数据可能是需要下载芯片原始数据然后自己走一波流程,最后的miRNA数据应该是有最后的表达矩阵信息。
病人队列信息
病人最重要的临床信息是:
多组学数据的分析结果,就需要根据这些临床信息来进行病人分组比较,主要是WGS数据的SNV和SV事件。
总共是114个肿瘤WGS配对测序,深度50X附近,总共一百多万somatic的snv,其中2%是在蛋白编码区域。
TP53的截断突变和无意突变对其表达影响不一样
如下图:
WGS和RNA-seq得到的融合基因
使用MapSplice 软件对RNA-seq数据可以找到近5万的融合事件,其中0.3%在WGS里面也发现,而且WGS总共不到500个,就有151是在RNA-seq数据被发现的。(这个RNA-seq数据得到融合基因事件有点多啊)
BRCA1和BRCA2基因的先天性病理突变
在性别相关的癌症里面,经常是需要展现一下BRCA1和BRCA2基因的先天性病理突变情况,如下所示,
肿瘤纯度是否影响SV和SNV数量
首先可以看看病人取样的肿瘤纯度是否影响WGS数据分析得到的SV和SNV数量
HR通路突变是否也影响SV和SNV数量
首先看看HR通路的重要基因的突变情况,如下:
然后看它们是否影响WGS结果的SV和SNV数量
SNV的模式分布情况与一些临床指标的关系
SNV的模式通常是Mutational signature,之前是 https://cancer.sanger.ac.uk/cosmic/signatures_v2 本来就30个signature即可,搞清楚它们的生物学功能即可,现在 https://cancer.sanger.ac.uk/cosmic/signatures 看起来更复杂了一点。R包也是由SigProfiler到 deconstructSigs 的转变
首先看4个突变模式的比例情况:
关注的是:
Signature , mismatch repair (Signature 6);
Signature , APOBEC (Signature 13);
Signature , Age (Signature 1B)
Signature , BRCA1/2 mutations (Signature 3)
值得注意的是COSMIC数据库已经更新了这些mutation signature,感兴趣的朋友可以直接去官网查看了解。
很明显,这些不同模式的比例也跟一些临床指标是有关的。
转录表达和拷贝数变异相关
转录组数据可以和拷贝数变异结果进行联合分析,简单的相关性分析即可。
差异分析
不同的分组比较得到不同的差异分析结果:
There were 129 genes identified as differentially expressed between the resistant and sensitive tumours (Supplementary Table 15).
MetaCore (http://thomsonreuters.com/metacore/) network analysis of these genes identified pathways with multiple hits, including
WNT signalling (CTBP1, FBXW11, TCF4 and SKP1)
NAD metabolism (KMO and NUDT12)
epithelial cell differentiation (FOXJ1 and SMAD5).
如果是比较CCNE1 amplified/gain and HRD tumours ,那么会得到 226个显著差异表达基因,在 Supplementary Table 16). 同样是使用MetaCore进行基因集注释。
miRNA分析
这里使用的是nCounterHuman v2.1 miRNA expression analysis kit (Nanostring Technologies) 平台,同样也是多种差异分析策略,包括refractory, resistant, sensitive之间,还有亚型之间的比较。全文展示其结果很少。
甲基化芯片数据分析
使用的是450K,对 80 primary HGSC tumours and 7 fallopian tube (FT) samples , 相比起FT样本来说,肿瘤样品有近1万个甲基化探针信号值上升,包括3千多基因,但是 primary sensitive (n = 34) and primary resistant/refractory 之间没有统计学显著差异。
然后把甲基化信号差异结果,跟mRNA-seq差异结果比较起来看,有433个基因是甲基化上升并且mRNA表达水平下降的,在Supplementary Table 18.1列出。
值得注意的是文章仅仅是关心了 BRCA1 这个基因单独的启动子区域的甲基化水平。
如果想系统学习生信,下面的课程你可能会需要!
1
全国巡讲第17站
2
全国巡讲第18站
1 | 生信-R语言入门 |
2 | GEO数据库挖掘 |
3 | 生信-LINUX基础 |