单细胞转录组探索CAFs的功能和空间异质性
写在前面
你现在看到的是文献俱乐部2019年笔记分享第一弹,我将会在春节7天连续分享,目录如下:
2019年1月份第1周(总第49周)单细胞转录组探索CAFs的功能和空间异质性
2019年1月份第2周(总第50周)异常CRC病人的突变时空异质性与免疫
2019年1月份第3周(总第51周)探索PDAC癌前病变
2019年1月份第4周(总第52周)TCGA计划的ATAC-seq数据发布
2019年2月份第1周(总第53周)胃癌类器官
2019年2月份第2周(总第54周)测173个成年人的大脑的102个基因
2019年2月份第3周(总第55周)2.5万汉族人的GWAS乳腺癌风险基因
因为学业需要,我阅读的大量文献都是NGS组学相关,所以会涉及到很多数据处理,而这些文献基于的生物信息学数据处理技巧,我都在过去的5年里以各种形式分享讲解过,也有系列视频,希望你可以在方便的时候再次学习一遍,查漏补缺。
也欢迎推荐给有需要的朋友
学习笔记目录
3.一万人陪你学习GEO数据库挖掘知识(公益视频听课笔4.记分享)
……期待有你……
如果,你不仅仅是对NGS组学应用文献感兴趣,也欢迎加入我们文献阅读小组分享自己的主页领域文献。
今天是大年初一,给大家带来的是单细胞转录组探索CAFs的功能和空间异质性,希望你能学到知识。
文献概要
癌相关的成纤维细胞 CAFs,具有异质性,是TME中的重要细胞成分,分泌的特定细胞因子、炎症趋化因子及其它可溶性因子能够诱导减缓细胞循环的过程,从而影响肿瘤细胞的增殖;2018年12月的NC文章:Spatially and functionally distinct subclasses of breast cancer-associated fibroblasts revealed by single cell RNA sequencing 使用成熟的单细胞转录组( Smart-seq2 )手段探索了癌相关的成纤维细胞 CAFs的功能和空间异质性。
Here, we use the highly sensitive Smart-seq2 protocol to delineate the heterogeneity of 768 CAFs isolated from the genetically engineered MMTV-PyMT mouse model of breast cancer
名词背景
single cell RNA sequencing
Cancer-associated fibroblasts (CAFs) / tumor-supportive CAF
extracellular matrix (ECM)
epithelial-to-mesenchymal transition (EMT).
MMTV-PyMT mouse model
a negative selection fluorescence-activated cell sorting (FACS) strategy
the negative selection markers Epcam, Pecam1, and Ptprc
to isolate an EpCAM−/CD45−/CD31−/NG2− cell fraction devoid of epithelial cells, immune cells, endothelial cells, and pericytes, respectively
Smart-seq2 protocol
External RNA Controls Consortium (ERCC) spiked in
principal-component analysis (PCA)
t-distributed stochastic neighbor embedding (t-SNE)
single cell differentially expressed genes (SCDE)
reproducibility-optimized test statistic (ROTS)
differentially expressed genes/significantly differentially expressed (SDE)
log2(RPKM + 1)
PAM50 proliferation metagene
METABRIC cohort
The Cancer Genome Atlas (TCGA) database
six commonly used mesenchymal cell markers
endothelial cell metagene in breast tumors
CAFs 的背景知识
细胞来源
resident fibroblasts
bone marrow-derived mesenchymal stem cells
pericytes
malignant cells or endothelial cells
cellular markers
α-smooth muscle actin (SMA)
fibroblast-specific protein 1 (FSP-1/S100A4)
fibroblast activation protein (FAP)
这些背景知识在文章的introduction部分有介绍:
)
根据相应的分子标记,就可以特异性的分选CAFs进行研究:
单细胞分群及定义
主要分析是tSNE,然后挑选first 150 SDE genes
绘制热图 - 并且进行 gene ontology (GO)
注释来确定不同组的细胞功能:
Population 1 vascular CAFs (vCAFs). 细胞数量最多
Population 2 were named matrix CAFs (mCAFs).
Population 3 cells were termed cycling CAFs (cCAFs). 是vCAFs过渡阶段
Population 4 developmental CAFs (dCAFs).
如下:
可以挑选一些有确切生物学意义的基因
可视化它们在这些不同群细胞的表达量分布情况:
既然很明确的分成4组,那就可以进行差异分析,挑选差异基因绘制热图:
同样的是GO分析注释细胞亚群
的功能:
值得注意的是: cCAFs represent the proliferative segment
of vCAFs 所以最后作者认为是3群细胞,如下图:
其中:vCAF marker Nidogen-2, the mCAF marker PDGFRα, and the dCAF marker SCRG1,这个很重要,需要仔细看作者是如何分析的。
第4群细胞也很特殊,高表达 PyMT , 说明它是肿瘤相关细胞了。
它们3群细胞的ECM相关基因表达模式差别很明显。
6个公共基因集
包括:
EC metagene (CDH5, CXorf36, TIE1)
Microvasculature
Stroma 1
Stroma 2
ECM metagene (COL1A1, COL1A2, COL3A1)
Proliferation
主要是结合TCGA这样的公共数据库:
还有在METABRIC数据库的:
还有在一篇文章的:
单细胞转录组
数据是公开的: GSE111229 代码也是有的: GitHub [www.github.com/KPLab/SCS_CAF].
其ngs测序数据的处理方式也是在methods有详细描述,很容易follow一遍。
首先单细胞数据需要根据一定的指标进行过滤:
最后作者得到的表达矩阵可以直接在GEO数据库里面现在,这样没有服务器的小伙伴就可以在此基础上面走下游分析流程。
关于metagene
每个分组的细胞都有特定的基因集,比如作者分析的top 150的DEGs,也可以通过算法局限到一个基因,就是metagene,看看这个在临床分组的表现情况:
后记
如果你完全没有看懂文章说了些什么,却仍然坚持到了最后,说明你有可能对生物信息学感兴趣,你缺乏的是一个入门的契机!
也欢迎推荐你身边的朋友参与我们的线下培训,如果有缘的话
全国巡讲
生信技能树(爆款入门培训课)全国巡讲免费大放送-赶快告诉你导师吧
……未完待续……