单细胞分群后继续分亚群的一些例子
众所周知,单细胞水平的研究,就是为了深入了解异质性,除了可以区分已知的细胞亚型,还可以对亚型进行进一步细分,或者找到全新的细胞亚型。当然了,每个细胞亚型的marker基因需要一些生物学背景。
比如发表在 Nat Med. 2018 Aug; 题目是:Phenotype molding of stromal cells in the lung tumor microenvironment. 共选取5例病人的共19个样本,通过10×genomics单细胞转录组测序探索基质细胞的亚群分类、基因功能(信号通路)、关键marker基因和临床预后。共鉴定出52个基质细胞亚群,反映了肿瘤微环境复杂性。对基质细胞的marker基因做生存曲线,发现这些marker基因可以作为肺癌预后诊断的潜在标志物。
如下所示,就是先初步分群,再细分群
其实就是我一直讲解的单细胞流程,基本上学习5个R包就够用了,分别是: scater,monocle,Seurat,scran,M3Drop 需要熟练掌握它们的对象, 而且分析流程也大同小异:
单细胞R包如过江之卿,入门的话我推荐大家学习5个R包,分别是: scater,monocle,Seurat,scran,M3Drop 需要熟练掌握它们的对象,:一些单细胞转录组R包的对象 而且分析流程也大同小异:
step1: 创建对象
step2: 质量控制
step3: 表达量的标准化和归一化
step4: 去除干扰因素(多个样本整合)
step5: 判断重要的基因
step6: 多种降维算法
step7: 可视化降维结果
step8: 多种聚类算法
step9: 聚类后找每个细胞亚群的标志基因
step10: 继续分类
初步分群就用Seurat
比如发表在 PNAS September 24, 2019 的文章The single-cell transcriptomic landscape of early human diabetic nephropathy ,链接 https://doi.org/10.1073/pnas.1908706116
收集了 23,980 single-nucleus transcriptomes from 3 control and 3 early diabetic nephropathy samples. 平均每个细胞有 2,541 genes and 6,894 unique molecular ,使用Seurat就可以初步分群拿到Eleven kidney cell types和four immune cell types
All data can be queried by users and visualized online at http://humphreyslab.com/SingleCell/.(这个网页工具的故事,明天分享)
这些细胞类型全称如下,应该是只有专门研究这个领域的看到这些简称才不会陌生:
PCT, proximal convoluted tubule;
CFH, complement factor H;
LOH, loop of Henle;
DCT, distal convoluted tubule;
CT, connecting tubule;
CD, collecting duct;
PC, principal cell;
IC, intercalated cell;
PODO, podocyte;
ENDO, endothelium;
MES, mesangial cell;
LEUK, leukocyte.
需要有相关生物学背景知识,才知道根据哪些marker基因来对群进行命名,这个图也是单细胞的标配:
可以看到 LEUK, leukocyte.的 marker基因是PTPRC
Coding sequence variants identified in PTPRC (human CD45)
Protein tyrosine phosphatase, receptor type, C also known as PTPRC is an enzyme that, in humans, is encoded by the PTPRC gene.[5] PTPRC is also known as CD45 antigen (CD stands for cluster of differentiation), which was originally called leukocyte common antigen (LCA).[6]
对leukocyte细分亚群
这个就是大家比较熟悉的啦,各种免疫细胞。提取这个leukocyte的表达矩阵,继续跑Seurat流程:
同样的,细分的亚群也是有自己的marker基因,可以看到B细胞和T细胞就很不一样。
如果是10X仪器的单细胞转录组数据走cellranger流程,我们在单细胞天地多次分享过流程笔记:
拿到表达矩阵后再走Seurat流程哦。
最后一个思考题
细胞分群后细胞亚群是无限划分的吗?
另外:预告一下,明天,一个长大了才会遇到的帅哥,周运来会给大家带来一个shiny构建单细胞相关网页工具的推荐教程。
如果你对单细胞转录组研究感兴趣,但又不知道如何入门,也许你可以关注一下下面的课程
看完记得顺手点个“在看”哦!
长按扫码可关注