查看原文
其他

单细胞分群后继续分亚群的一些例子

生信技能树 单细胞天地 2022-06-07

众所周知,单细胞水平的研究,就是为了深入了解异质性,除了可以区分已知的细胞亚型,还可以对亚型进行进一步细分,或者找到全新的细胞亚型。当然了,每个细胞亚型的marker基因需要一些生物学背景。

比如发表在 Nat Med. 2018 Aug; 题目是:Phenotype molding of stromal cells in the lung tumor microenvironment. 共选取5例病人的共19个样本,通过10×genomics单细胞转录组测序探索基质细胞的亚群分类、基因功能(信号通路)、关键marker基因和临床预后。共鉴定出52个基质细胞亚群,反映了肿瘤微环境复杂性。对基质细胞的marker基因做生存曲线,发现这些marker基因可以作为肺癌预后诊断的潜在标志物。

如下所示,就是先初步分群,再细分群


其实就是我一直讲解的单细胞流程,基本上学习5个R包就够用了,分别是: scater,monocle,Seurat,scran,M3Drop 需要熟练掌握它们的对象, 而且分析流程也大同小异:

单细胞R包如过江之卿,入门的话我推荐大家学习5个R包,分别是: scater,monocle,Seurat,scran,M3Drop 需要熟练掌握它们的对象,:一些单细胞转录组R包的对象 而且分析流程也大同小异:

  • step1: 创建对象

  • step2: 质量控制

  • step3: 表达量的标准化和归一化

  • step4: 去除干扰因素(多个样本整合)

  • step5: 判断重要的基因

  • step6: 多种降维算法

  • step7: 可视化降维结果

  • step8: 多种聚类算法

  • step9: 聚类后找每个细胞亚群的标志基因

  • step10: 继续分类

初步分群就用Seurat

比如发表在 PNAS September 24, 2019  的文章The single-cell transcriptomic landscape of early human diabetic nephropathy ,链接 https://doi.org/10.1073/pnas.1908706116

收集了 23,980 single-nucleus transcriptomes from 3 control and 3 early diabetic nephropathy samples.  平均每个细胞有 2,541 genes and 6,894 unique molecular ,使用Seurat就可以初步分群拿到Eleven kidney cell types和four immune cell types 

All data can be queried by users and visualized online at http://humphreyslab.com/SingleCell/.(这个网页工具的故事,明天分享)

这些细胞类型全称如下,应该是只有专门研究这个领域的看到这些简称才不会陌生:

  • PCT, proximal convoluted tubule;

  • CFH, complement factor H;

  • LOH, loop of Henle;

  • DCT, distal convoluted tubule;

  • CT, connecting tubule;

  • CD, collecting duct;

  • PC, principal cell;

  • IC, intercalated cell;

  • PODO, podocyte;

  • ENDO, endothelium;

  • MES, mesangial cell;

  • LEUK, leukocyte.

需要有相关生物学背景知识,才知道根据哪些marker基因来对群进行命名,这个图也是单细胞的标配:


可以看到 LEUK, leukocyte.的 marker基因是PTPRC

Coding sequence variants identified in PTPRC (human CD45)

Protein tyrosine phosphatase, receptor type, C also known as PTPRC is an enzyme that, in humans, is encoded by the PTPRC gene.[5] PTPRC is also known as CD45 antigen (CD stands for cluster of differentiation), which was originally called leukocyte common antigen (LCA).[6]

对leukocyte细分亚群

这个就是大家比较熟悉的啦,各种免疫细胞。提取这个leukocyte的表达矩阵,继续跑Seurat流程:


同样的,细分的亚群也是有自己的marker基因,可以看到B细胞和T细胞就很不一样。


如果是10X仪器的单细胞转录组数据走cellranger流程,我们在单细胞天地多次分享过流程笔记:

拿到表达矩阵后再走Seurat流程哦。

最后一个思考题

细胞分群后细胞亚群是无限划分的吗?

另外:预告一下,明天,一个长大了才会遇到的帅哥,周运来会给大家带来一个shiny构建单细胞相关网页工具的推荐教程。

如果你对单细胞转录组研究感兴趣,但又不知道如何入门,也许你可以关注一下下面的课程



看完记得顺手点个“在看”哦!


生物 | 单细胞 | 转录组丨资料每天都精彩

长按扫码可关注

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存