查看原文
其他

单细胞亚群分层级命名并不是我原创

生信技能树 生信技能树 2022-08-10

最近一年我已经是在各种单细胞数据分析实战演练教程里面不止一次的 提到了肿瘤单细胞数据处理的 第一次分群通用规则,一般来说会选择初步很粗狂的定义大的细胞亚群,比如我常用的 第一次分群是通用规则是:

  • immune (CD45+,PTPRC),
  • epithelial/cancer (EpCAM+,EPCAM),
  • stromal (CD10+,MME,fibo or CD31+,PECAM1,endo)

绝大部分文章都是抓住免疫细胞亚群进行细分,包括淋巴系(T,B,NK细胞)和髓系(单核,树突,巨噬,粒细胞)的两大类作为第二次细分亚群。但是也有不少文章是抓住stromal 里面的fibo 和endo进行细分,并且编造生物学故事的。但是,在真实单细胞数据分析里面,你会惊讶的发现,stromal 里面并不是只有fibo 和endo哦,还可以有smooth muscle cells和percite这两个细胞亚群。这也是绝大部分初学者感到困惑的地方,背景知识本来就没有成体系。

其实第一次分群是通用规则的3大亚群的基因是固定的, 背诵下来后跑一下 可视化单细胞亚群的标记基因的5个方法的代码即可,详见以前我们做的投票:可视化单细胞亚群的标记基因的5个方法,下面的5个基础函数相信大家都是已经烂熟于心了:

  • VlnPlot(pbmc, features = c("MS4A1", "CD79A"))
  • FeaturePlot(pbmc, features = c("MS4A1", "CD79A"))
  • RidgePlot(pbmc, features = c("MS4A1", "CD79A"), ncol = 1)
  • DotPlot(pbmc, features = unique(features)) + RotatedAxis()
  • DoHeatmap(subset(pbmc, downsample = 100), features = features, size = 3)

这样的 肿瘤单细胞数据处理的 第一次分群通用规则,越来越成为了主流。其实我也不知道自己看文献是顺序是怎么样的,如何整理到了这样的规律。

比如2021年11月发表在《cancer cell杂志》的文献:《Signatures of plasticity, metastasis, and immunosuppression in an atlas of human small cell lung cancer》就提到了:All scRNA-seq data were merged, normalized, batch-cor- rected, and clustered to identify coarse cell types, including epithelial, mesenchymal, lymphoid, and myeloid cells  ,也就是说 上皮细胞,基质细胞,淋巴系和髓系这两个免疫细胞 :

上皮细胞,基质细胞,淋巴系和髓系免疫细胞

其实早在三年前,就有这样的第一层次分群文章,而且并不是肿瘤领域 ,于22019年发表在cell杂志的文章 《Intra- and Inter-cellular Rewiring of the Human Colon during Ulcerative Colitis》 ,链接是:https://pubmed.ncbi.nlm.nih.gov/31348891/ ,它文章里面的这3个亚群就是我们一直提到的:

  • epithelial cells (EPCAM, KRT8, KRT18),
  • stromal cells (COL1A1, COL1A2, COL6A1, COL6A2, VWF, PLVAP, CDH5, S100B),
  • immune cells (CD52, CD2, CD3D, CD3G, CD3E, CD79A, CD79B, CD14, CD16, CD68, CD83, CSF1R, FCER1G).

太阳底下没有新鲜事,我为了写教程,整理了大量的单细胞文献,实战了三百多个单细胞数据集的处理才总结出来的规律。其实还不容易高人指点一两句话,明明在最开始就可以轻而易举的获得!(比如我们这个专辑的108篇笔记,如果你能坚持看完)

也就是说你千锤百炼获得的,也许仅仅是别人的入门知识!

这就是人生啦,大家的起点不一样,更可怕的是奋斗一辈子才发现自己的终身的成就居然是人家投胎小能手的起点!

探索一下细胞谱系发育层级命名

比如前面提到的上皮细胞继续细分:

  • Absorptive and Secretory subtrees.
    • The Absorptive subtree included further subtrees for Transit Amplifying (TA) cells (Absorptive TA 1, Absorptive TA 2), Immature cells (Immature Enterocytes 1, Immature Enterocytes 2, Enterocyte Progenitors), and Mature cells (Enterocytes, BEST4+ Enterocytes).
    • The Secretory subtree included subtrees for progenitor cells (Secretory TA, Immature Goblet) and for mature cells (Goblet, Tuft, and Enteroendocrine).
  • Stem cells, Cycling TA cells, and M cells were placed directly under the node corresponding to all epithelial cells.

而 Stromal subtree had Fibroblast, Endothelial, and Glial subtrees.

而 The Immune subtree was partitioned into myeloid and lymphoid lineages.

每个大亚群都可以内部细分亚群,然后继续细分,子子孙孙无穷尽。不过实际情况下,大家一般来说区分到第四层级即可,比如Treg属于cd4的T细胞,然后属于T细胞,属于淋巴细胞,属于免疫细胞!

目前好像没有这样的工具?

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存