查看原文
其他

当你的单细胞亚群都不特异的时候肿么办

生信技能树 生信技能树 2022-08-15

做单细胞数据分析,我们当然希望看到一个清晰的降维聚类分群结果,这样才方便做生物学亚群注释,比如前面的例子:人人都能学会的单细胞聚类分群注释  ,第一次分群就非常漂亮!

但那个毕竟是理想情况下,实际上很多单细胞数据集分析到最后,分群其实很勉强,比如2019年11月发表的皮肤单细胞文章,标题是:《Transcriptome landscape of myeloid cells in human skin reveals diversity, rare populations and putative DC progenitors》,链接在:https://doi.org/10.1016/j.jdermsci.2019.11.012,研究者们对10个健康受试者的皮肤样品进行单细胞测序,然后鉴定了 myeloid cell populations.

我看到作者给出了一个重要的单细胞亚群图,如下所示:

初始单细胞分群

可以看到,这个就是普通的降维聚类分群,选取tSNE的坐标,最简单的seurat配色分群,就直接出图了。有很多可以改进的地方,比如umap的可视化这个时候理论上就会比原始的tSNE好很多。

但是这22个原始分群是如何被作者给出来生物学名字的,就很有意思了。如果是从标记基因角度,你很难看出来作者是如何对不同细胞亚群进行生物学注释的:

标记基因气泡图

作者这里的细胞亚群及其大类的定义就很扯淡,内皮细胞可以和免疫细胞并列,其中免疫细胞可以细分为淋巴系和髓系,但是那个树突细胞和巨噬细胞理论上都是myeloid这样的髓系免疫细胞啊,而且这里面的成纤维细胞居然并不是一个大类别,而且也不显示它的通用标记基因。

细分亚群也是如此

上面我们提到了,树突细胞和巨噬细胞理论上都是myeloid这样的髓系免疫细胞,所以作者这里也把它们混起来进行细分亚群,如下所示:

Fig. 2. Re-clustering of macrophages and dendritic cells.

树突细胞和巨噬细胞细分亚群

然后细分的亚群,命名呢,并不是生物学功能命名,而是以单个基因特异性进行命名。但是后续标记基因气泡图又采取了另外的命名方式,如下所示:

  • proliferating genes (sky blue bar),
  • dendritic cell markers (dark blue bar),
  • macrophage markers (black bar),
  • cDC2 markers (orange bar),
  • cDC1 markers (cyan bar),
  • Mw/DC subcluster #0 markers (red bar)
  • Mw/DC subcluster #1 markers (brown bar).

细分亚群的生物学注释

Mw/DC subcluster #5 is a cluster of proliferating DCs and appearing to represent cDC2 progenitors.

而且居然还可以进行差异分析

  • fcDC2 marker gene set (comprising CD1C, CD1E, CD1A, CD11b, CD11c, FCER1A, SIRPA and CLEC10A)
  • cDC1 marker gene set (comprising CLEC9A, CADM1, IDO1 and XCR1).

也是非常的勉强:

勉强进行的差异分析

这个时候我就非常佩服作者讲故事的能力了,无论多么差的数据分析结果,只有能给一个合理的生物学解释,就足以发表了。

灵活拷问

如果是你的数据遇到了如此尴尬的分群,你会怎么办?

另外,作为一个学徒作业吧,想办法拿到这个文章的单细胞转录组数据,走一下我们一直讲解的单细胞转录组数据处理流程,看看能不能拿到比作者漂亮的结果哈!

文末友情推荐

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存