单细胞文献你不整理，过后甚至会忘记自己曾经读过

生信技能树

单细胞文献你不整理，过后甚至会忘记自己曾经读过 Original

考虑到咱们生信技能树粉丝对单细胞数据挖掘的需求，我开通了一个专栏《100个单细胞转录组数据降维聚类分群图表复现》，也亲自示范了几个，不过自己带娃，读博，时间精力有限，所以把剩余的90多个任务安排了学徒，实习生，学员。真的是太棒了，群策群力！

下面号召大家参与

我们的《单细胞文献100》活动激起了大家对单细胞的兴趣，马上交流群有朋友咨询B细胞的细分亚群，希望给出参考文献，我恰好在看新冠病毒相关单细胞数据分析文章，就给出来了这个：《Single-cell landscape of immunological responses in patients with COVID-19》

该研究的实验设计很清晰，就是 5 个正常人加上13个患者的血液进行单细胞转录组：

healthy donors (HDs) (n = 5),
moderate (n = 7),
severe (n = 4)
convalescent (n = 6) samples

实验设计

第一层次降维聚类分群

总共是 122,542 cells ，第一层次降维聚类分群是14个：

naive-state T (naive T) cells (CD3+CCR7+)
activated-state T (activated T) cells (CD3+PRF1+)
mucosal-associated invariant T (MAIT) cells (SLC4A10+TRAV1-2+)
γδ T cells (TRGV9+TRDV2+)
proliferative T (pro T) cells (CD3+MKI67+)
natural killer (NK) cells (KLRF1+)
B cells (MS4A1+)
plasma B cells (MZB1+)
CD14+ monocytes (CD14+ mono; LYZ+CD14+)
CD16+ monocytes (CD16+ mono; LYZ+FCGR3A+)
monocyte-derived dendritic cells (mono DCs; CD1C+)
plasmacytoid dendritic cells (pDCs; LILRA4+)
plate- lets (PPBP+)
hemopoietic stem cells (HSCs; CYTL1+GATA2+).

其umap可视化如下所示：

第一层次降维聚类分群可视化umap

这个配色其实不容易区分，虽然色彩很饱满。每个细胞亚群各自标志性基因的表达量展示，文章也做的很好，这里就不赘述。以前我们做了一个投票：可视化单细胞亚群的标记基因的5个方法，下面的5个基础函数相信大家都是已经烂熟于心了：

VlnPlot(pbmc, features = c("MS4A1", "CD79A"))
FeaturePlot(pbmc, features = c("MS4A1", "CD79A"))
RidgePlot(pbmc, features = c("MS4A1", "CD79A"), ncol = 1)
DotPlot(pbmc, features = unique(features)) + RotatedAxis()
DoHeatmap(subset(pbmc, downsample = 100), features = features, size = 3)

核心分析：细胞比例变化和差异分析

单细胞的多组对照设计（例如正常组与给药组）可以为细胞类型水平比较提供以往Bulk RNA-seq分析所不能达到的精度。对此一般有两种进阶分析思路：

（1）DE(Differential expression)--两组样本的同一细胞类型的基因表达差异分析；
（2）DA(Differential abundance)--两组样本的同一细胞类型的丰度差异分析

参考：http://bioconductor.org/books/release/OSCA/overview.html

这个文章《Single-cell landscape of immunological responses in patients with COVID-19》的figures2和figures3就分别对应细胞比例差异分析和基因表达量差异分析。

各个亚群细分

首先是NK,CD4和CD8细分

第二层次降维聚类分群是：

6 subtypes of CD4+ T cells (CD3E+CD4+),
3 subtypes of CD8+ T cells (CD3E+CD8A+)
3 subtypes of NKT cells (CD3E+CD4–CD8A–TYROBP+).

NK,CD4和CD8细分

如上图所示，出现了第三层次降维聚类分群：

naive CD4+ (CD4+ naive) T cell (CCR7+SELL+)
memory CD4+ (CD4+ memory) T cell (S100A4+GPR183+)
effector memory CD4+ (CD4+ effector memory) T cell (S100A4+GPR183+GZMA+)
regulatory T (Treg) cell (FOXP3+IL2RA+)
naive CD8+ (CD8+ naive) T cell subset (CCR7+SELL+)
effector CD8+ T cell subsets (CD8+ effector-GZMK and CD8+ effector-GNLY),
naive NKT (NKT naive) cells (CCR7+SELL+),
CD56+ NKT (NKT CD56) cells
CD160+ NKT (NKT CD160) cells

有了这些细分的生物学功能亚群，然后又可以进行核心分析：细胞比例变化和差异分析

单细胞的多组对照设计（例如正常组与给药组）可以为细胞类型水平比较提供以往Bulk RNA-seq分析所不能达到的精度。对此一般有两种进阶分析思路：

（1）DE(Differential expression)--两组样本的同一细胞类型的基因表达差异分析；
（2）DA(Differential abundance)--两组样本的同一细胞类型的丰度差异分析

参考：http://bioconductor.org/books/release/OSCA/overview.html

划重点：B细胞的细分亚群

如下所示：

B细胞的细分亚群

主要是6大亚群：

one naive B subset (MS4A1+IGHD+)
one memory B subset (MS4A1+CD27+)
one intermediate transi- tion memory B subset (intermediate memory B; IGHD+CD27+)
one germinal center B subset (MS4A1+NEIL1+)
two plasma subsets plasma B (MZB1+CD38+)
dividing plasma B (MZB1+ CD38+MKI67+).

当然了，每个亚群各自特异性基因表达量也可视化成功。

更有意思的是，在群里跟大家交流后，提问的小伙伴居然恍然大悟，原来是他自己本来就是看过这个文献。但最开始仅仅是在朋友圈浏览了中文介绍，自己也是下载了原文pdf也是匆匆一瞥。

问题在于

没有记录笔记，其实这样的文献对我们的价值并不大，我们能用到的就是降维聚类分群和各个细分亚群标记基因啊！整理起来也非常容易，但是做过就是做过，比匆匆一瞥好太多了。

写在文末

咱们现在这个专栏《100个单细胞转录组数据降维聚类分群图表复现》分享的代码是到此为止，但是一般来说单细胞文章数据分析还有很多进阶图表制作，比如inferCNV看肿瘤拷贝数变异，monocle看拟时序等等。如果你也需要，可以加入我们这个专栏《100个单细胞转录组数据降维聚类分群图表复现》创作团队，获取进阶指引哦！见：急！计划招募100个单细胞爱好者，免费学全套单细胞降维聚类分群和生物学亚群注释

大摩宏观策略谈：2025中美变局展望

假设，你遇到麦琳怎么办？

董事长两口子不干了，至暗时刻谁是白衣骑士

2024年心理咨询师报名通道开启！可考心理证书，无需辞职，名额有限，11月30日截止报名！！！

穿了跟没穿一样，胸型赞到爆！天然乳胶，性感到让男人腿软！

第一层次降维聚类分群

核心分析：细胞比例变化和差异分析

各个亚群细分

首先是NK,CD4和CD8细分

划重点：B细胞的细分亚群

问题在于

写在文末

文末友情推荐

您可能也对以下帖子感兴趣

大摩宏观策略谈：2025中美变局展望

假设，你遇到麦琳怎么办？

董事长两口子不干了，至暗时刻谁是白衣骑士

2024年心理咨询师报名通道开启！可考心理证书，无需辞职，名额有限，11月30日截止报名！！！

穿了跟没穿一样，胸型赞到爆！天然乳胶，性感到让男人腿软！

生成图片，分享到微信朋友圈

第一层次降维聚类分群

核心分析：细胞比例变化和差异分析

各个亚群细分

首先是NK,CD4和CD8细分

划重点：B细胞的细分亚群

问题在于

写在文末

文末友情推荐

您可能也对以下帖子感兴趣