拟时序分析的10个步骤
最近刷了刷植物领域单细胞文献,有一个蛮早期的拟南芥根部单细胞研究:《High-Throughput Single-Cell Transcriptome Profiling of Plant Cell Types》对拟时序分析描述的很清楚,适合做科普!
首先当然是对原始单细胞转录组表达量矩阵的降维聚类分群啦,这个在前面的例子:人人都能学会的单细胞聚类分群注释 ,我们演示了第一层次的分群。本文是植物学,但是原理是类似的,只不过不同细胞亚群的标记基因不一样。
然后你需要有背景知识才能做 拟时序分析 :文章是这样描述:focusing on endodermal cells, which have a known trajectory from undifferentiated, to state I (defined by the formation the Casparian strip), to state II (defined by the formation of a secondary cell wall made of suberin) (Andersen et al., 2015)
参考文献也列的明明白白,可以看到 发育顺序如下所示,从undifferentiated 到state I 然后到state II,这个背景知识决定了你要不要做拟时序分析,已经针对哪部分细胞亚群进行拟时序分析哦!
然后你需要提取指定单细胞亚群去运行拟时序分析,最经典的软件工具当然是monocle啦 ,代码超级简单,我们在《单细胞天地》公众号也多次分享过,而且三年前的我们一个单细胞公开课就是重点讲解这个代码:「生信技能树」使用Smart-seq2单细胞转录组数据探索小鼠性腺发育,链接是:https://www.bilibili.com/video/BV1454y1q77Z
运行结果如下所示:
可以看到,有两个发育分支,接下来就可以展现一下重要的基因,在拟时序的两个分支上面:
然后是拟时序的的各自特征基因的生物学功能数据库注释:
这一套图表的代码也是在「生信技能树」使用Smart-seq2单细胞转录组数据探索小鼠性腺发育,链接是:https://www.bilibili.com/video/BV1454y1q77Z ,学完了就能做出来哦!
总结一下这10个步骤:
降维聚类分群 提取指定单细胞亚群 运行monocle 判断拟时序分析推断好的发育轨迹 随着轨迹变化的基因获取 获取的基因的生物学功能数据库注释 还有四个步骤在这个文章里面并没有体现,这里略
拟时序分析是否可以对全部单细胞亚群呢?
在发育生物学有这样的操作,比如:
2019年的Nature文章"The single-cell transcriptional landscape of mammalian organogenesis"的使用Monocle鉴别出了数百种细胞类型和56条细胞发育轨迹,并定义了数千个相应的标记基因。 2019年的Science 文章 "A lineage-resolved molecular atlas of C. elegans embryogenesis at single-cell resolution",确定了502种不同的末端和前末端细胞类型,这些细胞类型分别对应1068个细胞谱系分支。
如果你对单细胞数据分析还没有基础认知,可以看基础10讲: