两个样品的10x单细胞转录组数据分析策略
看到一篇最新研究,题目是:Targeting Degradation of the Transcription Factor C/EBPb Reduces Lung Fibrosis by Restoring Activity of the Ubiquitin-Editing Enzyme A20 in Macrophages 发表期刊: Immunity影响因子很高,二十多分,作者单位是: 中国医学科学院药物研究所天然药物活性物质与功能国家重点实验室,研究主要是报道了在肺泡巨噬细胞中,阻碍GSK-3β和A20的相互结合可以有效治疗肺纤维化。
链接: https://www.sciencedirect.com/science/article/abs/pii/S1074761319302845
我们这里关心的是10x单细胞转录组实验设计和数据分析细节,让我们一起看看:
两个样品的10x单细胞转录组数据
对博莱霉素诱导的WT组和A20过表达突变组巨噬细胞进行单细胞测序,两个样品的10X数据也上传到了NCBI,是SRR10007823 and SRR10007824,走10X数据标准cellranger流程,然后走seurat流程,我们在单细胞天地多次分享过流程笔记,如下:
我们来看看文章描述:
最后得到了8501 single cells and 1908 genes for WT mice and 11742 cells and 1924 genes for 突变小鼠,走seurat流程就可以得到细胞分群图
分开展示分群效果
数据分析人员是首先把两个样本的10X得到的矩阵合并后统一分群,得到11群,然后再跟进样品信息拆分可视化如下:
可以很清晰的看到两组细胞共分为11个cluster,而且两个样本的亚群差异巨大。有趣的是,研究者并没有对这些亚群进行生物学注释。
合并展现分群效果
合并后可视化,可以看到两个样本区分的比较开,作者的结论是表明两组之间表达谱差距较大。
这个结论我是持怀疑态度的,因为亚群并没有进行生物学注释,所以我们无法判断到底是真实的亚群,还是两个样本的技术差异!
看指定生物学意义基因的表达量差异
这个时候细胞亚群依然是没有派上用场,反正两个样本嘛,就是WT组,过表达组组咯。
相对于WT组,作者发现促纤维化因子Arg1在过表达组中表达量显著性降低(Figure 2G-2H)。
bulk转录组数据验证
文章的的bulk转录组是3 vs 3 ,共6个样本的实验设计,表达矩阵也在 GEO数据库,http://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE117690
感悟
虽然文章里面提到了两个样本的10X单细胞转录组数据,但是从分析层面来看,似乎数据分析结果比较孤立,基本上没有怎么用得上它的结果。
往期精彩
如果你对单细胞转录组研究感兴趣,但又不知道如何入门,也许你可以关注一下下面的课程
单细胞天地欢迎你