随着单细胞技术的发展,获得单细胞数据越来越成为可能,随着单细胞数据的增多,单细胞亚群的鉴定越来越成为单细胞分析的一个关键的、限制性的过程。面对大量的单细胞数据,就犹如面对天书,不知所云,应用就更不可能,因此单细胞鉴定是把这些数据分类,通过分类鉴定成我们熟悉的细胞类型,我们才能了解细胞的功能和特性,才能解读这单细胞天书。
今天将给大家分享一下我们究竟如何去读懂“单细胞这本天书”-单细胞亚群鉴定。
单细胞转录组之所能够进行细胞亚群的分群,其基础主要有如下几点:
不同的细胞呈现出分子生物学或者基因方面的改变或者说具有不同的表达模式、不同的功能。每个细胞都有独特的表达模式,都有自己特有的基因,同一类型的细胞都有类似的表达模式。基于目前已有的知识,我们可以把未知的数据进行分类鉴定,任何未知事物的探索,都是先基于我们已有的知识去了解,然后才慢慢地了解。单细胞数据也一样,根据之前bulk RNA的表达数据(纯的细胞系的表达数据)、蛋白marker等来对鉴定细胞类型。
常见的单细胞亚群鉴定方法
单细胞亚群鉴定的方法有很多种,据2019年Abdelaal等人在 Genome Biology发表的文献(https://genomebiology.biomedcentral.com/articles/10.1186/s13059-019-1795-z)可以得知目前单细胞亚群鉴定的方法有很多种,文献测试比较了的就有22种。这是2019年年中发表,距现在已经差不多一年过去了,这一年又涌现了大量的其他工具,初步预计目前至少有30多种方法。下表格对这22种工具进行了简单的统计。有时候如果工具只有一种,没得选择,我们就一种工具即可;工具一多,反而不知道怎么办了,可能就有选择恐惧症,不知道哪一种工具更趁手了。因此今天将对单细胞亚群鉴定的工具进行一个简单的介绍。根据其鉴定的原理,我们可以分成如下四种:
上述不同的方法具有自己独有的特点,大家在使用的时候,可以根据自己的研究目的、研究背景选择一种或者多种联合的方式进行细胞亚群鉴定,确定细胞类型,提高分析效率。单细胞亚群鉴定-经典
我们最常用、最准确的方法还是传统的、经典的方法进行细胞亚群鉴定,根据亚群特异性的基因表达,直接筛选特定细胞类型的marker基因。比如如果我们通过如下的小提琴图展示,某个细胞亚群就是表达CD3高表达,那我们就认为这一群细胞就是T细胞。经典方法中细胞展示有如下方式:通过excel表格的avg_logFC筛选差异较大的基因,然后通过小提琴图、feature图、热图对基因进行展示即可。
问
常见的免疫细胞的marker基因如下图所示,那么问题来了?
我们这些marker从哪儿获得?
答
为了进一步对细胞亚群鉴定进行介绍,下面我们将介绍几种细胞marker基因的获取方法:传统蛋白marker基因、Cellmarker数据库、Panglaodb数据库、单细胞图谱库、EMBL-EBI单细胞数据库以及Human Cell Atlas。
很多做免疫学的老师都会有传统蛋白的marker手册,比如BD公司的Human and Mouse CD Marker Handbook和Invitrogen公司的Immune cell guide都是非常不错的手册,免疫细胞几乎都可以使用上面的marker基因亚群鉴定。
哈尔滨医科大学2019开发的cellmarker(http://biocc.hrbmu.edu.cn/CellMarker/)基因数据库是目前比较常用的单细胞marker基因数据库。数据库搜集了人和小鼠的不同细胞类型的marker基因,目前数据库里人的细胞类型有467种,小鼠的细胞类型有389种,基本上包含了目前人和小鼠的大部分的细胞类型。
Panglaodb(https://panglaodb.se/index.html)数据也是2019年开发的细胞marker基因数据库。主要收录了人和小鼠的细胞marker基因,目前有178种细胞类型,从数字来看,可能细胞类型要少于cellmarker数据库,但是基本上包含了人和小鼠的大部分细胞类型。但是,它还有自身的优势,该数据库提供了marker基因来源文献的数据的进一步分析的交互工具,可以对其进行进一步分析。
2018年郭老师基于来源于小鼠50多种组织的40万个细胞的单细胞转录组数据,鉴定出了小鼠的98个主要细胞亚群,和800多细胞亚型。2020年郭老师利用702,968个单细胞的转录组数据,研究团队系统建立了跨越人类胚胎和成年两个时期的单细胞图谱,鉴定了102种细胞簇和843种细胞亚类。大家可以在官网上通过Gallery找到相应组织类型和对应细胞类型的marker基因。
人(https://db.cngb.org/HCL/)
小鼠(http://bis.zju.edu.cn/MCA/blast.html)
欧洲EMBL-EBI(https://www.ebi.ac.uk/gxa/sc/home)单细胞数据库,可以通过上面已有的数据,找到特异性的marker基因,辅助细胞亚群鉴定,当然也可以找到细胞marker基因,下载数据,还可以联合自己的数据进行一起分析。
Human Cell Atlas(https://data.humancellatlas.org/)是目前关于人比较全的单细胞研究数据库,里面有很多不同组织、不同个人、不同处理后的单细胞数据,可根据已有的单细胞数据类型进行辅助细胞亚群鉴定。当然这样的数据库还有很多种,比如broadinstitute的单细胞数据库,也可以做类似的事务。这类数据库,最好的利用是通过表达模式来预测细胞类型,而不是仅仅通过数据库找到marker基因,因此后续可能还会用到此类数据库。
这里给大家介绍了marker基因的获取,那么怎么进一步对细胞亚群鉴定呢,我们下期见。
我们会持续地帮大家总结最新的进展、介绍最新的技术、分享最实用的生信技能,请大家持续关注。