六个样本的单细胞数据如何发一篇10分以上的文章
分享是一种态度
文章信息
清华大学陈晔光和杨雪瑞课题组及北京大学第三医院付卫课题组一起合作,于2020年2月3日在Journal of Experimental Medicine 杂志上在线发表了题为Single-cell tranome analysis reveals differential nutrient absorption functions in human intestine的文章,影响因子11.743。很多时候分享的文献都是CNS上的,动辄现在几十上百个样本以及大量复杂的功能学实验,对于大多数人来说过于昂贵,而这一篇文章仅采用了6个样本,分析及功能验证都很清晰,下面带大家来一起学习下该文章,希望能对大家有多帮助。
摘要
这篇文章主要研究对象是人类肠道组织,我们知道肠道主要分为回肠、结肠及直肠,所以这篇文章就采集了每个部位2个样本,来自于6个不同个人的手术中切除肠道组织。采用10XGenomics技术检测到了14537个肠道细胞,其中2个人类回肠6167个细胞,2个结肠4472个细胞,以及两个直肠3898个细胞。作者在figure S1中展示了原始数据质控结果,可以看到作者构建了6个单细胞文库,平均每个文库只有2422个细胞。
距离10X给的最多每个样本可以做10000个细胞差了很远,为什么作者不多捕获一些那?
但事实上在这里提醒打算做单细胞的同学或者老师一定不要在单个文库中捕获细胞超过5000个,因为10X在官网明确指出双细胞比率的问题,下图是10X给出的双细胞比例分布:
可以看到当捕获细胞5000时,双细胞比率已经达到3.9%,意味着有已经195个双细胞, 这对细分亚群后,会有很大的影响。也有的同学会说我可以用双峰检测(例如DoubletFinder)等方法去清除双细胞,但事实上由于细胞的异质性及分化的情况,往往很多细胞处于中间态,而无法被有效的区别是由生物学意义还是实验因素导致的,贸然清除可能会掩盖真正的生物学意义,毕竟单细胞实验最大的目的除了划分细胞亚群外就是寻找分化及发育轨迹。
细胞解离及数据分析
作者拿到肠道组织后,细胞解离的过程,跟平时大家做的一样,首先清洗肠道组织,去除手术后组织上残余的粘液及血细胞等,随后切成5mm小块,通过酶解及离心,获得去除间充质及免疫细胞的肠道单细胞悬液,随后去除死细胞后,实验10X genomics V3试剂盒检测。具体步骤及试剂大家可以参考下图。
数据分析中作者全程采用cellranger+Seurat这一套目前最简单的方法,之前单细胞天地和技能树都有相关的免费的视频和教程供大家学习。本文中的细胞过滤标准为线粒体基因>50%或单个细胞检测基因<200被清除掉,同时作者采用了基因标记的方法清除间充质细胞(即如果细胞表达LSP1,MZB1,VIM,CD52,CD78B和COL3A1基因就去除掉),Seurat中有函数可以直接筛选subset(x = object, subset = LSP1 >1 & MZB1 > 1,invert = TRUE)#清除这两个基因表达量大于1的细胞。
数据过滤完,作者随后采用Seurat提供的归一化及批次效应去除等,随后采用TSNE和Findallmaker进行分群及基因鉴定。整个数据分析过程非常简单实用,下面给大家介绍下主要结果。
结果
1.人类肠道上皮细胞的单细胞表征
Figure1首先对于单细胞结果做了整体的展示,可以看到14537个细胞分为了7个细胞亚群,下面是7中细胞类型及相关的marker基因,做肠道相关的小伙伴可以参考下:
enterocyte cells (ALPI, SLC26A3, TMEM37, and FABP2), goblet cells (ZG16, CLCA1, FFAR4, TFF3, and SPINK4), PCs (LYZ [Lyz1 and Lyz2 in mouse], CA7, SPIB, CA4, and FKBP1A), enteroendocrine cells (CHGA, CHGB, CPE, NEUROD1, and PYY), progenitor cells (SOX9, CDK6, MUC4, FABP5, PLA2G2A, and LCN2), transient-amplifying (TA) cells (KI67, PCNA, TOP2A, CCNA2, and MCM5), and stem cells (LGR5, RGMB, SMOC2, and ASCL2).
因为作者细胞来自于回肠、结肠及直肠三个部分,作者就单独把这三部分组织细胞的细胞分群结果展示出来,我们平时在文章中也可以仿照作者,把不同处理条件的细胞分开展示。
通过这些结果可以比较不同肠道部位的细胞构成情况,作者发现在回肠中肠道上皮细胞高度富集,占比70%,但是结肠及直肠中仅有14%,同时也发现杯状细胞在结肠和直肠中较高,同时作者也对不同部位的细胞相关基因进行了功能富集,发现在不同的部位同样类型的细胞发挥不同的生物学作用。这也告诉我们生物分析的时候要认真细致,深入的挖掘才能有发现。
2.小肠和大肠中与营养吸收相关的基因表达模式分析
肠道是食物消化及吸收的场所,糖,脂质,维生素以及无机和有机溶质的吸收都与各种生命活动及疾病息息相关,这里作者研究了回肠、结肠及直肠细胞中与代谢相关基因的表达谱,功能富集分析表明,参与蛋白质消化和吸收以及矿物质和有机物质运输的基因在这三个部分均富集。参与脂质代谢和药物代谢过程的基因在回肠中高表达,相反,与小分子转运有关的基因在大肠中富集。
可以看到这些图都非常简单清晰,但是呢,没有哪个公司可以帮你去找到发现这些基因,作者把基因分为跟脂类、蛋白质、矿物质、水以及氨基酸等相关的模块,然后检测这些模块基因在回肠、结肠及直肠中的分布差异,这些基因来自于作者自身的生物学背景知识,这也表明作为一个科研工作者,自己学习数据分析与挖掘的重要性。得到了上述基因分布的差异,下一步当然是验证,这个非常明确的思路,上述的基因作者在不用的肠道组织上进行免疫荧光染色实验。
3.信号分子在小肠和大肠中的差异表达
作者比较大肠和小肠的差异基因,发现主要存在三个信号通路的差异,分别为细胞死亡、TGF-β/ BMP以及Wnt信号通路。相关的图也是采用了小提琴及热图
4.人大肠中Paneth like cell(PLC)的特征
帕内特细胞(或称潘氏细胞)(Paneth cell)是小肠内一种少见的细胞,提供宿主防卫微生物的侵犯。其功能的类似于中性粒细胞。位于小肠腺底部,是小肠腺的特征性细胞。以前的研究认为Paneth cell主要在小肠内,但是在这个研究中,作者使用Paneth标记基因(LYZ,CA4,CA7和SPIB)发现大肠同样存在PLC特征的细胞,发挥重要的免疫及微生物防御功能。
5.人类(transient amplifying cells, TA细胞)和杯状细胞的潜在标记物
人类肠道中存在着具有增值能力的TA细胞,但是目前缺乏有效的标记物,同样的杯状细胞的主要功能是分泌保护上皮膜的粘液。作者通过分析这两群细胞的高变基因,加上免疫荧光验证,发现了新的潜在标记基因。这一部分研究对于大多数单细胞研究都适用,也是单细胞实验的重要目的,发现新的标记基因。但是一定要结合进一步的实验比如免疫荧光去验证。
6.人类和小鼠回肠中细胞基因表达差异
作者在这里下载了已经发表的小鼠回肠单细胞转录组数据。与人类的数据进行比较。发现人类和小鼠回肠之间标记基因的保守性,同时一些异质性,这也提示我们善于挖掘已经发表的数据和自己的结果比较。
这篇文章到这里就结束了,一共6个figure,从不同的方面展示了人类肠道组织细胞的特征,虽然实验简单、分析也只使用了Seurat,但是背后的生物学意义挖掘展示了作者良好的科研能力!
Over,希望对大家的单细胞研究有多帮助!