Science | Tabula Sapiens:人类多器官单细胞转录本测序图谱
The Tabula Sapiens Consortium(https://tabula-sapiens-portal.ds.czbiohub.org/)的研究人员使用基于液滴微流控和流式细胞分选的两种scRNA-seq技术,对15个供体来源的24种人体组织/器官进行单细胞转录组测序,构建了迄今最为全面的人类单细胞转录图谱,识别出475种细胞类型,并对不同细胞类型进行了跨组织的比较研究。该研究提供了一个宝贵的人类全细胞类型图谱,为进行疾病、发育等相关细胞类型的研究提供了一个可靠的标准细胞类型数据集。该文章在2022年5月发表于Science,以下是详细解读。
文章题目:The Tabula Sapiens: A multiple-organ, single-cell transcriptomic atlas of humans
发表时间:2022-05-13
发表期刊:Science
主要研究团队:The Tabula Sapiens Consortium
影响因子:47.728
DOI:10.1126/science.abl4896
研究背景
尽管人体内几乎每个细胞都有相同的基因组,但每种细胞类型对该基因组的使用不同,表达不同基因的子集。因此,通过基因组,并不能完全理解生物体各种细胞类型的分子复杂性。这促使研究人员努力通过转录和蛋白质组方法,来表征人类和多种模式生物体内各种细胞类型的分子组成。虽然这些努力正在产生新的认识和数据,但存在一个问题,即器官/组织通常收集自不同的位置、不同的捐赠者,并使用不同技术进行处理,或者缺乏技术或者生物学重复数据。当供体在遗传背景、年龄、环境暴露和表观遗传效应方面存在差异时,对不同组织和器官之间的细胞类型进行比较,就尤其困难。为了解决这个问题,研究团队开发了一种方法来分析来自同一供体的大量器官。
本研究中,The Tabula Sapiens Consortium的研究人员从相同的单个供体中获取器官,从而控制了遗传背景、年龄、环境和表观效应,允许对组织之间共有的细胞类型进行详细的分析和比较。这项工作构建了细胞类型的详细画像,展现了它们在组织,以及内皮、上皮、基质和免疫区室内的基因表达的分布和差异。
研究方法
The Tabula Sapiens Consortium的研究人员使用基于液滴微流控和流式细胞分选的两种scRNA-seq技术,对15个人类个体的24种组织和器官进行单细胞测序,总共获得近50万个细胞的转录组信息。经过质控获得483,152个细胞,通过聚类获得单细胞图谱,通过人工注释获得475种细胞类型。对这些细胞类型,研究人员进行了广泛的跨组织比较研究。
研究成果
1. 样本信息
研究人员从15个供体获得24个组织,使用基于液滴微流控和流式细胞分选的两种scRNA-seq技术,获得了近500,000个细胞的转录组。分析组织/器官包括膀胱、外周血、骨髓、眼、脂肪、心脏、肾脏、大肠、肝脏、肺、淋巴结、乳房、肌肉、胰腺、前列腺、唾液腺、皮肤、小肠、脾脏、胸腺、舌、气管、子宫及血管。组织样本数目共有59个。经质控得到483,152个细胞,其中免疫细胞264,824个,上皮细胞104,148个,内皮细胞31,691个,间质细胞82,478个。这些细胞可注释归为475个细胞类型(图1)。
图1 不同供体不同组织细胞样本情况
2. 组织HE染色切片信息
研究人员获得了TSP2和TSP4两个个体部分组织的HE染色切片数据。病理学研究人员鉴定了每一张染色切片上的细胞类型,并估计了主要细胞类型的丰度。通过对同一组织多张切片比较分析,发现按照细胞类型丰度变化程度,不同组织可归为高、中、低空间异质性三种类型(图2)。
研究人员使用单细胞测序数据,对大肠、肺、肌肉、小肠、血管估算了主要细胞类型的丰度。将单细胞测序估计丰度与HE染色估计丰度进行比较,发现部分组织的部分细胞类型在两种估计中基本一致。但也有许多组织的细胞类型估计结果存在较大差异,研究人员认为,这很可能是由于单细胞测序的解离步骤对不同类型细胞的影响导致的。特别是HE染色切片鉴定出外周神经系统细胞类型,单细胞测序没有检测到这类细胞。
为了进一步验证单细胞测序估计丰度模型的可靠性,研究人员收集肺、膀胱、肌肉已发表的细胞丰度数据,将本研究估计丰度模型与文献细胞丰度进行比较,发现二者之间存在较好的一致性。这表明与已发表研究相比较,解离步骤并没有导致本研究出现系统性的偏差。
图2 不同细胞类型组织切片鉴定
3. 跨组织细胞类型变化分析
研究人员进一步分析了不同组织免疫细胞基因表达差异和谱系演化特征。已有研究表明,作为一类驻留免疫细胞,巨噬细胞在不同组织具有不同的功能。研究人员分析了20个组织的36,475个巨噬细胞的基因表达谱,发现不同组织来源的巨噬细胞既表达共同的marker基因,又表达各自特异的marker基因。例如脾脏来源的巨噬细胞特异性表达CD5L(一个脂质合成的调控子)。
根据TCR序列的特异性,研究人员将TSP2个体的T细胞归入不同的克隆群,结果显示,细胞数量庞大的克隆群体由多个组织来源的T细胞组成(图3),并推断出TSP2个体的B细胞的干细胞祖先序列。发现,外周血中B细胞的突变率要显著低于实体组织中B细胞的突变率,这提示浸润到组织的B细胞绝大多数为成熟B细胞。随后,研究人员将B细胞分为IgA+、IgG+、IgM/D+三类细胞,发现在不同组织中,IgA+ B细胞与IgM+ B细胞具有相反的比例变化趋势,如血液中IgA+ B细胞的占比最低,大肠中IgA+ B细胞占比最高,而在这两个组织中,IgM+ B细胞的占比趋势正好相反(图3)。已知IgA+ B细胞与病原体相互作用,IgG+ B细胞通常参与病原体的直接中和,IgM+ B细胞通常为幼稚B细胞,参与对病原体的初次免疫应答。
研究人员发现内皮细胞可分为不同的亚群,并且鉴定了不同组织来源内皮细胞亚群的特异性marker(图3)。UMAP聚类发现,肺、心脏、子宫、肝脏、胰腺、脂肪和肌肉等不同组织来源的内皮细胞之间的转录特征差异最大,提示内皮细胞在各自组织中分化从而发挥高度特异化的作用。同时,胸腺、血管、前列腺和眼来源内皮细胞具有相似的转录组特征与亚型异质性。研究人员还在心脏组织中,新发现了一类表达SLC14A1的内皮细胞亚群,并被Human Protein Atlas数据库数据所验证。
已有研究表明,肺部内皮细胞可被分为用于气体交换和白细胞运输的aerocyte(aCap-EDNRB+)亚型和具有血管运输功能的general capillary(gCap-PLVAP+)亚型。其他组织中也存在与gCap亚型转录表达模式类似的内皮细胞,提示这类细胞具有跨组织的功能。但是aCap亚型转录表达模式的内皮细胞更趋向于只存在于肺部当中,提示这一类细胞的功能特异性。在肌肉组织中,研究人员也发现了具有强烈血管新生与内皮增殖功能的MSX1+亚群内皮细胞,以及富集代谢基因的CYP1B1+内皮细胞。
图3 T细胞、B细胞和内皮细胞跨组织分析
4. 跨组织细胞类型可变剪切事件分析
在所有细胞类型中,研究人员共发现了955,785种可变剪切事件,其中217,855种剪切事件为RefSeq数据库所记录, 占到后者所记录全部的61%。按照剪切位点与基因外显子之间的关系,研究人员将发现的可变剪切事件分为5类。其中已注释的217,855种剪切事件只占已发现剪切事件的22.8%,但涵盖了93%的reads,提示在以前的研究中,高表达的剪切事件易于被发现并注释出来。对于剩下的未被注释的可变剪切事件,研究人员使用GTEx数据进行独立验证,发现超过300,000种剪切事件在GTEx的数据中被检测到。
可变剪切事件是细胞类型特异性的。研究人员分析了MYL6和CD47的细胞类型特异性可变剪切情况(图4)。MYL6表达肌球蛋白轻链的基本成分,在所有组织中均高表达。表达外显子6是MYL6转录过程中存在的重要可变剪切事件。该可变剪切事件在肌肉组织中已得到深入研究,研究人员发现,该可变剪切事件在非肌肉组织中也广泛存在。Tabula Sapiens为在不同细胞类型中研究MYL6的转录调控提供了全面的线索。
CD47是一个跨膜蛋白,广泛参与多种细胞生物学过程,包括血管新生、细胞迁移和传递“不要攻击我”信号给巨噬细胞。涉及到外显子7~10的可变剪切事件会导致CD47表达不同长度的细胞质内尾巴。免疫细胞,但也包含部分基质细胞和内皮细胞,具有独特的一致剪接模式,主要是排除两个近端外显子(外显子9和外显子10),直接到外显子8。上皮细胞则趋向于剪切到外显子9 和外显子10,有更长的细胞质内尾巴。对CD47 细胞特异性剪切事件的研究,能帮助我们了解不同类型细胞中CD47信号活性与功能的差异。
图4 跨组织MYL6和CD47基因可变剪切事件分析
5. 细胞类型增殖与演变分析
处于增殖或者静息是反映细胞功能状态的一个重要指标。研究人员发现前体细胞处于高度增殖状态,内皮和间质细胞处于静息状态。在肠隐窝中,瞬时增殖性细胞(transient amplifying cells)和隐窝干细胞(crypt stem cell)迅速分化为具有绒毛结构的终末分化细胞。分析发现,外周血、骨髓、肺来源的巨噬细胞具有最高的增殖得分,而膀胱、皮肤和肌肉来源的巨噬细胞具有最低的增殖得分。CDKN1A(一种细胞周期激酶的抑制剂)在上述六个组织的巨噬细胞中的表达趋势,独立验证了增殖得分所对应的细胞增殖状态。
RNA速率(RNA velocity)研究,揭示了膀胱间质细胞向纤维母细胞演化的动态过程。Latent time分析展示了演化过程中不同细胞的内部时间状态;并通过对跨细胞类型的基因表达分析,研究人员识别出表达量与演化进程密切相关的基因(图5)。在这些基因中,ACTN1(α肌动蛋白1;一种稳定细胞骨架膜交联的关键的肌动蛋白)表达水平随演化过程而增加,MYLK(肌球蛋白轻链激酶)表达水平也具有相同的变化趋势。通过基因表达与演化进程的相关分析,研究识别出一批在膀胱组织细胞类型转化中起到调控作用的基因。
图5 各细胞类型增殖index与膀胱间质细胞向纤维母细胞演化
6. 肠道微生物菌群分析
研究人员通过扩增子测序分析,对TSP2个体的十二指肠、空肠、回肠、升结肠和乙状结肠的组织样本进行研究,发现即使是在结肠中也均存在大量变形菌,特别是肠杆菌科。对不同样本的生物学重复研究发现,十二指肠、空肠、回肠中菌群分布存在较大变异,而升结肠和乙状结肠中菌群分布则较为均一(图6)。对TSP14个体的研究独立证实了这些结论。并对每个组织样本扩增子序列变异分析发现,每个组织位点的菌群特征似乎是特异的,与前后相邻区域的菌群特征存在较大差异。当然,这只反映出两个个体的情况,需要更深入的研究以得出更普适的结论。研究人员对上述五个组织区域的T细胞分析表明,不同区域的T细胞具有不同类型的转录特征。基因差异表达分析表明,小肠与大肠T细胞之间的差异基因主要参与T细胞的转运、生存和激活(图6)。对肠道中不同区域微生物组的组成与T细胞亚群的配对分析,有助于揭示胃肠道中的局部宿主-微生物相互作用。
图6 肠道不同组织位点微生物菌群分布以及对应T细胞的功能状态
总结
Tabula Sapiens对特定细胞类型,如成纤维细胞,进行跨器官、跨技术乃至跨物种的比较研究,为了解人类细胞生物学功能提供了新的视角。将胎儿细胞类型与本研究确定的成人细胞类型进行比较,可以深入了解从早期发育到成熟的细胞可塑性的演变。Tabula Sapiens系统性地分析了细胞类型间的共同分子特征和器官特异性特征,发现了数量惊人且多样化的细胞类型特异性RNA可变剪切事件,并验证了许多以前未发现的剪接。
本研究展示了一个宝贵的、具有广泛细胞类型的人类单细胞转录组数据集Tabula Sapiens,以及如何使用其进行研究,Tabula Sapiens在深入理解和探索人类细胞分子机制方面具有强大威力。
系列导读
● Nature | 一作详解首个非人灵长类动物全身器官细胞图谱研究
● Nature | DNBelab C4如何助力获得人类体外诱导全能干细胞?研究思路详解
推荐阅读
联系我们
对时空组学或单细胞组学整体解决方案感兴趣的老师,可选择以下方式和我们联系,我们将及时为您进行详细的介绍:
1. 在公众号留言;
2. 发送信息至邮箱:
collaboration@stereomics.com;
3. “阅读原文”了解更多。
让我知道你“在看”