英文题目:Single-cell meta-analysis of SARS-CoV-2 entry genes across tissues and demographics影响因子:36.13发表期刊:Nature Medicine 发表时间:2021年3月严重急性呼吸系统综合征冠状病毒2型(SARS-CoV-2)进入细胞需要血管紧张素转换酶2(ACE2)和辅助蛋白酶(TMPRSS2和CTSL)的作用,因而检测它们的表达可能有助于阐明病毒的向性和对整个身体的影响。本文对来自不同组织的107个单细胞RNA测序研究,评估了ACE2、TMPRSS2和CTSL的细胞类型特异性表达。ACE2、TMPRSS2和CTSL在鼻腔通道、气道和肺泡的呼吸道上皮细胞的特定亚群中,以及在与新型冠状病毒病(COVID-19)传播或病理相关其他器官的细胞中共表达。本文进而对来自228名个体的377例鼻、气道和肺实质样本中的1,320,896个细胞进行了31项肺单细胞RNA测序研究的综合分析。该研究揭示了年龄、性别和吸烟的细胞类型特异性与ACE2、TMPRSS2和CTSL的表达水平之间的关联。细胞进入因子的表达随着年龄和男性而增加,包括在气道分泌细胞和2型肺泡细胞中。ACE2+、TMPRSS2+表达阳性的细胞基因在鼻、肺和肠组织中共享的表达程序包括可能介导病毒进入、关键免疫功能和上皮-巨噬细胞交流,例如与IL-6、IL-1、肿瘤坏死因子和补体途径。细胞类型特异性的表达模式可能与COVID-19的发病机理有关,这项研究重点介绍了治疗性干预的潜在分子途径。新型冠状病毒病(COVID-19)是由严重急性呼吸系统综合征冠状病毒2型(SARS-CoV-2)感染引起的,可表现为肺和气道、胃肠道、肾、肝和心脏等多个系统的病理,甚至多器官衰竭。本研究在鼻咽分泌物、唾液和粪便标本中均检测到SARS-CoV-2的RNA。宿主细胞的病毒粒子感染是由病毒刺突(S)蛋白与ACE2结合启动的。此外病毒感染还需要水解切割S蛋白的表面蛋白,而由CTSL基因编码的TMPRSS2或cathepsin L可以为病毒进入细胞提供这一作用。从无症状疾病到死亡,个体感染的临床结果存在显著差异。疾病的严重程度和死亡率随着年龄增长而增加,同时男性的发病率和死亡率略高。相对来说儿童患严重急性疾病的可能性明显较低,而吸烟者可能更容易患病。最后,患有心血管疾病的成年人可能更容易患病乃至死亡。识别可被SARS-CoV-2感染的特定细胞类型,并将SARS-CoV-2进入因子与年龄或性别等关键变量联系起来,有助于本文了解疾病结果中的COVID-19倾向性和异质性。人类细胞图谱(HCA)已经生成了健康个体不同组织的单细胞图谱,现在可以利用它进行此类研究。早期HCA数据分析显示,部分鼻腔通道、气道、肺实质和肠道细胞均表达ACE2和TMPRSS2,其中最明显的是气道中的鼻杯状细胞和多纤毛细胞以及肺远端的AT2细胞,同时ACE2和TMPRSS2也在结肠肠上皮细胞中表达。在这里,作者通过对116项单细胞和单核RNA测序(scRNA-seq和snRNA-seq)研究的综合分析,绘制了表达ACE2和附属蛋白酶的细胞类型特异性,其中包括31项肺部和气道研究,以及85项其他不同组织的研究。根据肺部和气道研究进行了单细胞综合分析,本研究首次将年龄、性别和吸烟状态与细胞类型特异性表达水平变化联系起来。一、肺部、气道以及与COVID-19相关的其他组织的ACE2+ TMPRSS2+双阳性细胞。作者列举了92项人类scRNA-seq或snRNA-seq的研究,分析了ACE2+ TMPRSS2+双阳性细胞和ACE2+ CTSL+双阳性细胞的比例,其中包括7项肺及气道的研究(图1、S1和S2)。同时作者调查了已发布的数据集,划分为五个大类(图1a、b,扩展数据图1、图2和表S1)。研究表明ACE2+ TMPRSS2+双阳性的上皮细胞在回肠、肝脏、肺、鼻黏膜、膀胱、睾丸、前列腺和肾脏(图1a)中分布最多。与之前的报道一致,鼻腔和气道中的ACE2+ TMPRSS2+双阳性细胞主要是分泌性杯状细胞和多纤毛细胞,并且肺远端双阳性细胞以肺泡2型(AT2)细胞为主(图1c和扩展数据图3a)。其他组织中的ACE2+ TMPRSS2+双阳性细胞包括肠上皮细胞、胰管细胞、前列腺腔上皮细胞、脑少突胶质细胞、肾近端小管细胞和集合管主细胞、抑制性肠神经元、心脏成纤维细胞、多种组织中的成纤维细胞(图1a–c)。值得注意的是,一些有双阳性表达的细胞类型(包括脑少突胶质细胞、上气道多纤毛细胞和嗅上皮细胞)也表达MYRF(图S2;MYRF是一种诱导髓鞘碱性蛋白和髓鞘寡突细胞糖蛋白表达的转录因子)。
ACE2+ CTSL+双阳性的细胞主要是AT1和AT2细胞、肠上皮细胞、心室心肌细胞和心脏巨噬细胞,以及胎盘、心脏、肺、肾和肠神经系统(ENS;图1d)。虽然肺泡和心脏巨噬细胞中有ACE2的表达(扩展数据图5),但在骨髓或脐血中scRNA-seq谱中没有观察到大量ACE2 mRNA的表达(图1a,b)。值得注意的是,在人胎盘中,孕早期和足月胎盘中的细胞滋养细胞和合胞体滋养细胞中也表达ACE2(占1.4%)(图1d)。TMPRSS2表达量很少(0.2%),而CTSL在大多数细胞中都表达(56%),ACE2+CTSL+双阳性细胞占比1.3%。
二、可能与病毒感染有关的其他蛋白酶的细胞类型特异性表达。SARS-CoV-2在没有TMPRSS2的情况下会感染细胞,因此其他蛋白酶也可能在病毒蛋白的蛋白水解切割中发挥作用。为了预测此类蛋白酶,作者检测了ACE2与625个带注释的人类蛋白酶基因的共表达,这些基因分别来自一个供体移植数据库(表S1)。TMPRSS2在多种肺上皮细胞类型中都有明显表达(图2a、表S4和5),同时表达的还有原蛋白转化酶枯草杆菌素kexin (PCSK)家族的多个成员(图2a,b),包括AT2细胞中的FURIN、PCSK2、PCSK5、PCSK6和PCSK7。原蛋白转化酶在冠状病毒S蛋白中起启动作用。在多种肺细胞类型中FURIN、PCSK5和PCSK7与ACE2共表达(图2c和扩展数据图6f)。PCSK1和PCSK2多局限于神经内分泌细胞;在一些AT2细胞中也能检测到PCSK2(图2d)。在AT2细胞、近端多纤毛细胞和基底细胞中,PCSK蛋白酶与ACE2的双重表达水平与ACE2+ TMPRSS2+双阳性表达水平相当或更高(图2e)。不同的宿主蛋白酶可能参与了病毒生命周期的不同阶段,因而本文检测了肺部ACE2+TMPRSS2+PCSK+三阳性细胞的患病率。研究表明近端气道多纤毛细胞(0.75%)和分泌细胞(0.72%)中以ACE2+TMPRSS2+PCSK+三阳性细胞为主,而AT2细胞中ACE2+TMPRSS2+FURIN+三阳性细胞最多(0.36%)。在所有已知的人类蛋白酶(图2f和图S3)中,组织蛋白酶(CTSB、CTSC、CTSD、CTSL和CTSS)、蛋白酶体亚基(PSMB2、PSMB4和PSMB5)和补体蛋白酶(C1R、C2和CFI)在肺上皮细胞类型中常与ACE2共表达。三、肺组织中ACE2、TMPRSS2和CTSL表达的正交验证。由于ACE2的表达相当低,作者接下来用荧光原位杂交和免疫荧光技术在三个健康供体肺的气道和肺泡组织切片上进行验证。ACE2,CTSL和TMPRSS2通过荧光原位杂交显示在肺泡细胞中共表达,尽管水平较低(图1e,f)。与细胞类型特异性标记物共染色显示,部分HTII-280+阳性的AT2细胞中也表达ACE2和TMPRSS2(图1g,h),TMPRSS2蛋白在一些AT1细胞中低水平表达(扩展数据图7d)。一些非上皮细胞也表达这三种基因。作者通过大量mRNA-seq的AT2细胞分类,进一步验证了ACE2的表达(扩展数据图7e)。先前的研究表明,ACE2在鼻和肠道黏液细胞中有较高表达量。虽然粘膜细胞在健康的气道表面上皮中相对罕见,但它们在粘膜下腺体(SMGs)中含量丰富。通过scRNA-seq分析来自健康供体的SMGs显微解剖显示,黏液细胞中ACE2、TMPRSS2和CTSL表达量较高(扩展数据图7f)。原位分析也证实了在SMGs的腺泡上皮细胞中存在ACE2转录本,大气道上皮细胞中表达ACE2(扩展数据图7g)。
四、肺和气道细胞中ACE2、TMPRSS2和CTSL的表达与年龄、性别和吸烟的相关性。作者接下来探究了在特定细胞亚群中ACE2、TMPRSS2和CTSL的表达与更严重疾病相关的三个关键协变量如何相关:年龄(老年个体)、性别(男性)和吸烟。由于迄今为止没有一个单独的足够大的数据库,因此作者汇总了31个scRNA-seq和snRNA-seq研究的样本(表S2)。该数据包含了228例无已知肺病或病理上与疾病部位相邻的正常肺的1,320,896个细胞,覆盖了377份鼻、肺和气道样本,这些样本来自刷、刮屑、活检、支气管肺泡灌洗或整肺切除(图3a)。作者使用广义线性模型对每个基因的表达计数与年龄、性别和吸烟状况之间的关系进行建模,并考虑了数据集相关因素和协变量交互作用引起的技术差异。作者将每种细胞类型的模型与已知吸烟史的供者的非胎儿肺数据(985,420个细胞,286个样本,164个供者,21个数据集)进行了拟合,并将一个无吸烟状态的模型与完整的非胎儿肺数据(1,096,604个细胞,309个样本,185个供者,24个数据集)进行了拟合。为了简单起见,作者把每个细胞当作独立的观察对象。这隐含地结合了供体和细胞的可变性,而且,由于来自同一供体的细胞不是真正独立的观察结果,可能导致P值膨胀,特别是当特定细胞类型的供体很少时。为了解决这一问题,考虑协变量交互作用并确保稳定性,(1)作者使用了一个简单的噪声模型(Poisson)来减少供体变异的过拟合;(2)在伪体分析中证实显著关联的效应方向是一致的; (3)通过一个包含交互项的模型确认总结年龄、性别和吸烟的关系;(4)将通过上述所有确认的显著关联分离为“稳健趋势”和“指标”,这取决于它们对单个数据集的稳健性。本文集中研究了ACE2和TMPRSS2共表达的细胞类型的趋势或适应症(图3c):气道上皮细胞(基底细胞、多纤毛细胞和分泌细胞)、AT1和AT2细胞以及SMGs分泌细胞。作者发现在这些细胞类型中ACE2的表达随着年龄、性别和吸烟状态的变化而变化(图3d和图S4–6):AT2细胞中ACE2的表达随着年龄的增长而增加,男性气道分泌细胞和AT1、AT2细胞中的ACE2表达量较高。在过去或现在吸烟者的基底和粘膜下分泌细胞中ACE2的表达水平较高,而在AT2细胞中较低(图3d)。从支气管刷检获得的大量RNA-seq数据分析表明,与戒烟者相比,吸烟者的ACE2和TMPRSS2均较高(扩展数据图10)。此外,作者发现ACE2的表达随着年龄的增长而增加,而且在多纤毛细胞中男性的表达量更高。研究同一细胞类型内ACE2和蛋白酶基因的联合趋势,本文发现在AT2细胞中ACE2和TMPRSS2的共同表达随着年龄的增长而增加,在男性的AT1细胞中,这两种基因的共同表达也随着年龄的增长而增加。ACE2和CTSL在男性的AT2细胞和吸烟者的粘膜下分泌细胞中显示出强烈的联合上调趋势。在男性AT1细胞中发现了这些基因联合上调的迹象,而在吸烟者基底细胞中发现了这些基因联合上调的迹象(图3d,扩展数据图9)。
五、气道、肺和肠道中ACE2 + TMPRSS2 +双阳性细胞的免疫基因程序。作者以前的分析揭示了在气道和肺细胞中与ACE2和TMPRSS2并存的免疫信号基因。为了在更广泛的背景下探索这些问题,本文确定了与鼻上皮、肺和肠道中ACE2+TMPRSS2+双阳性细胞相关的组织和细胞程序(表S7–10)。组织程序可在一种组织中不同细胞类型的双阳性细胞之间共享;细胞程序将双阳性细胞与其他相同类型的细胞区分开。组织程序与病毒感染和免疫应答的相关途径紧密联系,包括吞噬体构建、抗原加工和呈递以及细胞凋亡(图4a,b和图S11a,b)。组织程序也有与胆固醇和脂质代谢途径和内吞作用相关的基因(DHCR24, lc2和FASN)、主要组织相容性复合体I和II途径、针对细胞损伤的制剂(干扰素;细胞外RNase: PLAC8和TXNIP)、补体(C3和C4BPA)、免疫调节(BTG1)和紧密连接蛋白(DST, CLDN3和CLDN4)。细胞程序(图4c,d、图S12a-c)包含许多相同的基因和通路(如CEACAM5、CXCL17和SLPI),并且拥有其他独特的功能,包括肺分泌细胞中的肿瘤坏死因子(TNF)信号转导(如RIPK3),肺分泌和多纤毛细胞中的溶酶体功能,免疫蛋白酶体(AT1细胞;图4c)、细胞因子、趋化因子及其受体(鼻腔杯状细胞:CSF3、CXCL1、CXCL3、IL19和CCL20;AT1细胞:IL1R1)和编码表面活性蛋白的基因(AT2细胞:SFTPA和SFTPA2)。来自多个组织的细胞程序(图4c,d)包括与TNF信号相关的基因,这增加了抗TNF治疗对ACE2、TMPRSS2表达影响的可能性。ACE2+阳性的上皮细胞的免疫样程序也通过scATAC-seq反映了对ACE2位点的调控(图4f)。SARS-CoV-2感染和治疗的进入临床研究前需要近似人类生理学的模型系统。表达人类ACE2(以下简称hACE2)的转基因小鼠模型已被确定为评价COVID-19多种治疗方法的宝贵资源。因此,作者研究SARS-CoV-2进入因子在人类和小鼠模型细胞类型中表达模式是否相似。
健康小鼠气道上皮的多纤毛细胞主要表达Ace2+Tmprss2+和Ace2+Ctsl+(图5a),与人类气道的情况一致(扩展数据图3a),并在2-4月龄时增加(图5a,b)。此外,每天暴露于香烟烟雾2个月的小鼠全肺的scRNA-seq数据中观察到的表达模式(图5g - k和方法)与作者在人类气道上皮细胞中的观察结果一致(图3d和扩展数据图9a)。烟雾暴露后,气道分泌细胞中Ace2+阳性的细胞数量和Ace2表达显著增加,而AT2细胞数量没有显著增加(图5f-i)。人胎盘和小鼠胎盘发育的表达模式也一致(图1c、d)。
作者在单细胞层面上揭示了年龄、性别和吸烟与疾病的相关性。不同上皮细胞类型的ACE2表达与吸烟相关性显示了单细胞检测的重要性,因为AT2细胞中ACE2表达量的下调可能会被气道上皮细胞大量RNA-seq信号的增加掩盖。虽然作者的数据集中聚集了200多个捐赠者,但种族、民族、遗传血统、累积吸烟或健康组织与远端疾病部位等影响仍然可能混淆本文获得的关联。作者的模型包括经过测试的协变量、技术协变量和互动项,使本文能够发现复杂的关联。对供体吸烟状况进行建模对于减少背景变异和解释协变量的不平衡分布很重要。拟合此模型需要聚合多个数据集,并通过一致的单元格类型注释进行协调。随着HCA的增长和更多数据集的出现,本研究的模型可以扩展到允许与测试协变量的非线性关联。本研究在人类和小鼠模型上的发现在吸烟和年龄的关联是一致的。根据人类的数据,发现成熟小鼠(2-4个月)ACE2表达量增加。其他的研究报告显示,在24个月大的老年小鼠中,进入因子的表达较低,表明小鼠作为模型系统的潜在局限性。作者全面的跨组织分析扩展了他们和其他早期研究成果,确定了可能涉及传播或发病机制的跨组织细胞亚群。例如,SMGs中的双阳性细胞可能是病毒的蓄积器,这些病毒能够通过严重的咳嗽从气道管腔表面逃逸。本研究的meta分析提供了详细的分子和细胞图谱,帮助本文了解SARS-CoV-2的传播、发病机制和临床关联,并且在此演示了如何在数据共享受到限制的情况下实现这一点。随着HCA的进展,作者设想在其他疾病的背景下进行这样的meta分析,例如,通过结合流行病学和遗传风险因素的大型健康参考图谱。同时,随着COVID-19组织和模型生成新的图谱,它们的整合将进一步增进本文对这种疾病的了解。https://international.biocloud.net/zh/article/detail/33654293(复制链接到浏览器获取原文,如果没有云平台账号需要先注册)
百迈客生物基于高通量测序技术、生物信息分析技术和生物云计算技术,为广大科研工作者提供以综合技术服务、生物云分析、三代高通量测序以及试剂、仪器等科研周边业务。
公司拥有Nanopore、PacBio、Illumina、Waters、10XGenomics等主流服务平台,以及基于云架构的生物云计算平台—百迈客云,提供涵盖人重外显子、三维基因组、单细胞与空间转录组、基因组组装、转录调控、微生物、群体遗传、质谱及表观遗传等研究方向的技术服务。目前百迈客云平台拥有200多款基因分析工具,分析结果可直接用于文章发表,更有近百部科研相关视频和8大基因数据库助力科研工作者深度数据挖掘。
自公司成立起先后在《Cell》、《Nature》、《Nature Genetics》、《Nature Communications》、《Plant Cell》等学术刊物发表论文数千篇,拥有国家发明专利技术40余项,软件著作权近200余项。
我们一直秉承”生物科技创新,服务社会,造福人民”的企业使命,致力于打造“生物科技创新中心”的发展愿景,让生物科技更快,更好的提高人类生活质量。