用户文章 | 单细胞ATAC测序“揪”出系统性红斑狼疮幕后黑手 | 单细胞专题
期刊名称:Frontiers in Immunology
影响因子:7.561
发表时间:2021.5.18
发表单位:深圳市人民医院
所用组学:单细胞ATAC测序
今天这篇文章中研究人员绘制单细胞分辨率下的系统性红斑狼疮患者外周血单细胞的染色质可接近性图谱,并找到其中可能引起异常免疫反应的关键的转录因子。本文由「戴勇主任及负责人汤冬娥,虞海燕」、「洪小平主任」合作发表,下面是对本文的详细解读。
目的:
系统性红斑狼疮(Systemic lupus erythematosus, SLE)是一种复杂的自身免疫性疾病,多种免疫细胞参与了SLE的发生、发展和调节。作者的目标是在单细胞分辨率下揭示SLE患者外周血单细胞(PBMCs)的染色质可接近性,并识别可能驱动异常免疫反应的转录因子(TFs)。
方法:
应用单细胞测序转座酶可及染色质分析(scATAC-seq)方法,以单细胞分辨率绘制SLE患者免疫细胞中活性调节DNA的图谱,然后对SLE患者的PBMCs进行聚类、峰注释和motif分析。
结果:
外周血单细胞在不使用抗体的情况下,根据它们的细胞类型稳定地聚集在一起。作者在SLE患者中发现了20种驱动异常免疫反应的TF激活模式。然后,作者通过改变T细胞活性观察到10个与SLE发病机制高度相关的基因。最后,作者发现调控上述6个可能与SLE发病相关基因(CD83、ELF4、ITPKB、RAB27A、RUNX3、ZMIZ1)的12个关键TFs在SLE患者中显著富集(p <0.05, FC >2)。通过对CD83、ELF4、RUNX3和ZMIZ1在B细胞中的qPCR实验,作者发现ELF4、RUNX3和ZMIZ1基因的表达有显著差异,它们受到EWSR1-FLI1、MAF、MAFA、NFIB、NR2C2 (var. 2)、TBX4和TBX5 这7个TFs的调控。同时,这7个TFs在SLE患者中显示出高度易接近的结合位点。
结论:
这些结果证实了使用单细胞测序来揭示SLE患者免疫细胞的真实特征的重要性,揭示了SLE- PBMCs中的关键TFs,并为表观遗传治疗提供了相关的基础见解。
系统性红斑狼疮(SLE)是一种慢性炎症性自身免疫疾病,影响身体的每一个器官和系统。免疫系统耐受性的丧失导致自身抗体的产生、免疫复合物的沉积和补体的激活,从而导致全身炎症和靶组织损伤。根据家族研究和双胞胎之间的一致性率,遗传因素在SLE易感性中至关重要。然而,基因序列本身只能解释SLE遗传性的一小部分。表观遗传标记已经成为理解部分缺失遗传力的关键,而细胞类型特异性基因组中的非编码元素对于理解SLE发病机制至关重要,然而,现在人们对它的相关发病机制知之甚少。
遗传和转录组分析已经揭示了一些与SLE相关的基因和非编码位点。因此,已知有超过80个SLE风险位点影响SLE易感性,并且大多数风险变异改变了控制基因表达的调控元件。由于染色质可接近性在基因调控和基因组稳定性中起着重要作用,而且由于染色质可接近性模式的改变可能会改变基因组调控区域对关键蛋白的可接近性,因此染色质可接近性模式正在成为人类疾病的一个重要组成部分。值得注意的是,SLE患者免疫细胞中染色质可接近性的评估落后于其他全基因组测量,如DNA修饰或转录。
转座酶可及染色质测序(ATAC-seq)技术由于其简单和灵敏,被广泛用于在碱基对分辨率水平上分析全基因组染色质可接近性模式。最近,一种基于平板的ATAC-seq单细胞分析方法(scATAC-seq)被开发出来,用于绘制染色质开放区域和识别调控区域。该方法具有以下优点:
(i)识别不同的细胞类型,包括微妙和罕见的细胞亚型;
(ii)揭示细胞类型特异性转录因子(TF)motifs;
(iii)允许探索细胞类型特异性基因调控网络。
利用scATAC-seq对SLE患者血源性细胞进行研究,有助于无偏倚地了解所涉及的细胞亚群的作用,揭示细胞类型特异性基因调控的机制。
因此,作者使用scATAC-seq方法分析了7例SLE患者和12例健康对照者外周血单细胞(PBMCs)的开放染色质区域。在进行细胞聚类后,作者鉴定了SLE患者的细胞类型,并调查了新的和罕见的细胞群。此外还分析了细胞类型特异性的调节模式,并总结了SLE患者和健康对照组之间显著差异的TF-motifs。通过GO和KEGG的富集分析,作者深入挖掘了SLE相关的靶基因和关键信号通路,为SLE发病机制提供了机制上的见解。
>>>SLE患者的分类基于2012年指南。
SLE受试者:
n = 7,女性,平均年龄33±13岁,SLE疾病活动度(SLEDAI) >10
健康对照组:
n = 12,男性/女性= 6/6,平均年龄34±9岁
上述病人在过去的三个月内,没有接受过免疫抑制剂的治疗。
1) 细胞类型鉴定与细胞类型特异性TF Motif探索
为了构建SLE患者细胞类型特异性开放染色质特征的图谱,作者使用scATAC-seq方法分析SLE患者(PBMC_SLE)和健康对照组(PBMC_NC)的PBMCs。作者的研究集中在SLE患者免疫细胞的普遍情况,而不是细胞异质性。此外,6名健康男性和6名健康女性的scATAC-seq结果与7名SLE女性的结果相似。因此,进一步分析来自7名SLE患者和12名健康对照者的PBMCs是可以接受的。另外,作者观察到PBMC_SLE和PBMC_NC组的核小体结合片段出现周期性峰值(图1B),并在转录起始位点(TSSs)周围富集(图1C)。最后,作者获得了来自PBMC_SLE组的4993个细胞和来自PBMC_NC组的8393个细胞。
在这13,386个细胞中,每个细胞捕获到的独特片段的中位数为5,344个。其中TSS、增强子区域、启动子区域和无核小体区等靶区重叠的片段占49.6%。在细胞barcode中,转位事件(transposition events)在峰值中的比例为18.3%。在PBMC_SLE文库中,比对到的read pairs和唯一片段的总数分别为174,494,332和158,667,523,在PBMC_NC文库中,比对到的read pairs和唯一片段的总数分别为193,333,851和165,563,843。在峰值分析后,作者使用Cell Ranger ATAC进行降维和t-SNE可视化。结果,作者将1万3386个细胞分成了6个簇。
根据细胞标记基因的表达水平,作者鉴定并注释了5个簇。它们分别是:T细胞(Cluster 1),自然杀伤(NK)细胞(Cluster 2),单核细胞(Cluster 3),B细胞(Cluster 5),和树突状细胞(DC)(Cluster 6)。有趣的是,作者没有发现任何marker可以标记Cluster 4(图1 D, E)。但是由于样本是用于分析淋巴细胞的纯化的PBMCs且所有数据已经通过了质量控制,作者推测Cluster 4应该是一个免疫细胞亚型。此外,Cluster 4似乎是Cluster 1 (T细胞)的一部分,作者的UMAP结果证实了这一假设。因此,Cluster 4被认为是一种T细胞亚型。从Cluster 4中的高表达基因(p <0.05, |FC| >1.2)来看,该T细胞亚型参与了细胞周期的中期/后期转变(图3A)。作者的结果表明,Cluster 4代表增殖T细胞(表2)。
为了探索细胞类型特异性的TF-motifs,作者总结了PBMC_SLEs各簇中显著富集的motifs(p <0.05, fold change (FC) >1.2)。这些TF motifs在PBMC_SLE和PBMC_NC文库中差异无统计学意义(p > 0.05)。总之,作者在B细胞中发现了两个TF-motifs,在单核细胞中发现了15个TF-motifs,在DC中发现了10个TF-motifs(图1F)。此外,单核细胞中的15个TF-motifs包含了DC细胞中的10个TF-motifs,DC细胞中的10个TF-motifs包含了B细胞中的2个TF-motifs。其余两个簇(T细胞和NK细胞)没有TF-motifs的FC值是大于1.2(表2)的。
2) PBMC_SLE和PBMC_NC染色质开放模式的比较
在计算PBMC_SLE和PBMC_NC组的细胞比例时,作者发现T细胞和B细胞有显著差异(Student’s T检验,p <0.05, FDR <0.05)。值得注意的是,增殖T细胞(Cluster 4)仅存在于SLE患者的PBMCs中(图2A)。然后,作者计算了每个集群中差异显著的loci数量(Student’s T检验, p <0.05,|FC| >1.2)。结果在PBMC_SLE和PBMC_NC·文库中观察到2092个显著不同的峰。其中B细胞有447个峰,DC有544个峰,单核细胞有680个峰,NK细胞有347个峰,T细胞有58个峰,未知组有16个峰(图2B)。此外,作者还计算了各组中显著富集的motif数量(p <0.05, FC >1.2)。作者分别在T细胞、NK细胞、单核细胞、B细胞、树突状细胞和未知簇中获得了7、68、20、102、45和21个显著富集的motifs(图2C)。作者的结果表明,增殖T细胞和非T细胞在SLE患者中都是活跃的。
然后作者将T细胞、NK细胞、单核细胞、B细胞和树突状细胞分别聚集起来进行进一步分析,从而获得了20个子簇(图2D)。与PBMC_NC组相比,PBMC_SLE组单核细胞亚簇0 (monocyt -0)和NK细胞亚簇1 (NK-1)的细胞数量比增加了3倍以上。相比之下,B细胞的第1亚簇(B-1)和第3亚簇(B-3),单核细胞的第2亚簇(monocytes -2)和T细胞的第1亚簇(T-1)的细胞数量比减少了3倍以上(图2E)。有趣的是,NK细胞、单核细胞、B细胞和DCs各亚群中出现的峰数明显不同(p <0.05, |FC| >1.2, 748±426 vs 53±47)(图2F)。同样,在每个亚簇的NK细胞、单核细胞、B细胞和DCs的显著富集motifs数量远远大于T细胞亚簇(p < 0.05, FC > 1.2, 72±46比7±8),除了展示了12个显著富集motifs的单核细胞群3 (Monocyte-3)。同时,有7个亚簇拥有FC大于2的显著富集motifs(图2G和表3)。
3)PBMC_SLE显著变化峰的功能分析
在B细胞、树突状细胞、单核细胞、NK细胞和T细胞中,作者选择了FC绝对值大于1.2的峰用于GO和KEGG分析。在不同的细胞中观察到的异常基因参与了不同的途径。例如,PBMC_SLE组和PBMC_NC组之间不同的B细胞基因在神经管形成和闭合中至关重要(图3B)。相比之下,根据GO分析,DCs中的异常基因可能在中性粒细胞介导的免疫中发挥重要作用。在单核细胞和NK细胞中,异常基因极有可能(p <0.001)参与抗原加工和呈递以及泛素样蛋白连接酶结合。同时,异常的T细胞基因可能与激酶活性和MHC II类蛋白复合物结合有关。
通过进一步的GO和KEGG分析PBMC_SLE和PBMC_NC组(p <0.05, |FC| >1.2)在T细胞、NK细胞、单核细胞、B细胞和dc的每个亚群中表达差异的基因,作者获得了更详细的信息。其中,B-0、B-1、B-2和B-3的异常基因可能分别参与轴突部分、RNA剪接和凋亡信号通路的调控、RNA聚合酶II启动子的转录起始、T细胞激活。DC-0和DC-2的差异表达基因分别参与DC亚簇的胞吞作用和T细胞活化。同时,Monocyte-0、Monocyte-1、Monocyte-2和Monocyte-3的差异表达基因分别活跃于中性粒细胞介导的免疫、Toll-like受体信号通路、MAPK信号通路和T细胞激活。在NK细胞亚簇中,NK-0、NK-1、NK-2、NK-3和NK-4的差异表达基因分别在自噬、激酶调控活性、磷酸化负调控、转移酶活性和去磷酸化负调控中起关键作用(图3C)。在T细胞亚群中,T-0和T-2的异常基因分别与组蛋白结合和lys63特异性去泛素酶活性相关(图3D)。值得注意的是,作者没有发现在DC-1、T-0和T-2中有显著富集峰的可用记录。
出乎意料的是,在SLE患者中,B-3、DC-2和Monocyte-3不仅表现出细胞数量占比的下降,而且还表现出明显的T细胞激活相关异常信号,PBMC_SLE组和PBMC_NC组分别有59、75和55个差异表达基因(p <0.05, |FC| >1.2)(图3E-G)。如上所述,增殖T细胞Clsuter 4)仅在SLE患者的PBMCs中发现。因此,有助于T细胞活性的基因可能是驱动T细胞增殖并导致SLE患者异常免疫反应的重要因素。删除重复数据后,B-3、DC-2和Monocyte-3中有137个基因参与T细胞活性(图3H)。同时,10个基因(BCL11B、CCR7、CD83、ELF4、ITPKB、NCK2、NKAP、RAB27A、RUNX3、ZMIZ1)在这三个亚群中均有发现,提示这些基因应优先作为治疗靶点(图3H)。进一步分析表明,与其他B细胞亚簇和单核细胞亚簇相比,BCL11B在B-3和Monocyte-3中均高度富集(图3I)。结果表明,BCL11B可作为从B细胞和单核细胞中鉴定(纯化)出B-3和Monocyte-3细胞的marker。
4)PBMC_SLE关键转录因子的研究
接上部分内容,由于作者发现了10个可能对了解SLE发病机制和靶向治疗很重要的基因,所以他进一步研究了调节这些基因的转录因子。根据查询数据库,作者共发现157个TF参与调控这9个基因(BCL11B、CCR7、CD83、ELF4、ITPKB、NKAP、RAB27A、RUNX3、ZMIZ1) (p <0.05),未发现有TF调控NCK2。随后作者确定了系统性红斑狼疮患者与健康对照组相比(p < 0.05, FC > 1.2),每个subcluster显著富集的motifs(表3)。总之,有31个富集motifs在B细胞:2个motifs在B-1,9个motifs在B-2,20个motifs在B-3。在DC中,DC-1中有1个富集motif,而DC-2中有18个富集motifs。在单核细胞和NK细胞中,只有2个富集motifs,Monocyte-2和NK-4各有一个。由于B-3和DC-1都显示MLX motif,而B-2和DC-2都显示TFAP2A motif,作者在PBMC_SLE中总共观察到52个富集的TF motifs(图3J)。值得注意的是,基于scATAC-seq分析,作者发现与SLE发病机制相关的TFs PRDM1和IRF8分别在B-3和DC-2中富集。将在B-3,DC-2,Monocyte-3富集的TFs(共157个可以调控基因引起T细胞活化的TFs)进行重叠,作者发现在PBMC_SLE组中有12个有富集结合位点的TFs(FC>2),包括在DC-2中的4个TFs(HNF1B,POU3F2, TFAP2A,和ZNF740)和在B-3中的8个TFs(EWSR1-FLI1, MAF, MAFA, NFIB, NR2C2 (var. 2), REL,TBX4, 和TBX5)(图4A,B)。因此这12个TFs可能是SLE发病的关键因素,它们通过调控其靶基因CD83、ELF4、ITPKB、RAB27A、RUNX3和ZMIZ1,从而促进T细胞的异常激活(图4B,C)。
考虑到可以从SLE患者和健康对照组获得的血细胞以及进行qPCR实验所需的细胞数量,作者只检测了4个基因在B细胞中的表达(CD83, ELF4, RUNX3, ZMIZ1)。结果,作者观察到SLE患者3个基因的表达与健康对照组有显著性差异(ELF4, 0.326±0.097 vs. 1.162±0.596,p = 0.001;RUNX3, 0.280±0.044 vs. 1.048±0.344,p <0.001;ZMIZ1, 0.334±0.154 vs. 1.119±0.587,p = 0.001)
作者在T细胞、NK细胞、单核细胞、B细胞和DC中获得了20种染色质可接近性模式,绘制了PBMC_SLE中活性调控DNA的图谱。它们的结果表明,有必要使用单细胞测序方法来揭示细胞的异质性和真实特征。此外,作者从B-3、DC-2和Monocyte-3细胞中鉴定了10个与T细胞活性相关的关键基因,并揭示了它们的调控网络。12个具有高度可接近结合位点的TFs可能是SLE诊断和治疗的关键靶点。同时,B细胞中4个靶基因中有3个已被证实在SLE患者和健康对照组中表达显著不同。因此,至少7个TFs (EWSR1-FLI1、MAF、MAFA、NFIB、NR2C2 (var. 2)、TBX4和TBX5)调控ELF4、RUNX3和ZMIZ1这3个基因,这可能是SLE诊断和治疗的关键靶点。未来可以通过scRNA-seq或bulk RNA-seq结合细胞分类来确认这些候选marker,而ChIP-seq是验证关键TFs的一种选择。作者的研究结果揭示了SLE-PBMC中的候选marker,证明了患者样本中表观遗传治疗的可行性,并为精准医学提供了相关的基础见解。
参考文献:
Yu H, Hong X, Wu H, et al. The Chromatin Accessibility Landscape of Peripheral Blood Mononuclear Cells in Patients With Systemic Lupus Erythematosus at Single-Cell Resolution. Front Immunol. 2021;12:641886. Published 2021 May 18. doi:10.3389/fimmu.2021.641886
关于联川生物
【用户文章解析】PNAS:单细胞测序揭示哮喘模型下肺的免疫景观 | 单细胞专题
【用户文章】3D胶原基质调节骨髓造血祖细胞向巨噬细胞分化的转录轨迹 | 单细胞专题
单细胞测序揭示B-ALL患者中耗竭T细胞的显著异质性(附细胞marker基因列表)| 单细胞专题
所见即所得,绘图高规格联川云平台,让科研更自由