基因组的三维结构在细胞分化过程中会出现动态变化,并影响基因表达。鉴于在单个细胞的染色质结构和基因表达中观察到的显著异质性,在单细胞分辨率下全面了解三维基因组结构和基因表达之间的关系是必要的。目前,单细胞多组学技术能够联合分析染色质构象和基因表达,但同时分析多重染色质相互作用、基因表达和RNA染色质关联仍然具有挑战性。
为填补这一空白,加州大学圣地亚哥分校钟声课题组开发了一种创新的单细胞多组学核酸分析技术MUSIC(Multinucleic Acid Interaction Mapping in Single Cell),可用于同时分析单个细胞核内的多重染色质相互作用、基因表达和RNA-染色质关联。MUSIC技术扩展了单细胞分辨率下评估单个人类细胞中成对和多重染色质相互作用的能力。该研究已发表在Nature,文章题为“Single-cell multiplex chromatin and RNA interactions in aging human brain”。
文章发表在Nature据介绍,MUSIC是一种基因表达、多重染色质相互作用和RNA-染色质关联的联合分析方法(图1a)。通过独特的细胞条形码标记同一细胞核中的所有RNA和片段化DNA,实现RNA和DNA序列的联合分析。MUSIC技术有三个设计目标:
1)将RNA和片段化的DNA构建成单个测序文库,并利用独特的细胞条形码标记确定哪些RNA和DNA序列来自同一个细胞核。2)区分测序文库中的RNA插入片段和DNA插入片段。携带不同核苷酸序列的RNA和DNA连接体用于区分RNA和DNA分子。3)捕获和鉴定DNA-DNA和RNA-DNA关联。每个分子复合体都被贴上独特的复杂条形码。分子复合物可以包含DNA和RNA的各种组合,这些复杂的条形码与细胞条形码一起,可以识别每个细胞中的复合DNA和/或RNA。基于此,MUSIC工作流程包含两个主要步骤,首先将RNA和DNA接头连接到RNA和DNA片段上,并添加细胞条形码,第二步将复杂条形码添加到同一分子复合物中的任何RNA或DNA中。每个read对被设计为只捕获一个插入。
图1. MUSIC工作流程和数据分析
研究团队比对了MUSIC分析人H1和小鼠E14胚胎干细胞混合群体的结果。在NovaSeq平台上对混合物种MUSIC文库进行测序,生成约30亿个read对。这些read对解析了533,233,368个唯一映射的、非重复和条形码完整的(UMNDBC)read对。研究人员从该数据集中鉴定了2,546个人类H1细胞,每个细胞平均含有144,049个UMNDBC-DNA reads和11,384个UMNDBC-RNA reads,对应于7,036个纯DNA簇、232个纯RNA簇和1,170个RNA-DNA簇(图1b,c)。根据既定的程序,可以分解为约26亿个复合DNA-DNA对,700万个复合RNA-RNA对和2.5亿个复合RNA-DNA对(图1d)。MUSIC集合DNA reads与从同一人H1细胞系生成的Micro-C数据进行比较,MUSICDNA-DNA簇的接触图再现了Micro-C衍生的接触图中观察到的结构(图2a),导致整个基因组中区室分数的分布相似。不同大小的MUSICDNA-DNA簇在拓扑关联域水平上概括了TAD和嵌套TAD结构关联(图2b,c,d)。通过可视化簇,研究发现多重染色质相互作用可以概括了TAD结构(图2h),而成对相互作用不能很好地反映TAD结构(图2g)。研究团队将来自2,546个H1细胞的MUSIC集合RNA reads与批量RNA测序进行比较,发现MUSIC集成RNA reads定量的基因表达水平与批量RNA测序获得的基因表达水平一致(图2j)。此外,MUSIC还可以检测各种类型的RNA种类(pre-mRNA、nsaRNA)(图2l,m),并且为链特异性(图2k)。
图2. H1细胞的MUSIC数据
研究团队生成了一个名为MUSIC FC的数据集,该数据集包含14个59岁及以上人类额叶皮层死后样本的9,087个单核、755,123,054个UMNDBC-DNA reads和29,319,780个UMNDBC-RNA reads。基于MUSIC-snRNA reads的聚类分析确定了兴奋性神经元、抑制性神经元、星形胶质细胞等七种细胞类型(图3a)。MUSIC FC数据与额叶皮层snRNA-seq数据集的联合分析显示出高度一致的聚类结构和基于聚类的细胞类型分配。总之,MUSIC FC数据形成了与已知皮质细胞类型和细胞状态相对应的清晰簇,并揭示了老年人皮质少突胶质细胞的性别差异。
接下来,研究团队利用MUSIC进行了染色质构象的批量分析,发现染色质相互作用频率与基因组距离之间存在反向相关关系(图3b),称为聚合Pc-s关系。在单细胞水平上,大多数细胞也表现出这种关系,但少数细胞表现出最高的染色质相互作用,而不一定在最低的基因组距离上(图3c,d)。顺式表达数量性状位点(eQTL)与基因表达变异有关,其中大多数eQTL对特定细胞类型中特定靶基因的表达产生影响,表明eQTL-靶配对具有很强的细胞类型特异性(图3f,g,h)。
此外,该研究基于MUSIC技术分析了XIST lncRNA在雌性皮质细胞中的存在和作用,发现XISTlncRNA与整个X染色体表现出很强的相关性,并在单细胞水平上表现出异质性。小鼠和人类女性皮层中两条X染色体的空间组织存在保守的细胞类型变异。与男性相比,女性似乎更容易受到神经退行性疾病和精神障碍的困扰,女性皮层在染色质构象年龄上表现出更少的衰老神经元和更多的衰老少突胶质细胞。综上所述,钟声课题组开发的MUSIC技术可同时分析单个细胞核内的多重染色质相互作用、基因表达和RNA-染色质关联。当应用于来自老年捐赠者的14个人类额叶皮质样本时,MUSIC描绘了不同的皮质细胞类型和状态。该研究的多模态单细胞数据为未来研究健康和疾病的性别差异提供了重要资源。MUSIC是探索复杂组织中染色质结构和细胞分辨率转录组的一个有力工具。Wen, X., Luo, Z., Zhao, W. et al. Single-cell multiplex chromatin and RNA interactions in ageing human brain. Nature 628, 648–656 (2024). https://doi.org/10.1038/s41586-024-07239-w