查看原文
其他

​​​​『BICCN专栏』​​​​Nature | 小鼠大脑单细胞DNA甲基化图谱

BioArt BioArt 2023-04-22

责编 | 兮


https://www.nature.com/immersive/d42859-021-00067-2/index.html


BICCN专栏之一 | 总论:大脑皮层运动神经元图谱景观以及数据库联盟BICCN


2021年10月6日,大脑皮层运动神经元图谱景观以及数据库联盟Nature上同时刊发16篇文章(十六篇Nature重磅发布大脑运动皮层细胞图谱),揭开了运动神经元皮层中多个层面的图谱景观。


表观遗传修饰控制着大脑细胞的发育、分化和成熟,对于神经细胞功能和生物行为起着决定性的作用。在众多表观遗传修饰中,DNA 甲基化是一种稳定存在于成熟细胞,并能够终身维持其修饰水平和功能的重要机制。不同于身体的其他器官和组织,在大脑,尤其是神经元的基因组中,DNA 甲基化不仅富集于 CpG 位点(mCG),也广泛存在于基因组其他胞嘧啶位点(mCH,H 代表 A,T 和 C),并具有高度细胞类型特异性。基因组的 mCH 修饰还能够被 CpG 甲基化胞嘧啶结合蛋白 (MeCP2)识别并结合,后者是 Rett Syndrome 的致病基因,具有极其重要且复杂的神经元分化和调控功能【1,2】。过去的研究还发现,基因区域的 mCH 修饰水平与基因的表达量呈负相关,说明其是一种广泛存在的抑制性修饰【3】。在大脑神经元的基因组中,mCH 这一独特的分子印迹,与同样高度特异且功能重要的 mCG 修饰一起,决定了大脑中复杂多样的细胞类型。毫无疑问,进一步了解 DNA 甲基化在大脑不同细胞中的修饰水平,对于研究大脑细胞类型,理解基因特异性表达调控机制,寻找潜在的顺势转录元件具有重要意义。


2021年10与6日,来自美国索尔克研究所的 Joseph R. Ecker 团队在 Nature 上发表题为 DNA methylation atlas of the mouse brain at single-cell resolution 的研究,利用该团队开发的单细胞甲基化组测序技术(snmC-seq2)【4】系统研究了成年小鼠大脑中的 45 个脑区,产生了包含 95,815 个神经元和 8,167 个其他脑细胞在内共 103,982 个单细胞甲基化组学数据。通过三次迭代聚类分析,研究人员定义了三级共 161 个细胞细胞簇(cluster),并且结合细胞空间位置,细胞类型标记基因(marker gene)和多组学整合分析(见下),对每一个细胞簇进行了丰富的注释。为方便读者进一步探索这一高度结构化的数据集,研究人员还提供了一个数据应用(http://neomorph.salk.edu/omb),通过脑区、细胞簇和基因三种组织方式来展示分析结果。



不同于常见的单细胞转录组测序只关注基因,甲基化组作为一种全基因组测序技术,还能提供基因区域之外的转录调控元件信息。通过聚合单细胞信息到细胞簇水平, 161 个细胞簇中的绝大多数都获得了比肩甚至超过常规 bulk 全基因组甲基化测序(~30-40X)的基因组覆盖深度,从而使得研究人员能够以前所未有的统计功效和细胞类型分辨率来探索 DNA 甲基化多样性。通过比较不同细胞簇的单个胞嘧啶甲基化水平,研究人员共鉴定出涵盖小鼠基因组 50%区域的 3.9M 个甲基化多样性区域(DMR),这些区域分属于 161 个细胞簇,各细胞簇的 DMR 集合均具有独特的转录因子 DNA 结合位点富集,提示不同的转录因子或通过结合特定的 DMR 区域来调控细胞分化和基因表达。而作为 BICCN 系列研究的一部分,该研究的全部原始数据均可在 NeMO 和 GEO 数据库中开放下载【5】,为表观遗传学和分子神经生物学研究者的进一步探索提供了宝贵的资源。


多数据集整合分析丰富细胞类型注释


定义细胞类型是所有单细胞组学研究的首要任务之一,但随着单细胞组学技术的飞速发展带来的数据量激增,研究人员即使采取稳健的聚类分析方法依然能从细胞图谱级别的数据集(10^5 - 10^6 个细胞)中定义成百上千的细胞簇。这些计算决定的细胞簇如何对应到生物学意义上的细胞类型,乃至细胞类型这个术语本身如何定义,都是随之而来的难题。大脑作为宇宙中已知最为复杂的物体,其海量神经元能被区分为数百个细胞簇并非不可想象,然而充分注释和分析这些细胞簇却非易事。在现有条件下,通过对多个细胞图谱级别的数据集进行整合分析,连接不同数据集中的细胞簇乃至细胞,不失为一种高效且系统的交叉印证。更重要的是,整合不同的单细胞数据集能够给单个细胞簇提供更为丰富的多组学信息,使得研究人员能够系统分析 DNA 甲基化与其他表观遗传信息及神经元特征的关联性。


本研究中,研究人员分别整合了两组来自于 BICCN 合作者的细胞图谱数据集。其中与 UCSD 任兵实验室合作建立的小鼠大脑单细胞 DNA 可及性图谱(snATAC-seq)【6】的整合分析显示,通过 DNA 甲基化信息得到的细胞簇与通过 DNA 可及性信息得到的细胞簇具有高度一致性,说明细胞簇鉴定可在不同组学和数据集中重复。同时,由于整合分析只利用了基因区域的信息,研究人员进一步检查了非基因区域转录调控元件(DMR)的 DNA 甲基化水平和 DNA 可及性,发现两者也具有高度一致的细胞簇特异性,这为细胞簇的可重复性提供了重要证据。除此之外,研究人员还整合了来自同一团队与 Edward Callaway 实验室合作建立的小鼠大脑神经元示踪和表观遗传图谱(epi-Retro-seq)【7】,从而获得了部分细胞簇的神经元投射信息,并发现皮层中 ET-L5 的各个细胞簇具有不同脑区的投射特异性。值得一提的是,在同一期的 Nature 中,研究人员还与 BICCN 合作者以运动皮层(MOp)为例,详细探讨了单细胞转录组学和表观遗传组学数据的整合分析以及利用多数据集对细胞簇鉴定进行交叉验证的方法【8】


增强子基因相互作用


作为全基因组测序技术,单细胞甲基化遗传组学不仅提供了基因区域的信息,也覆盖了全部非基因区域,后者对基因表达调控的作用随着表观遗传组学的不断发展而得到越来越多的重视。在本研究中,研究人员通过系统整合 snATAC-seq 图谱,为每一个基于甲基化的细胞簇提供了对应的全基因组 DNA 可及性信息。结合双组学数据,研究人员在 161 个细胞簇中预测了 1.6M 个具有增强子特征的 DMR 区域(enhancer DMR, eDMR)。这些潜在增强子为大规模增强子验证实验提供了丰富的候选区域,对于开发细胞类型特异性的分子生物学工具具有重要意义。


同时,每一个增强子都有其对应的下游调控基因。利用细胞图谱数据集和单细胞多组学技术,研究人员从两个方面预测了增强子与下游基因的潜在关联。首先,在细胞簇水平,研究人员对每个增强子的 mCG 水平与其周围基因的 mCH 水平进行了相关性分析。大多数细胞类型标记基因的转录起始位点周围均发现了高相关性的潜在增强子,但也有相当一部分远距离增强子也表现出与基因的显著相关性。为了进一步研究增强子和启动子相互作用,研究人员还对海马体的细胞使用了 snm3C-seq 技术【9】。该技术通过结合原位染色体构造捕获(3C)和亚硫酸盐处理,能够在同一细胞内检测 DNA 甲基化和染色体三维构造,从而连接了 DNA 甲基化与基因组各个层面的三维构造信息。基于 snm3C-seq 的染色体环状结构(loop)鉴定,研究人员发现许多远距离增强子和启动子分别位于环结构的结合区域,说明这些区域的在实际染色体中的物理距离接近,支持了这些增强子对该基因的调控功能。


DNA 甲基化的空间变化


基因的空间表达调控对大脑发育和功能区形成具有决定性意义。以大脑皮层为例,在发育过程中,关键转录因子的梯度表达使得皮层不同区域的神经干细胞形成进一步的基因表达差异,最终在时空共同调节下形成了不同的功能区。有趣的是,在成年小鼠的大脑中,研究人员发现包括许多转录因子在内的基因 DNA 甲基化也具有空间特异性,甲基化水平随着细胞空间位置形成梯度变化,而类似的梯度也能够在许多增强子区域观察到。这些发现与单细胞转录组和DNA可及性图谱数据观察到的现象一致,说明空间位置信息通过表观遗传修饰被记录在成熟神经元的基因组中,持续影响基因表达调控。另一方面,同一脑区的同一细胞类型,随着空间分布的不同也有着很大的功能性差异,例如海马体中的颗粒细胞(granule cell)就是一类在不同位置投射和功能各异的细胞类型。研究人员发现虽然颗粒细胞在聚类分析中被鉴定为同个细胞簇,但其内部依然有明显的 mCH 和 mCG 水平的梯度变化,且这种变化与细胞的空间位置及分化成熟过程相关。这些现象都提示细胞空间位置与基因表达调控的强相关性,随着未来更多含有精确空间(如空间转录组学),神经元投射(如 Retro-seq)和功能信息(如 Patch-seq)的细胞图谱数据的完善,研究人员有望进一步细化各细胞簇的空间和功能注释,从分子层面为大脑功能区划分提供依据。


最后,为了进一步定量研究单细胞甲基化组所包含的细胞类型和空间定位信息,研究人员还建立了能够根据 DNA 甲基化信息预测相应细胞元数据的神经网络模型。该模型能够准确预测细胞类型和绝大多数细胞的空间定位,同时也能够用于寻找对于预测结果最为重要的基因。值得一提的是,对于未来的单细胞组学研究,类似的预测工具将变得越来越重要,因为相比于通过从头分析单个数据集,基于机器学习的预测模型能够帮助研究人员快速地将新数据集联系到已有的海量细胞图谱数据库,犹如基因组测序时代从“从头装配基因组”到“直接映射到参考基因组”的变化。


未来展望


作为 BICCN 的参与团队,研究人员将致力于进一步生成覆盖全脑 117 个脑区的完整小鼠成年脑细胞图谱。此外,不同物种和发育阶段的比较研究也将是重点关注方向。同时,随着单细胞多组学的技术发展,未来许多其他物种的脑细胞图谱将使用诸如 snmCT-seq (mC + RNA),snm3C-seq (mC + 3C),10X multiome (RNA + ATAC),Pair-Tag (RNA + Cut&Tag)等在内的新技术进行研究。相比于单组学技术,单细胞多组学技术在多个分子层面信息整合分析中具有先天优势。另外,近年来空间转录组学(如 MERFISH 和 Slide-seq)的兴起也将为细胞图谱项目提供更为精确的空间定位,有助于分子层面信息向其他形态学和功能研究整合。巨量数据的产生也亟需计算分析方法的发展,这既包括适用于细胞图谱的大数据分析框架,也包括沟通细胞图谱和未来新产生的单细胞数据集的整合工具,还包括丰富易用的可视化应用。


2000 年人类基因组计划完成对人类全基因组的测序,然而直到今天,我们依然在不断深入对基因组序列具体功能的研究和注释。同样的,使用单细胞组学建立脑细胞图谱也只是理解大脑神经元和表观遗传调控多样性的第一步,而具有细胞类型特异性的分子生物学和遗传学工具将帮助我们实现下一步,即研究分子层面信息如何决定神经元的分化和功能。值得一提的是,随着 BICCN 数据的产生,已经有合作者基于多组学数据集筛选和开发出标记特定细胞类型的小鼠遗传模型【10】或特异性增强子驱动的 AAV 载体 【11】,后者的思路亦可应用于灵长类及人类大脑【12】。这些细胞类型特异性工具的开发,既有助于基础研究,也具有潜在的临床应用价值。


原文链接:

https://www.nature.com/articles/s41586-020-03182-8


制版人:十一



参考文献


1. Stroud H, Su SC, Hrvatin S, Greben AW, Renthal W, Boxer LD, et al. Early-Life Gene Expression in Neurons Modulates Lasting Epigenetic States. Cell. 2017;171: 1151–1164.e16.2. Amir RE, Van den Veyver IB, Wan M, Tran CQ, Francke U, Zoghbi HY. Rett syndrome is caused by mutations in X-linked MECP2, encoding methyl-CpG-binding protein 2. Nat Genet. 1999;23: 185–188.3. Lister R, Mukamel EA, Nery JR, Urich M, Puddifoot CA, Johnson ND, et al. Global epigenomic reconfiguration during mammalian brain development. Science. 2013;341: 1237905.4. Luo C, Rivkin A, Zhou J, Sandoval JP, Kurihara L, Lucero J, et al. Robust single-cell DNA methylome profiling with snmC-seq2. Nat Commun. 2018;9: 3824.5. Liu H, Zhou J, Tian W, Luo C, Bartlett A, Aldridge A, et al. DNA methylation atlas of the mouse brain at single-cell resolution. Nature. 2021;598: 120–128.6. Li YE, Preissl S, Hou X, Zhang Z, Zhang K, Qiu Y, et al. An atlas of gene regulatory elements in adult mouse cerebrum. Nature. 2021;598: 129–136.7. Zhang Z, Zhou J, Tan P, Pang Y, Rivkin AC, Kirchgessner MA, et al. Epigenomic diversity of cortical projection neurons in the mouse brain. Nature. 2021;598: 167–173.8. Yao Z, Liu H, Xie F, Fischer S, Adkins RS, Aldridge AI, et al. A transcriptomic and epigenomic cell atlas of the mouse primary motor cortex. Nature. 2021;598: 103–110.9. Lee D-S, Luo C, Zhou J, Chandran S, Rivkin A, Bartlett A, et al. Simultaneous profiling of 3D genome structure and DNA methylation in single human cells. Nat Methods. 2019;16: 999–1006.10. Matho KS, Huilgol D, Galbavy W, He M, Kim G, An X, et al. Genetic dissection of the glutamatergic neuron system in cerebral cortex. Nature. 2021;598: 182–187.11. Graybuck LT, Daigle TL, Sedeño-Cortés AE, Walker M, Kalmbach B, Lenz GH, et al. Enhancer viruses for combinatorial cell-subclass-specific labeling. Neuron. 2021;109: 1449–1464.e13.12. Mich JK, Graybuck LT, Hess EE, Mahoney JT, Kojima Y, Ding Y, et al. Functional enhancer elements drive subclass-selective expression from mouse to primate neocortex. Cell Rep. 2021;34: 108754.
(参考文献可上下滑动)

转载须知

【非原创文章】本文著作权归文章作者所有,欢迎个人转发分享,未经允许禁止转载,作者拥有所有法定权利,违者必究。

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存