解码果蝇大脑中的基因调控网络
果蝇(Drosophila melanogaster)是生物学研究中最重要的模式动物。其基因相对简单,和人类基因组序列同源性高达80%,而且人体75%的已知致病基因与果蝇身上的相似。人类的大脑有~1011个神经元,果蝇的大脑有~105个神经元,是神经科学中经常使用的模型。
近日,比利时鲁汶VIB大脑与疾病研究中心在《Nature》上发表果蝇大脑最新研究结果,利用单细胞转录组分析、三维形态分类和电子显微镜等方法和仪器,揭示了果蝇神经元和神经胶质细胞类型的多样性。
研究要点
单细胞转录组分析、三维形态分类和电子显微镜对连接组的定位显示了苍蝇中一系列功能和行为特征背后的神经元和胶质细胞类型的多样性。这些细胞类型的身份是由基因调控网络(GRNs)控制,涉及转录因子的组合,这些转录因子与基因组增强子结合以调控其靶基因。
为了在细胞类型水平上描述果蝇大脑的GRN,该研究分析了跨越9个发育时间点的240,919个单细胞的染色质可及性,并将这些数据与单细胞转录组整合。发现超过95,000个用于不同类型的神经细胞调节区域,其中70,000个与涉及神经发生、重编程和成熟的发育轨迹有关。
对于40种细胞类型,通过结合motif发现、网络推理和深度学习,独特的可访问区域与其表达的转录因子和下游靶基因相关联,产生增强子GRN。DeepFlyBrain揭示的增强子结构有助于更好地理解神经元调节多样性,并可用于设计特定时间点细胞类型的遗传驱动系,促进其表征和操作。
主要结果
1)全脑神经元染色质图谱
从幼虫到成年的9个时间点,对全脑240919个细胞进行scATAC-seq,以及118687个细胞进行scRNA-seq,使用共聚类、标记基因富集和非负最小二乘(NNLS)回归方法,将scATAC聚类与scRNA序列图谱中的细胞类型相关联,79个ATAC簇中有43个与RNA簇一对一连接。共包括六种胶质细胞亚型(约10-15%),非脑细胞(1%,浆母细胞和光感受器)和神经元(85-90%)。
2)大脑发育过程中的动态变化
为了研究神经元多样性是如何产生的,通过对三龄幼虫到12小时APF(after puparium formation)的135,275个细胞进行cisTopic分析,研究了染色质可及性的变化,得到54个簇。在成年细胞类型上训练了支持向量机(SVM)分类器,将标签转移到早期阶段,从而能够检测每个细胞类型中持续可访问的特定区域的核心集。祖细胞类型的特征在于神经母细胞标记dpn和ase附近的可访问区域,在UMAP中形成两个主要分支的根:一个连续的CB分支和一个树状的OL分支,表示不同的神经发生模式。在Imp+神经元中检测到来自神经元重塑因子EcR和Sox14的TF基序的峰值,但在pros+神经元中没有,这与它们各自的修剪作用和Imp+神经元的潜在胚胎起源一致。在OL中,出现了六个分支,每个分支都富含一类主要TF(如POU、bHLH和ETS)的基序,与突触伙伴识别和神经递质测定有关。
3)细胞类型特异性TF结合位点
为了鉴定细胞类型特异性关键调节因子,将“顺式作用”定义为TF与其靶增强子组合,开发了一种传统基序发现和深度学习(DL)的双重方法,整合来自成年scRNA序列和scATAC序列数据的信息,以识别每种细胞类型的TF,这些细胞类型都表达了TF,并且基序在可访问区域中富集。
首先,使用常规方法,计算了每种细胞类型DAR中TF表达和基序富集之间的相关性。共116个TF显示出强烈的正相关,表明它们作为激活剂打开染色质,包括泛神经元、泛神经胶质和细胞类型特异性TF。131个TF在表达和基序富集(如Mamo和Lola-N)之间表现出负相关,表明其具有抑制作用。
其次,使用KCs、T神经元和神经胶质细胞的共可访问区域序列作为输入,训练了一个称为DeepFlybanu的卷积神经网络。然后,使用DeepExplainer计算每个核苷酸在预测区域可达性中的贡献,并使用TF MoDISco从贡献分数中的重复模式中识别基序。这表明KC增强子的特征是Ey、Onecut、Mef2、Mamo和Dati基序,与它们的表达相匹配。
4)解码增强器结构
增强子图谱与细胞类型和调节因子相关,使报告系的设计能够在整个发育过程中针对细胞群体。先前为果蝇大脑创建驱动线的工作使用神经元基因周围2-3kb的随机区域,导致许多线是非特异性的:3456个FlyLight系中有2551个含有一个以上的ATAC峰,其中1796个是DAR。可通过对单个ATAC-seq峰值进行子克隆,使这些线具有特定性。此外,通过AND逻辑组合两个增强子的split-GAL4线被概括为其ATAC-seq信号的交点。使用更系统的方法,为总共63个增强子选择了另外60个区域,并使用转基因蝇系在体内测试了它们的增强子活性。
5)构建eGRNs资源
目前对GRN的描述主要集中于共表达,但细胞类型的转录组和染色质可及性图谱的可用性使其调控代码得以仔细检查。特别是,旨在绘制细胞类型特异性eGRN,包括关键TF,以及它们的增强子和靶基因。为了将顺式染色体区域与目标基因联系起来,计算了100kb窗口内基因表达和区域可及性的共变异分数,每个基因平均有6个正连锁区域。利用基因集富集分析对目标基因进行剪切,保留表达随顺式转录因子变化的基因。这一过程导致171个顺反子形成45种细胞类型的eGRN,包括87个激活剂TFs,4995个增强子与2025个基因相连,覆盖17%的成人DAR(13%启动子,43%内含子,44%远端),以及39%的大脑可变基因。特别是,细胞型eGRNs平均有5个激活因子TFs(范围1-15),通过81个增强子调节67个靶基因。
参考文献
Jasper J., Sara A., Ibrahim I T. et al. Decoding gene regulation in the fly brain. Nature, 2022.
- THE END -
新格元秉持“格物致知,识微通元”的创新性理念,致力于发展简便可靠的单细胞组学技术,更新细胞病理和血液检测方法,让单细胞组学以传统方法无法比拟的精确度、灵敏度和分辨率服务于精准医疗和健康管理等领域。
格物致知,识微通元
公司电话:025-58165529
技术联系电话:18151629767
合作邮箱:marketing@singleronbio.com
官网:www.singleronbio.com
地址:南京市江北新区药谷大道11号加速器二期6栋4-5
地址:苏州市工业园区星湖街218号生物纳米园B4楼401