染色体重塑一直以来都是表观遗传学领域的研究热点。哺乳动物染色质重塑复合物的SWI/SNF (mSWI/SNF或BAF) 家族在调控DNA可及性和基因表达中起着关键作用。这些复合物最终以三种不同的形式存在:典型BAF (cBAF)、polybromo-associated BAF (PBAF) 和非典型BAF (ncBAF)。已有研究表明SWI/SNF各个亚基之间表现出高亲和力的相互作用,可以共同改变染色体的可及性,并且它们在生化成分、染色质靶向和疾病中的都发挥着独特的功能。然而,目前为止,关于它们的组成亚基对基因表达的贡献仍然不完全确定。2023年4月6日,哈佛大学医学院丹娜法伯癌症研究所的Cigall Kadoch课题组以及博德研究所的Aviv Regev课题组合作在Molecular Cell发表了题为Structural and functional properties of mSWI/SNF chromatin remodeling complexes revealed through single-cell perturbation screens的研究论文。他们进行了基于perturb -seq的CRISPR-Cas9敲除筛选,分别针对mSWI/SNF的单个或多个亚基,然后再进行单细胞RNA-seq和SHARE-seq分析后,发现了复合物、模块和亚基对不同调控网络的特定贡献,揭示了旁系同源亚基之间的关系以及亚复合物功能的改变,同时通过分析亚基之间的协同、复杂的遗传相互作用揭示了其功能的冗余性和模块性。重要的是,在大量原发性人类肿瘤表达谱中映射的单细胞亚基扰动特征反映并预测了癌症中的cBAF功能丧失状态。本研究也强调了Perturb-seq在分析异质、多组分主调控复合物的疾病相关基因调控影响方面的实用性。基因表达调控依赖于复杂调控环路之间的协调,包括转录因子 (TFs)、组蛋白翻译后修饰、大型染色质重塑复合物以及正常的转录机制。破译这种环路的分子逻辑,将有助于我们对正常细胞功能和人类疾病的认识。在这些疾病中,环路中断会改变染色质的拓扑结构和基因表达。对基因调控线路和功能的理解受到大量参与组分的限制,包括那些在复合物中起作用的成分及其组合活性,并且这些作用很可能是非累加的。对于关键的调控复合物尤其如此,如哺乳动物SWI/SNF (mSWI/SNF或BAF) 复合物,改变染色质可及性和调节基因表达的ATP依赖的多聚染色质重塑机器。这些复合物由10-15个亚基组成,由29个基因组合而成,以三种不同的形式存在: cBAF、PBAF和ncBAF。虽然mSWI/SNF亚基之间表现出高亲和力相互作用,并共同改变染色质可及性,但每个亚基都有独特的作用。这反映在(1)某些mSWI/SNF亚基的组织特异性表达,(2)发育过程中的协调亚基切换,如神经元细胞命运特异性,以及(3)在高度特异性的人类癌症和神经发育障碍亚型中发现的特异性亚基突变。人类遗传学研究揭示了多种疾病中个体mSWI/SNF亚基基因的广泛突变频率,最显著的是癌症和神经发育障碍。这种突变出现在超过20%的肿瘤中,包括一些mSWI/SNF扰动代表驱动事件的癌症类型。这促使人们努力确定mSWI /SNF亚基促进疾病的机制。利用原发肿瘤遗传学和癌细胞系模型来确定个体mSWI/SNF亚基突变在相关疾病背景下的生化和基因调节作用。此外,合成致死性筛查已经确定了在mSWI / SNF干扰的疾病背景下支持肿瘤维持的因素。然而,支撑这种依赖性的基因调控机制在很大程度上仍然未知。尽管这些努力促进了我们对mSWI/SNF生物学的理解,但迄今为止还没有在统一的背景下对单独和组合的mSWI/SNF扰动进行全面评估。其中的挑战包括劳动密集型的阵列分析,以评估大量扰动对基因表达的影响,关键mSWI/SNF亚基缺失导致细胞长期生存能力下降,有害扰动后使细胞生存能力增强的代偿过程,单细胞克隆衍生群体中广泛的克隆变异,以及不同检测的批量效应。在本研究中,首先作者为了确定单个mSWI/SNF亚基的作用,采用Perturb-seq在急性髓系白血病细胞系MOLM-13中敲除了28个mSWI/SNF基因。他们通过慢病毒分别包装了靶向28个mSWI/SNF基因的4个向导,将其转导到表达Cas9的MOLM-13细胞中,通过对含有BFP荧光向导的细胞进行分类后,再使用基于液滴的3’ scRNA-seq、dial-out PCR等方法对它们进行分析,获得了52152个高质量的单细胞表达图谱,最后对所有细胞每个基因进行表达的标准化。接下来又通过多个指标证实了所获取数据的高质量。这些数据为mSWI/SNF基因的综合评估建立了一个可靠的Perturb-seq方法,通过这个方法可以识别mSWI/SNF亚基对基因表达的贡献。mSWI/SNF扰动的平均表达谱的相关性揭示了三组扰动,表明PBAF复合物在这种细胞环境中对基因表达的影响最小。通过对不同亚复合物的扰动表型分析等发现了亚基和复杂特异性对基因表达的影响,亚复合物定义的mSWI/SNF亚基的扰动影响不同的表达程序。接下来,作者通过比较了单个亚基的影响,证明了亚基平行序列对基因表达的差异影响,在复合体中适合相同位置的亚基 (ARID1A/B, SMARCA4/2和GLTSCR1/1L) 和成核不同复合体的平行序列 (SMARCD1/2和SMARCC1/C2) 之间存在差异。同一类群内的亚基具有不同的细胞状态空间和大小的基因表达变化。通过个体mSWI/SNF复合体亚基扰动影响识别的收敛性和发散性基因调控通路。作者通过使用正则化线性模型估计了每个扰动对1246个可变基因的影响,得到了一个调控矩阵。综上所述,这些分析表明:(1)cBAF的扰动影响最大,特别是通过下调发育和分化相关基因;(2) SMARCA4 ATP酶支持所有复合物的活性,尽管程度不同;(3) ncBAF和cBAF亚复合物虽然影响共同的基因靶点,但它们的扰动也导致明显不同的上调表达程序;(4) cBAF扰动对细胞周期的影响最强;(5)对ACTL6A的扰动与cBAF的扰动相似,除了对ACTL6A的扰动中有一组基因上调,这与其在其他染色质重塑家族中的作用一致。cBAF的缺失与ncBAF和PBAF靶点的相对可及性增加有关。接下来,为了将mSWI/SNF复合物扰动下的基因表达变化与其对染色质的潜在影响联系起来,作者进行了SHARE-seq,获得了相同扰动细胞中伴随的基因表达和染色质可及性谱。对ARID1A (cBAF)、SMARCD2 (cBAF和PBAF)、BRD9 (ncBAF) 和SMARCA4 (ATPase, pan-BAF) 进行了crispr介导的敲除和高通量测序与分析,这些数据支持这样一种模型,即cBAF受损会改变ncBAF和PBAF复合物的组装和/或功能,从而增加它们对目标位点的相对可及性。作者利用SHARE-seq数据,将mSWI/ SNF介导的可及性变化与同一单细胞中的靶基因表达结合起来,直接将其对潜在机制的影响或关系联系起来。分析发现特异性TF基序的可及性改变是影响单细胞中不同表达程序的基础。组合mSWI/SNF扰动识别旁系家族功能和遗传相互作用。为了研究遗传相互作用,作者测量了一系列聚焦于四亚基的组合扰动:1)Paralog family;2)Subcomplex;3)Dual subcomplex;4)Subcomplex+Core(如下图)。在所有评估的对中,相互作用项通常与单个扰动项的方向一致,这表明旁系同源成员之间的对抗较小。作者进一步利用组合扰动来评估(1)亚复合物特异性亚基在复合物发挥功能中扮演的角色;(2)核心亚基如何影响每个复合体的功能;(3)单个复合体如何相互作用。他们的分析有助于确定特定亚基缺失的影响,以及它们对每个mSWI/SNF亚复合体基因调控活性的选择性、模块化影响。最后,作者通过Perturb-seq数据集训练模型预测单细胞表达谱的遗传扰动,并利用PRISM药物分析等研究了扰动序列特征识别和预测mSWI/ SNF突变的人肿瘤特征。总的来说,本研究使用基于perturb -seq的单细胞分析揭示了ATP依赖性染色质重塑复合物SWI/SNF家族中独特的亚基、模块和亚组装驱动染色质可及性和基因表达。
原文链接:
https://doi.org/10.1016/j.molcel.2023.03.013
制版人:十一
【原创文章】BioArt原创文章,欢迎个人转发分享,未经允许禁止转载,所刊登的所有作品的著作权均为BioArt所拥有。BioArt保留所有法定权利,违者必究。