查看原文
其他

华大自主研发单细胞多组学调控新技术 可辅助生殖肿瘤等临床研究

华大基因 2019-06-02


今天是大年初六,新春假期的最后一天,或宅着享受被窝的温暖,或登上了返程的列车,明天,我们都将回到工作岗位,继续拼搏。在此,让我们用最新的科研成果为您的“回归”增添一点儿动力。


近日,深圳华大生命科学研究院自主研发从单细胞中捕获多重差异性信息的技术,并于1月28日在国际著名期刊《Nature Communications》发表了单细胞多组学的最新研究成果。该技术对于发现新的细胞类型,辅助生殖、癌症靶标预测、肿瘤免疫治疗等起到关键作用。可以说,此研究是单细胞研究的一次重大突破。



自主研发从单细胞中捕获多重差异性信息的技术


单细胞水平的多组学整合分析对于准确解析细胞群中的细胞间差异至关重要,今年《Science》杂志将单细胞水平细胞谱系追踪技术列为十大科学突破之首。单细胞测序技术的快速发展,极大地提高了我们对细胞群体异质性的理解。目前,单细胞组学测序技术,如单细胞全基因组、外显子组、甲基化组和转录组等已经被用于破译肿瘤,发育,细胞命运转变等过程中的异质性和动态变化。这些对于发现新的细胞类型,理解生物学问题背后的机理有重要作用。因此,单细胞的研究越来越受到重视。


此前,大多数的单细胞技术都是基于单个组学进行细胞群体的研究。然而对于每个细胞来说,其状态主要是由细胞内不同组学以及相互之间的调控来决定的,因此,同时获取单细胞多组学特征对于理解细胞“身份”来说显得尤为重要。


基于此,深圳华大生命科学研究院的研究团队研发出了同时捕获单细胞内染色质可及性和转录组的测序技术(scCAT-seq),该技术通过整合单细胞染色质可及性测序技术(scATAC-seq)和单细胞转录组测序技术(scRNA-seq),同时检测单个细胞的染色质可及性和基因表达特征,再通过整合两个组学的信息来研究细胞内部基因表达的调控机制。


scCAT-seq技术采用核质分离的方案进行细胞质内信使RNA(mRNA)和细胞核的分别捕获,同时加入外源载体DNA降低染色质DNA的损失,并基于ATAC-seq和全长转录组Smart-seq2(Switch Mechanism at the 5' Endof RNA Templates Sequencing)的建库原理,完成染色质可及性和全长转录组两个组学信息的建库与测序(图1)。

图 1  scCAT-seq技术流程图


最大突破在于可在单细胞内捕获多维度信息进行疾病分析


研究人员刘龙奇表示:“如何在单个细胞中充分获得多种维度的信息是目前的重要挑战,该技术最大的意义在于在一个单细胞里同时获得了染色质结构和基因表达双重信息。通过开发算法对这两种信息的整合,我们现在能够在单细胞水平看到很多过去人们未知的信息,比如单细胞水平DNA元件对靶基因的调控关系。可以说,该研究是单细胞研究的一次重大突破”。

scCAT-seq证明了单细胞多组学分析的必要性


研究人员通过对两个组学的系统分析,发现两个组学之间存在调控的一致性和差异性。一致性体现在染色质比较松散的区域,如H3K4me3,H3K27ac等修饰富集区域,染色质开放程度和基因表达水平都比较高;而对于已知的基因表达受抑制区域,如H3K27me3修饰富集区域,染色质开放程度和基因表达水平都较低。但同时,研究人员也发现了两个组学之间存在明显差异,体现在如H3K4me3/H3K27me3修饰共同富集的区域,染色质开放程度较高,而基因表达非常低(图2)。这说明单个组学的信息难以反映细胞的真实的基因表达调控状态,需要通过多个组学结合分析来完成。这或许能为之后的细胞群体研究提供指导方向。

图 2  单细胞ATAC-seq和RNA-seq整合分析


scCAT-seq技术在单细胞水平建立顺式调控元件和靶基因之间的调控关系


单细胞多组学的信息不仅能让我们同时看到不同维度信号的表现,也为研究不同组学信息之间的相互调控提供了数据基础。为了准确鉴定染色质调控元件和基因表达之间的关系,研究人员提出了一种分析策略来建立顺式调控元件和靶基因之间的“调控关系 (Regulatory Relationship)”,即如果某个调控元件和某个基因之间存在调控关系,需要满足以下3个条件: 1)该元件必须是开放的,即ATAC-seq能检测到信号;2)该调控元件上存在重要转录因子的富集;3)调控元件开放程度与基因表达水平正相关(图3)。为了完成该预测,研究人员开发了一套算法流程 (https://github.com/hdsu-bioquant/scCAT),通过输入ATAC-seq和RNA-seq两个维度信息,完成每个单细胞中“调控关系”的计算。

图 3  利用scCAT-seq数据描述调控元件和基因调控网络


研究表明,通过这种方法建立出来的调控关系不仅在数量上比传统预测方法多,而且也更容易被经典的3D基因组建库测序技术(ChIA-PET)所验证(图4)。说明整合多组学信息可以帮助准确预测基因组的3D调控关系。

图 4  scCAT建立单细胞“调控关系”策略与传统方法的比较


过去的研究表明不同细胞类型的基因表达调控具有很强的特异性,如身体不同组织的细胞基因表达的调控会有不同,那单细胞水平的“调控关系”是否能够体现这一点?研究人员基于单细胞“调控关系”的二进制矩阵,对来自不同细胞类型及组织的单细胞进行聚类分析,发现可以很好地实现细胞分群,同时可以鉴定出细胞类型特异性的调控关系(图5)。这表明“调控关系”可以作为新的特征在单细胞水平进行基因表达调控的研究。

图5  细胞类型特异性“调控关系”鉴定


scCAT-seq技术辅助认识细胞“身份”,为辅助生殖、癌症靶标预测等提供重要信息


scCAT-seq能够提供单个细胞的高分辨率表观基因组和转录组学图谱,辅助认识细胞的“身份”。对于单个细胞而言,染色质的开放程度及转录因子结合与基因表达调控密切相关,通过多组学的关联分析,将调控元件与靶基因结合从而得到单一组学无法获取的调控关系,与现有技术方法相比,该技术鉴定到更多的高可信度调节相互作用。scCAT-seq在不同细胞状态表征中的稳健性也揭示了该技术鉴定细胞群体中新细胞类型的巨大潜力。


scCAT-seq技术的研发还能解决很多生物学问题,例如,通过辅助进行植入前胚胎诊断,判断胚胎质量好坏,用以指导辅助生殖;对于癌症研究,该技术能让我们充分了解癌症发生发展的原因,发现更多癌症靶标,指导癌症干预。与此同时,该技术未来在免疫治疗,干细胞治疗等医学应用的评估方面也有比较好的前景。


近期,单细胞基因活性分析技术被《Science》杂志评为2018年十大科学突破之首,单细胞RNA-Seq被科学家认为会在未来10年改变基础生物学和医学的研究格局,而单细胞多组学联合研究是2018年单细胞研究的重大进展之一。


    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存