查看原文
其他

STAR Protocols︱在三维基因组环境下鉴定细胞类型特异性转录调控因子协作的计算方案

伊现富 岚翰生命科学 2023-03-10


撰文伊现富

责编︱王思珍

制版查佳雪

           

不同生物学条件下基因表达的时空调控模式,一直是功能基因组学的重要研究内容之一。在细胞核中的三维基因组(3D chromatin)环境下,转录调控因子(transcription regulators,TRs)调节着细胞类型特异性的基因转录。因此,精确鉴定生物学条件特异的转录调控因子协作(TR cooperation),能够极大促进对于复杂基因调控过程的深入理解。迄今为止,有不少计算方法已经被开发出来[1-3],用于推断特定细胞环境下的转录调控因子协作,但它们都严重依赖可以进行染色体免疫沉淀(chromatin immunoprecipitation,ChIP)实验的转录调控因子,严重制约了这些方法在不同生物学条件下的推广与使用。

 

2022年5月13日,天津医科大学基础医学院生物信息学系的李俊课题组在Cell子刊STAR Protocols杂志在线发表了题为3DCoop: An approach for computational inference of cell-type-specific transcriptional regulators cooperation in 3D chromatin的实验方案文章(Protocol),提出了在三维基因组环境下鉴定细胞类型特异性转录调控因子协作的计算方案——3DCoop [4,5],它不依赖可以进行ChIP实验的转录调控因子,通过整合转录调控因子的结合基序(motif)、开放染色质图谱(open chromatin profiles)、基因表达信息和三维染色质环(chromatin loops)数据,来鉴定三维基因组环境下细胞类型特异性的转录调控因子协作。得益于3DCoop的灵活性,它可以应用在人和小鼠等物种的各种组织或者细胞类型中,助力细胞分化或者疾病发展过程中基因转录调控机制的理解 [5]

 

 

在这一工作中,作者以人类K562细胞系为例,详细阐述了3DCoop的完整流程(图1),包括软件环境的配置、所需数据集的获取、配置文件的制作和3DCoop的使用与解析。为了方便研究者使用,作者已经把3DCoop部署到了GitHub上(https://github.com/mulinlab/3DCoop),同时提供了详细的使用说明。

 

 1 鉴定转录调控因子协作的3DCoop方案流程

(图源:Yi XF, et al., STAR Protoc, 2022)


3DCoop基于conda和bioconda进行构建,依赖于bedtools、samtools等工具以及多个Perl模块和R包。只需终端(terminal)即可配置并使用3DCoop,因此可用于Unix-like的操作系统(比如Linux和macOS等)。对于Windows 10及更新的Windows版本,可以通过安装WSL(Windows Subsystem for Linux)来获取使用环境。

 

为了更加精准得鉴定特定细胞类型中的转录调控因子协作,3DCoop整合了细胞类型无关的转录调控因子结合基序,以及细胞类型特异的开放染色质图谱、基因表达信息和染色质环数据。作者收集了16个来源的转录调控因子结合基序,通过统一处理和筛选,最终得到了1480个人类转录调控因子的3105个基序。该资源已经存储到了GitHub,提供给相关研究人员使用。作者从Roadmap项目中获取了K562的DNase-seq图谱作为开放染色质数据,同时也利用该项目提供的基因表达数据对转录调控因子进行了筛选,最终得到了739个用于后续分析的转录调控因子。基于收集整理的转录调控因子结合基序和开放染色质图谱,作者使用PIQ识别了全基因组范围内的转录调控因子结合事件。对于三维基因组数据,作者从3D Genome Browser数据库中提取了K562的染色质互作信息,总共得到了16629个染色质环。为了保证数据之间的一致性,作者将所有数据都统一到了hg19的人类基因组版本。

 

3DCoop最终需要的输入数据包括:全基因组范围内的转录调控因子结合事件和三维基因组的染色质环信息。有了这两部分数据,就可以制作配置文件(configuration file)来对3DCoop的运行进行个性化设定。基于制作好的配置文件,只需要顺序运行3DCoop的对应脚本即可,主要步骤包括:


(1)基于转录调控因子结合事件和染色质环信息,通过计算广义Jaccard系数(generalized Jaccard similarity),构建转录调控因子之间的两两相关性矩阵(TR pair-wise correlation matrix);

(2)基于上一步的相关性矩阵,使用图Lasso算法(graphical Lasso algorithm,Glasso)来估计精度矩阵(precision matrix);

(3)利用精度矩阵,使用重叠聚类(overlapping clustering)方法来构建转录调控因子协作网络(图2),从中提取出最终的TR clusters、TR maximum cliques和TR pairs。

 

图2 在K562细胞系中3DCoop鉴定出的转录调控因子协作

(图源:Yi XF, et al., STAR Protoc, 2022)

 

得益于细胞类型的特异性,3DCoop识别出的转录调控因子协作可用于多种生物学过程的研究,包括解析基因组关联研究(genome-wide association study,GWAS)识别出的疾病相关变异、理解细胞分化过程中的动态变化,等。相关工作已经在作者发表在Cell子刊iScience杂志的文章中进行了详细的阐述 [5]。为了方便研究者使用,作者在GitHub中提供了众多工具来辅助3DCoop结果的解析。

 

文章结论与讨论,启发与展望
综上所述,通过系统整合转录调控因子的结合基序、开放染色质图谱、基因表达和染色质环等信息,3DCoop能够鉴定出细胞类型特异性的转录调控因子协作。3DCoop的使用以及基于该工具得到的数十种组织或细胞类型特异性的转录调控因子协作 [5],将为基因转录调控的研究提供丰富的资源,有助于疾病相关变异的解读,同时也使得细胞分化过程的动态调节机制研究成为可能。


原文链接:https://doi.org/10.1016/j.xpro.2022.101382


天津医科大学基础医学院生物信息学系伊现富副教授为该工作的第一作者和共同通讯作者,李俊教授(http://www.mulinlab.org/intro/index.html)为该工作的共同通讯作者。该工作得到了国家自然科学基金和天津市自然科学基金的资助,同时也感谢天津医科大学基础医学院等机构和经费的大力支持,以及课题组成员提供的技术援助与合作。


伊现富副教授

(照片提供自:李俊实验室)


通讯作者实验室简介:李俊教授课题组主要从事功能基因组学和生物信息学方法研究,围绕复杂疾病遗传学和功能基因组学开展了一系列计算方法学探索,特别是在结合高通量测序技术、CRISPR 基因组编辑技术和创新的计算方法鉴定非编码遗传变异影响复杂疾病发生和药物响应等方面,取得了丰硕的研究成果。相关信息可参考李俊教授课题组主页:http://www.mulinlab.org/intro/index.html。

 

人才招聘

【1】“ 岚翰生命科学 ”诚聘副主编/编辑/运营岗位 ( 在线办公)

往期文章精选

【1】STTT︱范华昊/童贻刚/宋立华等发表新冠疫苗研发长篇综述

【2】STAR Protocols︱苏文如/郑颖丰团队发表基于高维质谱流式的人类血液免疫细胞功能分析的实验方案

【3】Cell Death Dis︱张金华课题组揭示肝纤维化新机制:肝星形细胞中MyD88通过促进巨噬细胞M1极化增强肝纤维化

【4】Nat Commun︱訾佳辰/巫瑞波合作建立高产优质檀香挥发油的细胞工厂

【5】Nat Commun︱臧星星团队发现免疫检查点抑制剂耐药的新机理和新疗法

【6】Cell Death Dis︱跨组学大数据驱动肿瘤机制研究:李刚/薛付忠团队揭示脑胶质瘤外泌体促肿瘤双重作用新机制

【7】Cell Discov︱许执恒/秦成峰/胡泽平 团队合作发现NAD+可用于治疗新冠肺炎

【8】PNAS︱周正洪课题组解析水疱性口炎病毒聚合酶复合物的原位结构

【9】Ageing Res Rev 综述︱杨惠林/何帆/朱雪松团队评述褪黑素在治疗骨关节炎中的作用及研究进展

【10】Nat Commun︱丁伟/张琪团队合作揭示超级抗生素darobactin的生物合成机制


参考文献(上下滑动阅读)  

[1] Djekidel MN, Liang Z, Wang Q, et al. 3CPET: finding co-factor complexes from ChIA-PET data using a hierarchical Dirichlet process. Genome Biol. 2015;16:288.

[2] Zhang K, Li N, Ainsworth RI, Wang W. Systematic identification of protein combinations mediating chromatin looping. Nat Commun. 2016;7:12249.

[3] Wang R, Wang Y, Zhang X, et al. Hierarchical cooperation of transcription factors from integration analysis of DNA sequences, ChIP-Seq and ChIA-PET data. BMC Genomics. 2019;20(Suppl 3):296.

[4] Yi X, Luo M, Feng X, et al. 3DCoop: An approach for computational inference ofcell-type-specific transcriptional regulators cooperationin 3D chromatin. STAR Protoc. 2022;3(2):101382.

[5] Yi X, Zheng Z, Xu H, et al. Interrogating cell type-specific cooperation of transcriptional regulators in 3D chromatin. iScience. 2021;24(12):103468.



本文完

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存