查看原文
其他

如何挖掘 Hi-C 数据?多组学关联分析是一种高效的方法

李 函 诺禾致源科服 2023-02-13





近年,三维基因组的相关研究受到越来越多的学者关注,对染色体空间构象数据的挖掘,在解读某些调控机制中起到了重要作用。其中,Hi-C 作为一种高效的技术手段,为研究者们带来极大的便利,与此同时,庞大的数据量也需要更多的精力进行聚焦和挖掘。
下面,我们结合经典的文献研究,整理了一些 Hi-C 多组学的关联分析思路,希望能够为大家带来了一些参考,如图:

图1 Hi-C 多组学关联分析

在上图中,以 Hi-C 数据为核心,结合的组学非常丰富,包括基础的转录组数据、DNA 甲基化数据、ChIP-seq 数据、全基因组重测序数据,以及关于染色质开放性的 ATAC-seq 数据。根据研究切入点的不同,而产生不同的关联组合,我们一起看下经典的文章。

文章一

组学策略:Hi-C | ChIP-seq | RNA-seq

期刊:Genome Research2020年8月,南方科技大学生物系副教授靳文菲课题组与美国国立卫生研究院赵可吉实验室合作发表文章“Diploid genome architecture revealed by multi-omic data of hybrid mice”,利用杂交小鼠的多组数据揭示了二倍体基因组结构。哺乳动物基因组是二倍体,以往的研究一般不区分同源染色体的父本和母本,忽略了同源染色体间的差异。该研究利用两个不同品系小鼠杂交获得杂交小鼠,研究了杂交小鼠父本与母本的 Hi-C、ChIP-seq 和 RNA-seq 的多组学数据。

图2 品系特异性 TAD 边界以及 TAD 与 A|B 区室的关系

数据表明,同源染色体间的相互作用模式是相似的,这种相似性与它们的等位基因共表达水平高度相关。三维重构结果表明,同源染色体到细胞核中心的距离基本一致。杂交小鼠细胞核中单倍体的拓扑结构域(TAD)、染色质区室状态(A|B compartment)与亲本来源保持高度一致。该研究介绍了二倍体基因组结构和等位基因特异性表观遗传学的概况,对理解同源染色体之间差异基因表达的调控机制非常重要。【原文链接】

https://genome.cshlp.org/content/30/8/1097

文章二

组学策略:Hi-C | ATAC-seq | RNA-seq 等

期刊:Nature Genetics

2019年8月,美国加州大学旧金山分校人类遗传学研究所联合格莱斯顿神经疾病研究所等发表文章“Mapping cis-Regulatory Chromatin Contacts in Neural Cells Links Neuropsychiatric Disorder Risk Variants to Target Genes”,绘制了神经细胞中顺式调控染色质关系,将神经精神疾病风险变异与靶基因联系起来。

基因调控元件的突变与多种复杂的神经精神疾病有关。然而,由于细胞特异性和难以表征其调控靶点,鉴定重要的遗传变异十分受限。为了解决这些问题,该研究利用启动子捕获 Hi-C、ATAC-seq 和 RNA-seq 的多组学数据,对四种功能不同的神经细胞类型进行了分析。

研究鉴定了启动子与远端启动子相互作用区域(PIRs)间的长距顺式相互作用,将调控元件与它们的靶基因联系起来,揭示了疾病中可能存在的异常调控过程。

图3 人类神经细胞中的 PIRs在该研究中,研究者利用多组学数据诠释了与复杂神经精神疾病相关的细胞类型中的启动子和远端调节元件间未知的调控关系。在未来的研究中,从组织中分离出特定细胞类型使用单细胞测序,以及使用更先进的器官模型,对于深入研究疾病的机制是十分重要的。与此同时,表观基因组数据将继续为科研人员理解复杂疾病提供重要的参考。【原文链接】

https://www.nature.com/articles/s41588-019-0472-1


一则故事是否精彩,我们可能没有标准去定义它,但人们共同认知是:出彩的故事往往是从多角度进行了描述,内容和形式虽有不同,但牵出的事件都会指向一个结局,是全篇最值得品味的部分。

同样,Hi-C 多组学的关联分析也是如此,藉由不同角度尝试阐明一个生物学现象,让故事变得精彩。






表观遗传研究部  李 函  | 文案

孙翠翠丨编辑

图片来源于网络,侵删





您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存