如何挖掘 Hi-C 数据?多组学关联分析是一种高效的方法
近年,三维基因组的相关研究受到越来越多的学者关注,对染色体空间构象数据的挖掘,在解读某些调控机制中起到了重要作用。其中,Hi-C 作为一种高效的技术手段,为研究者们带来极大的便利,与此同时,庞大的数据量也需要更多的精力进行聚焦和挖掘。
图1 Hi-C 多组学关联分析
在上图中,以 Hi-C 数据为核心,结合的组学非常丰富,包括基础的转录组数据、DNA 甲基化数据、ChIP-seq 数据、全基因组重测序数据,以及关于染色质开放性的 ATAC-seq 数据。根据研究切入点的不同,而产生不同的关联组合,我们一起看下经典的文章。
组学策略:Hi-C | ChIP-seq | RNA-seq
图2 品系特异性 TAD 边界以及 TAD 与 A|B 区室的关系
数据表明,同源染色体间的相互作用模式是相似的,这种相似性与它们的等位基因共表达水平高度相关。三维重构结果表明,同源染色体到细胞核中心的距离基本一致。杂交小鼠细胞核中单倍体的拓扑结构域(TAD)、染色质区室状态(A|B compartment)与亲本来源保持高度一致。该研究介绍了二倍体基因组结构和等位基因特异性表观遗传学的概况,对理解同源染色体之间差异基因表达的调控机制非常重要。【原文链接】https://genome.cshlp.org/content/30/8/1097
组学策略:Hi-C | ATAC-seq | RNA-seq 等
期刊:Nature Genetics2019年8月,美国加州大学旧金山分校人类遗传学研究所联合格莱斯顿神经疾病研究所等发表文章“Mapping cis-Regulatory Chromatin Contacts in Neural Cells Links Neuropsychiatric Disorder Risk Variants to Target Genes”,绘制了神经细胞中顺式调控染色质关系,将神经精神疾病风险变异与靶基因联系起来。
基因调控元件的突变与多种复杂的神经精神疾病有关。然而,由于细胞特异性和难以表征其调控靶点,鉴定重要的遗传变异十分受限。为了解决这些问题,该研究利用启动子捕获 Hi-C、ATAC-seq 和 RNA-seq 的多组学数据,对四种功能不同的神经细胞类型进行了分析。
研究鉴定了启动子与远端启动子相互作用区域(PIRs)间的长距顺式相互作用,将调控元件与它们的靶基因联系起来,揭示了疾病中可能存在的异常调控过程。
https://www.nature.com/articles/s41588-019-0472-1
一则故事是否精彩,我们可能没有标准去定义它,但人们共同认知是:出彩的故事往往是从多角度进行了描述,内容和形式虽有不同,但牵出的事件都会指向一个结局,是全篇最值得品味的部分。
同样,Hi-C 多组学的关联分析也是如此,藉由不同角度尝试阐明一个生物学现象,让故事变得精彩。
表观遗传研究部 李 函 | 文案
孙翠翠丨编辑
图片来源于网络,侵删