文献套路之Hi-C和ATAC-seq联合发NC
2019年5月在Nature Communications杂志发表一篇研究人类胰岛中的染色质可接近性和染色质构象的文章。该研究利用ATAC-seq、Chip-seq和Hi-C互作技术,根据染色质可接近性和三维构象识别了人类胰岛中远端增强子的候选靶基因,结合RNA-seq数据精细定位影响胰岛增强子的二型糖尿病(T2D)的风险变异,悄悄的告诉你Chip-seq和RNA-seq的数据都是下载的公共数据呦!
废话不多说,来看看人家是如何利用这些数据发的NC(先给自己定个小目标)
小编先一句话总结一下:
作者利用HI-C实验在三个胰岛样品中产生了胰岛高分辨率的染色质Loop,并采用ATAC-seq数据和发表的Chip-seq数据定义了胰岛增强子的靶基因,最后用这些Loop注释了胰岛增强子的靶基因。
作者识别了几千个胰岛增强子的候选靶基因,并且发现增强子的loop是与胰岛特异的基因表达相关的。将影响胰岛增强子的二型糖尿病的风险变异精细定位,结果发现采用染色质Loop及eQTL比对定义的这些变异的候选靶基因,富集在蛋白转运和分泌物途径中富集。在IGF2BP2基因上,一个T2D变异降低了胰岛增强子的活性和IGF2BP2的表达,同时在小鼠胰岛中条件失活IGF2BP2损伤了葡萄糖刺激的胰岛素分泌。这些发现为胰岛增强子功能研究和T2D风险基因识别提供了资源。
当当当,详细解读来啦~~~
测序材料
ATAC-seq:4个人类胰岛样品;
Hi-C sequencing: 3个胰岛样品,其中2个有ATAC-seq数据;
ChIP-seq:相同胰岛样品的H3K4me1, H3K27ac, H3K4me3, H3K36me3, 以及CTCF 的Chip-seq数据,公共数据;
研究结果
1. 胰岛染色质可及性和染色质三维构象
对4个人类胰岛样品进行ATAC-seq,并对每个样品分别call peak,合并后有105,734个胰岛染色质开放位点。收集先前发表的2个研究中胰岛的组蛋白修饰和转录因子的CHIP-SEQ数据,采用ChromHMM识别染色质状态。开放的染色质主要比对在活性增强子(EnhA1)和启动子(TssA)上(如下图a)。作者采用染色质状态功能地注释胰岛可接近的染色质Peak,来定义活化的增强子和启动子以及胰岛可接近的染色质的其他类别。最后,识别到44,860个激活的增强子,他们远离启动子,有着更强的组织特异性,与胰岛CHIPSEQ胰岛的转录因子重叠,有着FOXA,RFX,NEUROD以及其他转录因子的motif。这些结果定义了胰岛中活化的增强子和其他类别的可接近染色质。
由于增强子总是通过染色质Loop长距离的控制非临近的基因,因此定义增强子的靶基因是一种挑战。作者为了研究增强子的靶基因,在胰岛中以足够的分辨率构建了染色质构象来识别染色质Loop结构。采用原位HI-C在三个人类胰岛样品中进行构象捕获,其中2个样品的测序深度超过1000M read。分别采用5K ,10K, 25K分辨率(利用HICCUPS软件)识别每个样品及三个样品混合的Loop。如果锚点在20KB分辨率重合则合并loop(见上图b),合并4个集合的Loop后宫得到11924个胰岛loops,这些loop平均长度是255kb,并且有接近10%的Loop超过1Mb长度。
接下来作者进一步研究可接近的染色质和染色质loop之间的关系,结果发现胰岛开放的染色质信号大多定位在胰岛loop的锚点上,最强的信号在锚中点上(见下图c)。近一半的胰岛开放染色质位点都在loop锚点的25Kb范围内,这其中有16.8%直接与loop的锚点重合。开放的染色质位点大多富集在与染色质loop环直接交集的CTCF结合区域,随后是活化的启动子(TssA,TssFlnk),活化的增强子(EnhA1)。这些结果说明胰岛染色质loop显著的在CTCF结合区域、活化的启动子和增强子区域上富集。
2. 增强子loop和胰岛特异的基因表达
接下来作者采用染色质Loop来注释远端胰岛增强子和潜在的靶基因的关系。识别6278个胰岛活化的增强子直接位于染色质Loop锚点上,其中3022个增强子直接在基因启动子的loop上。反过来,2028个基因的启动子区域至少有一个直接的活化的增强子loop,而这其中又有952个基因的启动子区域与多个活化增强子loop相连。许多增强子和基因启动子Loop环距离很长,平均距离是165Kb,其中13.9%超过500kb,3.6%超过1Mb。例如,MAFB位点上有四个染色质Loop,其中有2个增强子和启动子的loop距离超过1Mb。这些结果定义了胰岛中几千个远端增强子元件的候选靶基因。
作者检查活化的增强子loop和靶基因表达之间的关联。将染色质loop定义的胰岛增强子候选的靶基因与胰岛样品的RNA-seq数据的基因表达比较。在胰岛中表达的基因中具有至少一个增强子loop环的基因比例更高,相对于非胰岛表达的基因。有着更多增强子的loop的基因平均表达水平更高(见下图c)。此外,胰岛增强子互作的数目是较高基因表达的预测子。这些结果说明远端胰岛增强子的染色质loop与胰岛特异的基因表达模式相关。
进一步确定胰岛增强子上的遗传变异对其靶基因调控上的影响。作者从两个发表的meta分析的研究中的230个胰岛RNA-seq样品中产生了表达数量性状位点(expression quantitative trait locus, eQTL)数据。识别了胰岛调控元件上的变异,并量化这些变异和靶基因(包含临近基因和loop定义的远端基因)的关联。跟预料的一样,对于近端基因的启动子和增强子变异上有着最强的eQTL迹象。远端增强子上的变异更倾向于调控loop内基因的表达,而不是非loop基因。这些结果说明在远端胰岛增强子元件上的遗传变异主要与染色质loop上的基因表达水平相关。
3. T2D风险信号影响胰岛增强子活性
胰岛调控元件上的遗传变异是富集T2D风险的,然而,调控元件上的变异在T2D上的风险是未知的。作者基于DIAGRAM (糖尿病基因复制和荟萃分析联盟)上6.1M常见变异(最小等位频率,MAF>0.05)的关联数据采用fgwas和LD-score回归,确定了胰岛调控元件和染色质loop上的变异在T2D风险上的影响。在活化的调控元件上观察到变异的富集,尤其以活化增强子更为显著(如下图a)。活化增强子和启动子元件上的变异对T2D风险的影响在染色质loop中更明显(如下图b)。相反的,其他胰岛元件如启动子侧翼,弱的增强子上的变异在loop外更富集。为了确定这些变异的相互依赖,我们联合对胰岛调控元件上的变异对T2D的风险建模,同时还包含GENCODE编码外显子和UTR上的变异。联合的模型中,观察到了胰岛活化的增强子元件,启动子侧翼,编码外显子上变异的富集。这些结果说明在T2D风险中,变异在染色质loop中的胰岛活性调控元件中富集。
4. T2D变异影响的胰岛增强子的候选靶标
许多T2D风险信号影响胰岛增强子的活性,但是这些增强子的靶基因还不清楚。为了识别增强子上T2D风险变异所影响的基因,作者采用了分层策略,首先采用染色质loop和临近启动子识别这些增强子的候选靶基因,接下来通过T2D增强子变异的顺式调控优化候选基因。对于每个T2D增强子信号,基于是否一个增强子变异位于染色质loop或者启动子的25kb范围内来识别候选基因。基于这个定义,T2D增强子信号有着平均2个候选靶基因,与候选变异周围的1MB窗口(平均18个基因 )或者TAD边界(平均7个基因)上的基因比大幅减少(下图a)。在几个位点上,loop相关的候选靶基因距离T2D增强子变异较远(>500kb)。这些结果定义了T2D增强子信号的候选靶基因,包括多个在大基因组距离上相互作用的基因。
接下来使用胰岛eQTL数据绘制由T2D增强子信号上的变异所调控的候选靶基因。在每个信号上,作者检测每个候选基因的最可能的增强子变异。对于具有eQTL证据的结果基因,作者进一步利用贝叶斯共定位证实eQTL和T2D信号没有明显的因果变异。CAMK1D ABCB9, C2CD4B,和IGF2BP2基因显示为8个已知的胰岛增强信号的胰岛eQTLs迹象。例如,已知T2D变异rs11257655位于一个胰岛活性增强元件上,这个元件直接与CAMK1D启动子成环,且该变异是一个胰岛eQTL(如上图c)。这些结果确定了被T2D胰岛增强子信号顺式调控的候选靶基因。
5. 条件失活Imp2影响胰岛素分泌
T2D变异临近基因启动子及eQTL迹象表明,3q27区域上的IGF2BP2是唯一的候选靶基因,同时是整个TAD中的唯一基因。作者尝试确定胰岛中这个区域上风险变异的活化机制。3q27上的T2D增强子变异位于距离IGF2BP2启动子6kb的内含子区域上。观测到区域内的rs10428126上的等位不平衡,T2D风险等位C降低可及性,而其他候选变异并没有。同时这个变异在先前的研究中被报道为胰岛中染色质活性的QTL,进一步在MIN6细胞中采用基因报告实验,来验证rs10428126上的T2D风险等位降低胰岛增强子活性。这些结果揭示了IGF2BP2的一种可能的致病风险变异,它降低了胰岛中染色质的可及性和增强子活性。
由于IGF2BP2位点的T2D风险等位基因与胰岛染色质可及性降低、增强子活性降低、IGF2BP2表达降低以及胰岛素分泌表型减少相关,因此作者假设IGFBP2活性降低将导致胰岛的糖尿病表型。采用小鼠模型测定IGF2BP2(小鼠Imp2)降低对胰岛功能的影响。Imp2在成年小鼠组织中广泛表达,包括脂肪、肌肉、肝脏和胰腺,在胰腺中定位于胰岛和重叠的胰岛素中表达(下图a)。作者通过将Imp2flox(f)等位基因与大鼠胰岛素2启动子(RIP2-Cre)驱动的Cre重组酶重组,使小鼠beta细胞中的Imp2失活。从分离的Imp2ff/RIP2-Cre胰岛中的提取物进行免疫印迹分析,发现Imp2的丰度降低相比于Imp2ff胰岛(下图b)。Imp2ff/RIP2-Cre小鼠在正常鼠粮(NCD)和高脂饮食(HFD)上均未表现出明显的表型,体重增加与Imp2ff对照组相似。
作者评估了小鼠β细胞缺乏Imp2对葡萄糖稳态的影响。10周龄时,Imp2ff和Imp2ff/ RIP2-Cre小鼠在正常食物下血糖和胰岛素水平无差异。相比之下,高脂膳食的 Imp2ff/RIP2-Cre的小鼠的血胰岛素和c肽水平较高脂膳食的对照组小鼠有所降低,而血糖和胰高血糖素水平相似(下图c)。当腹腔内葡萄糖注射液高脂膳食时,相比于Imp2ff老鼠,Imp2ff / RIP2-Cre小鼠表现出明显高的葡萄糖和低的胰岛素水平(下图 d, e)。这些结果表明,Imp2缺乏症限制了β细胞对胰岛素需求增加时增加胰岛素分泌的能力。
参考文献:
Greenwald, W.W., et al., Pancreatic islet chromatin accessibility and conformation reveals distal enhancer networks of type 2 diabetes risk. Nat Commun, 2019. 10(1): p. 2078.
文献下载链接:
https://international.biocloud.net/zh/article/detail/31064983