跟着阿拉丁一起学习的时间又到了~~
ATAC-seq利用DNA转座酶(Tn5)切割开放的DNA区域并结合二代高通量测序技术来研究染色质开放性的技术。
ChIP-seq是研究蛋白质与DNA相互作用的经典实验方法。该技术广泛应用于组蛋白修饰、转录因子调控等相关领域的研究。
ATAC-seq与ChIP-seq异同
ATAC-Seq (Assay for Targeting Accessible-Chromatin with high-throughout sequencing),是在全基因组范围内检测染色质的开放区域,得到蛋白质的潜在结合位点,不依赖于抗体,可用于寻找感兴趣的转录因子的binding区域及其靶基因。ChIP-Seq(Chromatin Immunoprecipitation,ChIP),即染色质免疫共沉淀技术,是揭示特定转录因子或蛋白复合物的结合区域,利用特异性抗体富集蛋白质及其结合的DNA片段,从而验证蛋白质与DNA的相互作用关系。ATAC-Seq、ChIP-Seq数据分析的整体思路基本一致,找到富集区域(Peaks),对Peaks进行Motif分析以及功能富集等分析。
已知转录因子,如何对其binding区域以及靶基因进行预测?
ChIP-Seq所研究的蛋白修饰对象如转录因子, 不考虑远距离的调控作用的情况下,其结合位点可能存在于基因的启动子(promoter)区域,且具有特定的保守序列特征。可对该转录因子的富集区域(Peaks)进行Motif分析,寻找转录因子的保守结合位点。这样就很容易知道一个Motif是否显著富集在这个区域(与背景区域相比),也就很好的回答了一个生物学问题:该转录因子是否显著地结合到该区域。再根据ChIP-seq找到的Peaks进行注释,根据注释信息找到最近的基因。然后看这些promoter上分别有哪些富集的Motif,再与感兴趣的转录因子相对应即可得到其靶基因。
联合分析可以咋搞?
我们可以根据ATAC-Seq预测到的转录因子的潜在结合区域,设计特异的蛋白,利用ChIP-Seq进行验证。
ATAC-Seq具有时空特异性,联合转录组的测序结果,可以得到ATAC-Seq获得的Peaks所处的DNA序列区域,是否对应转录本的表达情况;也可得到转录本相关基因的上游调控序列,进而对基因功能分析,再结合实验表型进行讨论,从而理清楚表观调控-表达-功能-表型这样一个过程。Item1
通常认为,比较组间发生差异表达的基因与表型差异可能具有因果关系,而染色质可接近性变化可能是差异表达的原因之一。可用象限图更好地对在两种组学层面都发生变化的基因进行细分,并选择关注的象限进行渐进性富集分析(GO、KEGG、GSEA等),进一步从功能层面锁定关键基因集。
注:横轴:ATAC-seq 差异 peak 信号变化倍数;纵轴: 差异表达基因差异倍数。二者间的关系( ATAC、RNA) 根据开放性上/下调和表达上/下调分为 4 个类群。
Item2
启动子区域上游2kb通常被认为是基因转录起始位点(TSS),其可接近性变化会影响转录起始元件及调控元件的结合,对基因表达产生较为直接的影响。很多研究会将这一区域作为重点,关注其可接近性变化与基因转录水平的关系。那么,我们可以通过折线图和热图,展示TSS或整个转录区域上下游一定范围内的基因表达情况,折线图适合做多个基因的数据整合,热图可以显示各个基因的情况。
注:根据表达量将基因分为3个类群(low、med、hig),并对其TSS上下游2kb区域内进行划窗,绘制折线图(上)和热图(下,因图形较长仅截取首尾)
Item3
可以基于启动子区ATAC-Seq信号在比较组间变化情况,将基因分为三个类群(例如下图的:High、Dynamic、Low);并在不同类群内,根据各基因在不同比较组内表达情况进行排序,从而统计启动子区ATAC-Seq信号强度和对应基因的表达量,绘制完整的双组学热图。
注: 双组学热图左侧为转录组、右侧为ATAC数据。横轴:不同样本;纵轴: 不同基因,按启动子开放性情况进行分群。
[1] Meyer, C., Liu, X. Identifying and mitigating bias in next-generation sequencing methods for chromatin biology. Nat Rev Genet 15, 709–721 (2014).
作者:snail
编辑:angelica