查看原文
其他

小哈 2018-06-02

转录因子调控了哪些靶基因?


今日推出完整解决方案V2.1


4种策略能够解决这个问题,总有一款适合你:


  • Plan A:RNA-seq。直接调控?间接调控?傻傻分不清

  • Plan B:ChIP-seq。最直接,最有效,与RNA-seq整合分析更准确

  • Plan C:ATAC-seq + motif分析。没有ChIP级别抗体,也能准确找到靶基因

  • Plan D:基于motif预测,这是个垫底儿的


小哈吐血整理 ~

老板骂小哈:你为了拉关注,把嘉因吃饭的本事都亮出来了!balabala。。。


呜呜~~,您再不点顶端蓝字,关注“嘉因”公众号,小哈就没饭吃了!





Plan A:RNA-seq


实验材料:

TF KD/KO/过表达或激活的处理组;

TF正常表达的对照组。

(本文转录因子简称“TF”)


实验方法:

RNA-seq,筛选上述两组样品的差异表达基因,推测TF调控的靶基因。


优点:

对实验技术要求不高,容易实现。

已发表的RNA-seq众多,如果能找到TF KD/KO/过表达或激活的两组对比数据,直接拿来分析,多快好省。


缺点

TF KO/KD/过表达导致了gene1、gene2、gene3、gene4表达量的变化,可能是TF调控了gene1,gene1调控gene2,gene2调控gene3和4的结果。所以,用RNA-seq找的下游基因,直接调控?间接调控?傻傻分不清。



“怎样找到这样两组对比的已发表的RNA-seq数据?”


从GEO数据库www.ncbi.nlm.nih.gov/geo/搜索感兴趣的TF,在左侧点击Study type->Customize ...,勾选


点击右侧Top Organisms里的Homo sapiens (29),筛选出带有TP53字样的人的高通量测序表达谱数据。


往下拉,找TP53发生变化的样品的测序数据,找到不只一套


下载GSE89226_Gene_count_rpkm.txt.gz文件,查看差异表达基因,推测受TP53调控的基因。



想找直接调控的靶基因,就上Plan B和C



Plan B:ChIP-seq


实验材料:

您感兴趣的细胞、组织;

TF的ChIP级别抗体。

怎么找抗体?看这篇《搜抗体,哪家强?| 人工智能帮你找抗体,BenchSci,实时显示引文Figure


实验方法:

ChIP-seq,染色质免疫沉淀实验结合高通量测序,是在体内in vivo研究蛋白质与DNA结合关系的最有效方法。


简单讲ChIP-seq的原理:用TF的抗体抓TF,同时抓下来TF结合的DNA,提取DNA,测序,就知道TF结合了哪些DNA,推测DNA附近的基因受该TF的调控。


下面这些链接有详细介绍:


结合RNA-seq,能更准确的找到靶基因,还能推测出TF的功能是激活还是抑制,详见《ChIP-seq和RNA-seq整合分析,BETA最擅长


优点:

  • 直接找到TF结合的DNA,这是直接调控;

  • 还能找到TF的collaborator;

  • 目前已发表了5700多套人的ChIP-seq数据,小鼠的有4500多套,其他物种看这篇《做过ChIP-seq或ATAC-seq的物种速查》。如果有人做过您的TF的ChIP-seq,细胞类型也相近,就直接拿来看吧!


缺点:

依赖于抗体,如果没有好用的抗体,就没法做ChIP了。



“去哪找已发表的ChIP-seq数据?”


CistromeDB数据库,http://cistrome.org/db/,收录了已发表的人和小鼠2万多套ChIP-seq、DNase-seq和ATAC-seq数据,不断更新收录新数据。



查看您感兴趣的转录因子是否已经做过ChIP-seq,您感兴趣的细胞系有没有人做过DNase-seq或ATAC-seq,查询方法非常简单。可进入http://cistrome.org/db/#/tutorial查看教程,有视频讲解。


点击Get top putative targets,这个表里就是该转录因子调控的靶基因,还有motif,这个motif可能是该TF的,也肯能是TF的collaborator的,顺道还能找到TF的collaborator。


没有好用的ChIP抗体,怎么办?有Plan C。




Plan C:DNase/ATAC-seq + motif


实验材料:

您感兴趣的细胞或组织;

您感兴趣的TF的motif。


实验方法:

用DNase-seq或ATAC-seq找开放区,预示着这样的区域有调控因子结合。

在开放区找motif,如果有您感兴趣的TF的motif,那么这个TF很可能就在这里有结合,从而调控附近基因。


优点:

不依赖于抗体


缺点:

依赖于motif。



“去哪找已发表的ATAC-seq数据?”


去Plan B提到的CistromeDB里查找相近细胞类型的DNase-seq/ATAC-seq数据。如果没有已发表数据,就自己做。DNase-seq实验不稳定,世界上只有个别组能做好该实验;推荐做ATAC-seq,嘉因做得好。



“去哪找motif?”


Plan D里有详细方法。

如果没有相似细胞的ATAC-seq数据,就只能看motif了。




Plan D:motif分析


实验材料:

motif数据库;

或ChIP-seq数据。


实验方法:

每个转录因子都有一个DNA结合结构域(DBD),喜欢结合在特定DNA序列上,也就是motif。去基因组上搜索motif所在的位置,其附近的基因就有可能受该TF的调控。


优点:

每个转录因子都有DNA结合结构域,有特定的motif,不依赖于细胞类型,在物种间保守性极高,可以跨物种使用。目前TF数据库收录了大量TF的motif,还有上万ChIP-seq可以用来找motif。


缺点:

某个位置有motif,TF未必会结合;反之,没有motif,TF未必不结合,有可能TF1结合到TF2上或mediator上,再结合到DNA上,这里的TF广义的说是调控因子。



具体操作时涉及到以下3个问题,带具体操作方法:


“问题1:怎样找TF的motif?”


JASPAR数据库http://jaspar.genereg.net/收录的TF motif信息全、质量好。查询感兴趣的TF CEBPB,Search




那个彩色的高高低低的ATCG图就是motif logo




“问题2:motif在哪些基因附近?”


点击motif logo,查看详细信息



点击下方Binding sites information里的Bed file按钮,就能看到motif所在的位置信息。


bed file长这样


要直观的查看具体位置怎么办?


把上面的网页另存为文本文件,拖拽到IGV里,就能看到您关注的基因附近有没有该TF的motif。



哪些基因附近有这个motif呢?我要列表


用UCSC的Table Browser,https://genome.ucsc.edu/cgi-bin/hgTables,在region行选择position,点击最右边的define regions。


把bed文件的前三列粘贴进去


submit,回到Table Browser页面,点击get output,第二列就是基因名。到Excel里,把第二列复制粘贴出来,就是motif附近基因列表。



“问题3:如果motif的数据库里没有该TF的motif怎么办?


用ChIP-seq找motif。

去Plan B的Cistome DB找ChIP-seq数据,即使不是您感兴趣的细胞类型,甚至是不同物种,这些数据还是有用的,用它找TF的motif。



还有哪些问题?请留言,下一个版本的解决方案就来解决您的问题。



福利

看到本文的小伙伴有福啦!加表观小助手微信号:epigenomics。把联系方式告诉她,给您送2018年学术台历

组蛋白修饰的分布模式图组蛋白修饰的半衰期常用工具研究策略。都印在台历上,老板再也不担心我记不住各种histone mark预示着什么了!



点击“阅读原文”直达技术贴目录。

    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存