查看原文
其他

小丫 2018-06-02

点鼠标就能找启动子区的motif》,给出了7种从一段DNA上找某个motif的方法。前提是找到这个转录因子的motif文件,如果在JASPAR里查不到,就去footprintDB试试,它可以跟TRANSFAC媲美。




2014年paper原文是这样描述footprintDB和TRANSFAC的:


A survey of the included data sources, organisms and TF families was performed together with proprietary database TRANSFAC, finding that footprintDB has a similar coverage of multicellular organisms, while also containing bacterial regulatory data.  




目前footprintDB收录了史上最全物种的转录因子和motif,每月更新。

http://floresta.eead.csic.es/footprintdb



包含8600个转录因子、12700个motif和27300个DNA binding sites。

包括所有物种,还单独列出了后生动物(果蝇、线虫等)和植物


这么多数据库,统统收录进来。





footprintDB能解决哪些实际科研问题呢?



问题一:找某个转录因子的motif


回到开头的问题,用《点鼠标就能找启动子区的motif》里的方法,从一段DNA上找某个motif,前提是先找到这个转录因子的motif文件。


http://floresta.eead.csic.es/footprintdb/index.php?search_entries


以p53为例检索





搜到21个转录因子和12个motif



12个motif都是人和拟南芥的。转录因子非常保守,即使您感兴趣的物种里没有它的motif,您也可以借用相近物种p53的motif。



蓝字都带链接,点开就是motif信息。下面列出的是一个未被JASPAR收录的motif,只比JASPAR收录的motif少了个JASPAR 2018的链接,需要转换motif格式。点击Download下载TRANSFAC格式的motif,用meme自带的转换工具变成meme格式的motif,然后就可以用《点鼠标就能找启动子区的motif》里的方法三找靶基因了。





问题二:我关心的蛋白质不一定是转录因子,它有可能结合哪个motif



INPUT: a protein sequence of a putative DNA-binding protein 


OUTPUT: a list of possibly recognized DNA motifs



问题三:这个motif可能被哪些转录因子结合


INPUT: a DNA consensus motif or site 


OUTPUT: a list of DNA-binding proteins (mainly TFs) predicted to bind a similar DNA motif 




对后两个问题感兴趣的小伙伴,可自行前往footprintDB尝试。如果需要小丫写帖子讲解,请留言。




史上最全系列:




点击“阅读原文”直达技术贴目录。

    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存