(工具篇):对方又向你扔了一个神器……
我们在前面几季介绍lncRNA作用机制的时候(比如(文章篇)S3E5:一文掌握LncRNA—蛋白—DNA互作研究方法),提到过lncRNA与蛋白结合这一最为常见的方式,lncRNA与蛋白结合后,lncRNA和蛋白来说可能有各自的意义,比如两者的表达、活性和定位等等。后来我们又介绍了验证两者相互作用的实验,比如RIP,RNA Pulldown等等。今天我们介绍一个数据库,看能否帮助我们研究lncRNA与蛋白的结合。
实际上,我们今天说的这个数据库,完全可用于RNA结合蛋白、RNA(lncRNA,mRNA,甚至是microRNA的前体pri-microRNA)与蛋白结合的预测等:
RNA结合蛋白有关的基金
在看数据库之前,我们简单说一下大部分软件或者数据库预测的原理:模式(pattern)+比对(Blast),即知道A类分子作用的模式,最常见的就是序列互补,然后通过序列比对来预测对应的B类分子,比如:
1. 转录因子靶基因预测,我们知道某一转录因子结合的保守序列的是TCGCAA,那么理论上从转录调控区寻找TCGCAA就可以找到转录因子的潜在靶基因了;
2. microRNA预测靶基因,microRNA种子区(Seed Region)的序列也知道,后面靶基因预测的工作也是根据种子区进行序列比对;
同样的道理,RNA结合蛋白也是这样,如果我们从某一蛋白出发,想预测与这个蛋白结合的lncRNA,我们需要将工作分解为三步骤:
A、这个蛋白是否有已知的RNA结合(识别)结构域?
B、这一类RNA结合(识别)结构域的识别序列是什么? C、哪些lncRNA有这些识别序列?
当然,我们说的是纯理论,具体实施的时候会遇到别的问题。好了,我们看介绍的数据库:
RBPDB:The database of RNA-binding protein specificities
再看实验部分:
其中报道的结合序列是我们关心的,因为:有了结合序列,我们就能比对了!
好了,我们开始看例子:
1. 查找能够结合lncRNA ANRIL的RNA结合蛋白:首先通过lncrnadb数据库(http://www.lncrnadb.org/)找到ANRIL的序列:
还可以对预测到的RNA结合蛋白点击查看:
当然,如果对于一条陌生的功能未知的lncRNA,也可以从这个角度根据lncRNA结合蛋白所参与的功能进行功能注释和挑选。
至于反过来,从蛋白到结合的lncRNA的预测,这个网站没有提供解决方法,以下是三种可能的解决办法:
1. 根据蛋白的结合序列,直接进行Blast。
2. 用我们以前介绍过的数据库,比如:The LncRNA and Disease Database
相关文章:
(文章篇)S4E04:说了你们又觉得在tree new bee的外泌体
(文章篇)S3E5:一文掌握LncRNA—蛋白—DNA互作研究方法
That’s all. Thank you!
请关注“小张聊科研”:搜索微信号“xzlky2015”,或长按二维码识别关注。
↓↓↓