(工具篇):如何查找基因的启动子及预测转录因子?
最近长链非编码RNA(lncRNA)很火热,好不容易找到了一个心仪的lncRNA(关于怎么找,我们之前也聊过:自己做测序、芯片;从别人的数据里挖据;或移植研究从其他疾病里扯一个过来验证),那么问题来了:分子有了,机制部分我该往哪个方向扯呢?很多人可能都会仔细寻找下游靶分子,以证明该lncRNA参与了xx调控,具有某个功能,表明该lncRNA分子在疾病发生发展过程中起到了很重要的作用。其实,我们还可以往上游做,以丰富机制研究的深度。今天我们就聊一聊,预测一下参与调控lncRNA表达转录因子的方法。
今天我们通过2个方式进行预测:
1、需要用到UCSC、PROMO数据库
首先,我们需要找到lncRNA的启动子序列。
打开UCSC数据库:
举例:HOTAIR
输入:HOTAIR
点击GO
点击红色的那个序列
得到这么一个图,点击红色框,
继续点击,
得到这个界面,我们需要修改一些参数:转录起始位点上游2000nt和下游100nt区域为我们所选的启动子区。
Submit
OK,启动子序列有了。拷贝下来。
接下来,我们打开PROMO数据库:
http://alggen.lsi.upc.es/cgi-bin/promo_v3/promo/promoinit.cgi?dirDB=TF_8.3
在SelectSpecies进行部分设置,
Submit
另外,如果对转录因子有选择的话,也可以在SelectFactors中进行设置。
最后,我们点击SearchSites
将刚刚得到的启动子序列粘贴进行。另外,默认容错率15%,如果得到的转录因子过多,我们可以进行调整,设置成5%或0%。
Submit
http://alggen.lsi.upc.es/cgi-bin/promo_v3/promo/promo.cgi?dirDB=TF_8.3&idCon=148056381600&getFile=resumSearchRes.html
我最终设置了容错率为0,一共得到了120个预测的转录因子。
那么这些转录因子都有可能与HOTAIR的表达相关,可能存在正向或负向的调控关系。
2、直接通过GENECARDS数据库查找相关基因的转录因子
打开GeneCards,输入HOTAIR:
选择第一个HOTAIR,
得到这个界面,往下拉:
点击:See All at QIAGEN
得到了很多很多的预测转录因子。前面蓝色的评分很高,后面的小竖是结合位点。
点开一个,例如FOXC1:
再点击小竖线可以查看结合的那段序列哦。
最后,我们可以对这两个方法所预测的结果进行取交集,这样也算有的放矢。
❈
最近要准备国自然基金了,于是把前段时间发过的文章最新进行了整理,并编辑成了《科研修炼手册》3.0,旨在为大家的科研与基金之路能添砖加瓦。3.0手册内容包括策略篇、工具篇、文章篇和杂志篇四部分:策略篇从科研方法论到文章解读,从文章解读到设计课题和准备基金,让大家不再为课题发愁;工具篇主要包括了lncRNA研究、公开数据挖掘等有关的数据库和软件,用好这些神器,释放洪荒之力;文章篇梳理别人文章的架构,给自己的科研思路提供一些方向,洋为中用,彼为我用,百战不殆;杂志篇梳理了部分专业领域的杂志,让投稿更有目的性。
❈科研修炼手册的1.0与2.0版本的最新链接如下:
小张聊科研修炼手册V1.0
http://pan.baidu.com/s/1eSHULv8
小张聊科研修炼手册V2.0
https://pan.baidu.com/s/1dF5Lwkh
小张聊科研修炼手册V3.0
https://pan.baidu.com/s/1eS6z1ia,密码:bhj2
That's all. Thank you!
请长按二维码识别关注“小张聊科研”。
关注后即可获取《科研修炼手册》1.0、2.0和3.0。