谁来调控我感兴趣的lncRNA/circRNA/miRNA | 100%可行的解决方案V2.0
耐心读完,消化,实践,修炼成转录调控专家。
第一篇解决的问题:
转录因子调控了谁?本质是蛋白质对DNA的调控。此处"DNA"包括能够翻译成蛋白质的蛋白编码基因、能够转录成lncRNA/circRNA/miRNA的基因
第二篇解决的问题:
谁来调控我感兴趣的基因?本篇从转录水平研究。本质是蛋白质/RNA对DNA的调控。下篇重点讲转录后水平的研究方案。
谁来调控我感兴趣的DNA?100%可行的全面解决方案V2.0
这篇要解决的问题:
ncRNA向下调控了谁?
转录水平,ncRNA基因受谁调控
转录后,ncRNA受谁调控
本质是RNA对DNA/RNA/蛋白质的调控、蛋白质对RNA的调控。人们发现了大量非编码RNA(ncRNA)具有调控作用,本文ncRNA包括lncRNA、circRNA、miRNA
研究lncRNA/circRNA/miRNA的功能,做KO/KD/过表达,看到了表型。然后呢?如何给我的研究拔个高?要升华,就要探讨其作用机制,无非是谁调控了ncRNA,ncRNA向下调控了谁。
RNA向下调控了谁?
基于高通量实验筛选
经典策略是,KD/KO或过表达感兴趣的RNA,通过RNA-seq/蛋白质组实验找出的差异基因/差异蛋白质很可能受该RNA调控。哈尔滨工业大学王亚东组基于这个原理建立了lncRNA2Target数据库,www.lncrna2target.org/,可惜三年没更新了。
它没更新没关系。具体到某个RNA,我们自己去SRA数据库查询RNA-seq数据,如果已经做过这个RNA的KD/KO样品的RNA-seq,就可以拿来看该RNA调控的靶基因了。
上面找到的是间接调控,要直接调控的线索,怎么找?
找RNA直接调控的靶基因的最好方法是ChiRP实验,为RNA设计探针,拉它结合的DNA/RNA/蛋白质。提取DNA,测序,找的是RNA结合的DNA;提取蛋白质,做质谱MS,找的是RNA结合的蛋白;提取RNA,测序,找的是RNA结合的RNA。世界上有几个组能做好ChiRP实验?一只手都数的过来。可行性低,怎么办?预测缩小范围,然后用一对一的实验验证。
预测RNA结合的蛋白质
先用预测方法找出候选基因,然后用低通量实验验证。2017年发表的基于机器学习的RNA和蛋白结合预测工具——catRAPID。http://service.tartaglialab.com/page/catrapid_group,能预测RNA结合的蛋白质,还能预测蛋白质结合的RNA(文末讲这个问题)。用法查看tutorial,简单易用。
支持多个物种
谁来调控lncRNA/circRNA/miRNA的问题,要从转录和转录后两个水平来研究。
lncRNA/circRNA的转录水平调控
(蛋白质结合DNA)
上篇讲的研究转录因子对DNA的调控的方法,同样适用于lncRNA/circRNA/miRNA的研究。这段DNA下游基因要么转录成mRNA然后翻译成了蛋白质,要么转录成lncRNA或circRNA或miRNA。因此,找蛋白编码基因和找lncRNA/circRNA/miRNA基因上游的调控因子的方法是一样的。
Plan A:大量ChIP-seq公共数据
Plan B:motif分析预测
补充Plan C:ATAC-seq结合motif分析
返回上一篇看Plan A和Plan B,谁来调控我感兴趣的DNA?
Plan C:ATAC-seq结合motif分析
调控蛋白所结合的DNA附近会形成open区域,产生DHS。2013年,Howard Y Chang发明了ATAC-seq。详见从第一篇文章开始,讲讲ATAC-seq能干啥?类似于DNase-seq,ATAC-seq能够找出基因组上的open区,根据这段区域上的motif,推测它上面可能结合的TF。ATAC-seq用的细胞数更少,500-50,000个细胞就能做,实验更稳定。有了ATAC-seq的加入,把motif预测出来的候选TF范围缩小到染色质开放区域,结果更准确。
去年Howard Y Chang又发明了ATAC-see(assay of transposase-accessible chromatin with visualization,利用可视化检测转座酶易接近的染色质)。
还记得Howard Y Chang吗?美帝国自然NIH资助啥?一文中看到,他凭《lncRNA在癌症中的作用机制》一项拿到$724,705,相当于人民币400多万,该项目已经发表2篇paper,一篇Single cell,一篇CRISPR screen。我们站在大牛肩上,紧跟大牛节奏,就能赶在上升期,抓紧时间轻松发一区;否则,邻居大妈都知道ATAC-seq的时候。。。
ncRNA的转录后调控
(RNA结合RNA、蛋白质结合RNA)
RNA调控RNA
本来miRNA要退二线,结果lncRNA经常请它出山;现在circRNA加了一把力,让miRNA出镜率又高了起来。发展了这么多年,直接筛选与RNA结合的RNA的高通量实验技术难度依然很大,因此,大家喜欢先预测,再用低通量实验验证。
通过预测miRNA靶基因,筛选作为ceRNA竞争miRNA的lncRNA/circRNA。这种帖子已经满天飞。review总结的ceRNA数据库,https://doi.org/10.1093/bib/bbx042
小哈只说一点,如果做miRNA靶基因预测,首选TargetScan。由专做miRNA的大牛Bartel组开发,持续维护更新,最新更新到2016年6月。提供人、小鼠、线虫、果蝇、斑马鱼的独立检索页面和下载。其余的工具已经很久不更新了,例如pictar用的还是hg18,miRanda更新到2010年。
蛋白质调控RNA
依旧是先讲基于高通量实验的筛选方法,再谈预测方法。
基于高通量实验的筛选调控RNA的蛋白质
什么样的蛋白质会来调控RNA呢?有一类RNA结合蛋白(简称RBP),它们会结合RNA,调控RNA加工。目前发现的人类RBP有1072个。
单独做一套RNA结合蛋白的RIP-seq或CLIP实验,能看到该RBP的靶基因是谁,motif长啥样。少数专门研究RBP的人对这样的问题感兴趣。
上面是模式图,下面是真实数据
更多的研究者想知道:哪个RBP调控了我感兴趣的ncRNA。这就需要多套RIP/CLIP数据整合分析了。当你手里有成百上千套RIP-seq或CLIP-seq数据时,就看哪套数据在感兴趣的RNA上有peak,也就知道了哪个RBP结合了我的RNA。
上面是模式图,下面是真实数据
有哪些RBP的高通量数据可以用呢?
曾经有个收录RBP的数据库RBPDB,http://rbpdb.ccbr.utoronto.ca/,五年没更新了。
所幸ENCODE已经产生了332套高质量的eCLIP-seq数据,包含250个RBP,2种细胞系,存储在ENCORE数据库中。点击左下角“阅读原文”直达eCLIP-seq数据检索界面。
下面的视频由ENCODE里面主攻RBP的Yeo Lab的Eric Van Nostrand讲解。介绍了RBP数据库里都有哪些数据;eCLIP-seq数据处理pipeline和命令行;以及用RBP数据库能做哪些研究?
https://v.qq.com/txp/iframe/player.html?vid=l0546b2m1us&width=500&height=375&auto=0
前面和后面的部分截图来自ppt,需要ppt文件就发消息给嘉因小二。
长按下图,识别二维码,联系嘉因小二
ENCORE数据库里有哪些数据?
eCLIP-seq数据处理pipeline
ENCODE只产生了332套eCLIP-seq数据,在SRA上能检索到更多的RIP-seq和CLIP-seq数据,人的有1890条记录。充分利用这些公共数据,将为研究lncRNA/circRNA调控机制提供有实验证据的线索。
预测调控RNA的蛋白质
积累越来越多的RBP RIP-seq或CLIP数据,识别motif,以后我们也可以通过motif预测的方式找调控RNA的RBP了。目前已有机器学习方法计算Global Score,已经整合进catRAPID工具中,http://service.tartaglialab.com/page/catrapid_group,预测哪个RBP调控我感兴趣的ncRNA。
写到这里,意犹未尽。本系列主要集中在高通量实验筛选,而不是一对一的研究。过后根据读者反应再做补充。有不足之处,请留言指正。
想用ChIP-seq、ATAC-seq实验研究感兴趣的基因?想用已发表的ChIP-seq、eCLIP-seq、ChIA-PET、DNA甲基化测序、RNA-seq数据寻找线索?找嘉因生物吧!从实验、测序,到多种数据整合分析,为您一站式解决。(点击文中蓝字了解详情)
嘉因生物公众号定位:客户共性问题解答,生信学习资源导航,高通量实验导购 | 为您提供高通量实验-测序-分析-验证一站式解决方案
电话:021-61539657
Email:marketing@rainbow-genome.com
地址:上海市杨浦区赤峰路65号同济科技园1号楼611室