点击上方蓝字关注“公众号”
隔壁实验室的师妹隔三差五就拿着一段序列过来,“师兄你帮我看看嘛,我这段序列在circBase没找到,是不是个新的circRNA啊?”,“这个嘛,大师兄句月山人肯定讲得比我好,我们一起去找他吧”(不敢说其实是我不会查)。
这么来来回回几次,我终于学会了,今天正好师妹又过来,我也可以大(kai)显(shi)身(zhuang)手(bi)了。
师妹我们来看看你的序列,嗯,也不长嘛,那我们先去UCSC逛一下。
>novel_circRNA_00129|306bp
GTGCCTACTCCCTGTCCATCCGGGACTGGGATCAGACCAGAGGCGATCATGTGAAGCATTACAAGATCCGCAAACTGGACATGGGCGGCTACTACATCACCACACGGGTTCAGTTCAACTCGGTGCAGGAGCTGGTGCAGCACTACATGGAGGTGAATGACGGGCTGTGCAACCTGCTCATCGCGCCCTGCACCATCATGAAGCCGCAGACGCTGGGCCTGGCCAAGGACGCCTGGGAGATCAGCCGCAGCTCCATCACGCTGGAGCGCCGGCTGGGCACCGGCTGCTTCGGGGATGTGTGGCTGG
对,打开UCSC后先选择Tools下的Blat哦,点进去。
接下来就是BLAT Search了,选好物种Human,基因组版本记得选GRCh37/hg19哦,等下告诉你为什么。然后把你的序列粘贴进去,点击submit。
在BLAT Search Results我们看到有三行,第一行是100% IDENTITY,那我们点details进去看看。
你看,这就是你的序列在GRCh37/hg19上的位置,把这个复制下来,等会儿有用的呢。
顺便看一下你的序列在基因组上的Alignment,由两个外显子组成,前后正好是AG和GT,符合剪切规律呢,如果不是的话就要考虑特殊情况或者序列不对的可能了。
好的,我们刚才复制了你序列的位置,接下来我们去circBase逛一下。
我们要先从circBase里链接进入UCSC Genome Browser,你看这里默认基因组版本是GRCh37/hg19哦,所以前面BLAT Search的时候要选同样的版本,不同的版本序列对应位置可是不一样的。接着在框里输入我们刚才复制的基因组位置,然后点击go。
我们看到这个位置正好有一个circRNA,也是两个外显子,那我们记一下ID号,去circBase里查一下吧。
你看查找结果,这个基因剪切长度是306bp,和你的序列一致,我们点fasta可以下载序列哦。
接着circRNA sequence要选spliced哦,然后点击Search。
这样我们就下载到hsa_circ_0011078的序列了。
>hsa_circ_0011078|NM_001042747|FGR
GTGCCTACTCCCTGTCCATCCGGGACTGGGATCAGACCAGAGGCGATCATGTGAAGCATTACAAGATCCGCAAACTGGACATGGGCGGCTACTACATCACCACACGGGTTCAGTTCAACTCGGTGCAGGAGCTGGTGCAGCACTACATGGAGGTGAATGACGGGCTGTGCAACCTGCTCATCGCGCCCTGCACCATCATGAAGCCGCAGACGCTGGGCCTGGCCAAGGACGCCTGGGAGATCAGCCGCAGCTCCATCACGCTGGAGCGCCGGCTGGGCACCGGCTGCTTCGGGGATGTGTGGCTGG
接着我们去对比一下你的序列novel_circRNA_00129和hsa_circ_0011078是不是一样的。
对比结果显示100% Match,所以你的序列novel_circRNA_00129就是circBase收录的hsa_circ_0011078,不是一个新的circRNA哦。
其实我们还有另外几种方法来查找和比对,今天就先讲这一个吧,你会查了吗?
“师兄,谢谢你哦,我学会了,不过下次查序列我还会来找你的,”看着师妹微低头道谢,我一激动都忘了刚才讲得口干舌燥的难受。
“师兄,拜拜哦~”
“嗯拜拜,师妹,下次有问题再来找我啊!”
点击“阅读原文”