查看原文
其他

勾搭学妹,应该如何查找基因

2015-05-19 李莫愁博士&右哉 实验万事屋

提示:请点击标题下方蓝色“实验万事屋”,添加关注后,发“嗯”可以查看我们之前的文章。未经允许,其他公众号及网站不得转载哦!违者一律举报,绝不姑息!



“师妹,我有一条祖传的DNA想送给你”


“哪条?ID号?别名是什么?多少个bp?有多少个转录本?........”


“呃……其实是一整条……好吧,呐,我还有一个祖传的单倍体细胞系,你有没有兴趣呢?”


真的连基因都找不到,就不要在实验室里勾搭师妹了,现在的师妹都挺厉害的不是么……


要真找基因也并不是很容易的,我们先来分析一下基因名字。你要问了,师姐,你这不是侮辱我么,基因名字我


会不知道?什么P53、Nf-kB、β-Catenin,E-Cadherin,我是张嘴就来啊……


傲娇吧,年轻人,我们先来看看你用这种名字来,要怎么搜Actin这个基因。


点开NCBI的Gene,然后,输入你觉得是这个基因的名字:βActin,然后:



好吧,看到这里我们发觉,起码好歹真的有叫β Actin的基因,但怎么说呢,反正不是人的就对了。


那我们找是人的,好啦,旁边有工具,显示:



人么,就是这个Homo Sapiens,点进去还有48个基因,尼玛到底是哪个呢?



仔细看描述一栏,也就是Description,中间有一个是描述成actin,beta的,这个基因名(Symbol)应该是ACTB。而不是我们通常说的β Actin。




Symbol是基因的名称,在文献是可以经常看到的,经常会提到某个基因的基因名。我们就可以用Symbol在NCBI的Gene数据库搜索。但有一点需注意,Symbol是经常会改变的,就是说随着序列的升级,对该基因的研究更加深入,Symbol会改变。但这个基本上不会影响使用,因为NCBI仍然会保留旧的基因名。用旧的Symbol在Gene数据库搜索同样有效。


我们打开β Actin的Gene页面,抱歉,应该是ACTB。然后可以看到这样的信息,ATCB到底有多少种名字。这里有ACTB的官方基因名,官方全名也就是俗名,基因ID号(这个在做GO分析的时候很重要),还有该基因的别名。



是光这点基因名称就Over了么?还么有辣么简单,你会看到NC_0000000,NG_000000,NM_000000这样一系列的编码。这又特么是什么呢?


这是NCBI上对于基因注释的参考序列编码,我们稍微解释一下,基本上是这样的:



按照下面这个表格上的注释编码,就可以找到你想要的基因序列了。


学会了这个,你就可以轻松勾搭师妹了(感觉还是有点坑爹呢,不要在意这些细节。)对话就很可能是下面这样:



“师妹,我有一条祖传的DNA想送给你”


“哪条?ID号?别名是什么?多少个bp?有多少个转录本?........”


“Chromosome Y, NC_000024.10 (12904108..12920478)”


“那……那你把这段序列全长背一下吧……FASTA格式的……”


“呃……好吧,呐,我还有一个祖传的单倍体细胞系,你有没有兴趣呢?”


…华丽丽的分割线…


李莫愁博士:有很多基因名并不是大家口头所说的那些,比如P53,其实Symbol应该是TP53,Nf-kB的Symbol应该是NFKB1,β-Catenin的Symbol应该是CTNNB1,E-Cadherin的Symbol应该是CDH1,诸如此类。了解之后,大家就应该明白,为啥要搜基因去设计qPCR引物的时候,压根找不到要找的基因的俗名了吧?好了,今天就策到这里吧。




您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存