功能数据库专题-GO数据库
简介发展和工作形式术语形式数据格式GO注释(有福利)GO分析相关工具汇总生信菜鸟团博客相关资源
官网:http://www.geneontology.org/
GO(gene ontology)是基因本体联合会(Gene Onotology Consortium)所建立的数据库,旨在建立一个适用于各种物种的,堆积因和蛋白质功能进行限定和描述的,并能随着研究不断深入而更新的语言词汇标准。它是多种生物本体语言中的一种,提供了三层结构的系统定义方式,用于描述基因产物的功能。目前,GO的定义法则已经在多个合作的数据库中使用,使得这些数据库在查询时具有很高的一致性。这种定义语言具有多重结构,因此在各种程度上都能进行查询。例如GO可以被用来在小鼠基因组中查询和信号转导相关的基因产物,也可以进一步找到各种生物的受体酪氨酸激酶。这种结构允许在各种水平添加对此基因产物特性的认识。
发展和工作形式
GO发展了具有三级结构的标准语言(ontologies),根据基因产物的相关分子功能,生物学途径,细胞学组件而给予定义,无物种相关性。三种本体论的内容:
分子功能本体论:基因产物个体的功能,如与碳水化合物结合或ATP水解酶活性等;
生物学途径本体论:分子功能的有序组合,达成更广的生物功能,如有丝分裂或嘌呤代谢等;
细胞组件本体论:亚细胞结构、位置和大分子复合物,如核仁、端粒和识别起始的复合物等;
GO工作,基本来说,可分为三个不同的部分:第一,给予和维持定义;第二,将位于不同数据库中的本体论语言、基因和基因产物进行联系,形成网络;第三,发展相关工具,使本体论的标准语言的产生和维持更为便捷。
术语形式
GO 定义的术语有着直接非循环式(directed acyclic graphs (DAGs)的特点,而并非是传统的等级制定义方式(随着代数增加,下一级比上一级更为具体)。举个例子来说,生物学途径中有一个定义是己糖合成,它的上 一级为己糖代谢和单糖合成。当某个基因被注解为“己糖合成活性”后,它自动地获得了己糖代谢和单糖合成地注解。因为在GO中,每个术语必须遵循“真途径 “法则,即如果下一代的术语可以用于描述此基因产物,其上一代术语也可以适用。
数据格式
GO的所有数据都是免费获得的。GO数据有三种格式:flat(每日更新)、XML(每月更新)和MySQL(每月更新)。 这些数据格式都可以在GO ftp的站点上下载。XML 和 MySQL 文件是被储存于独立的GO数据库中。如果需要找到与某一个GO术语相关的基因或基因产物,可以找到一个相应表格,搜寻到这种注解的编号,并且可以链接到与之对应的位于不同数据库的基因相关文件。
注释
GO中的术语如何和相对应的基因产物相联系的呢?这是由参与合作的数据库来完成的,它们使用GO的定义方法,对它们所包含的基因产物进行注解,并且 提供支持这种注解的参考和证据。每个基因或基因产物都会有一个列表,列出与之相关的GO术语。每个数据库都会给出这些基因产物和GO术语的联系数据库,并 且也可以在GO的ftp站点上和WEB方式查询到。并且,GO联合会提供了简化的本体论术语(GO slim),这样,可以在更高级的层面上研究基因组的功能。比如,粗略地估计哪一部分的基因组与信号传导、代谢合成或复制有关。
一个基因产物可以被一种本体论定义的多种分支或多种水平注释。注释需要反映在正常情况下此基因产物的功能,生物途径,定位等,而并不包括其在突变或病理状 态下的情况。GO联合会的各个数据库成员采用手动或自动的方式生成注释,这两种方式共有的原理是:一.所有的注释都需要有来源,可以是文字、另一个数据库 或是计算机分析结果;二.注释必须提供支持这种基因产物和GO术语之间联系的证据。【福利】GO注释-北大公开课视频:https://v.qq.com/txp/iframe/player.html?vid=v1328hachfi&width=500&height=375&auto=0
GO分析相关工具汇总
1.GO委员会工具:AmiGO;OBO-Edit;
2.非GO委员会工具:CGAP GO Browser;COBrA;Comparative Toxicogenomics Database;DynGO;EP GO Browser;Gene Class Expression;GeneInfoViz;GeneOntology at RZPD;GenNav;GOblet;GoFish;GONUTS;MGI GO Browser;Ontology Lookup Service;PANDORA;QuickGO at EBI;TAIR Keyword Browser;Tk-GO;
3.注释工具:grofiler;GeneTools;GOanna;GoAnnotator;GOCat;GoFigure;GoPubMed;GOtcha;HT-GO-FAT;InGOt;InterProScan;JAFA;Manatee;PubSearch;
4.用于基因表达/芯片分析的工具:Avadis;BiNGO;CLENCH;DAVID;EASE;eGOnv2.0;ermineJ;FatiGO;FIVA;FuncAssociate;FuncExpression;FunCluster;FunNet;GSESAME;GARBAN;GENECODIS;GeneMerge;GFINDer;GOALIE;GOArray;GOdist ;GOHyperGAll;GoMiner and MatchMiner;GOstat;GoSurfer ;GO Term Finder;GOTM;GOToolBox;L2L;Machaon Clustering and Validation Environment;MAPPFinder;Onto-Compare;Onto-Design;Onto-Express;Onto-Miner;Onto-Translate;OntoGate;Ontologizer;Ontology Traverser;ProbeExplorer;ProfCom;SeqExpress;SerbGO;SOURCE;Spotfire Gene Ontology Advantage Application;STEM;T-Profiler;THEA;
5.其它工具:APID;Blast2GO;Db for Dummies;Flash GViewer;FunSpec;FuSSiMeG;Generic GO Term Mapper;Genes2Diseases;GO Slim Mapper;GO Terms Classification Counter;GOBU;GOChase;GOProfiler;GORetriever;GOSlimViewer;ProteInOn;TXTGate;Wandora;WEGO;Whatizit。
【详细内容,后台回复GO,即可获得链接】
生信菜鸟团博客相关资源
我们的博客(http://www.bio-info-trainee.com/),有很多GO相关的学习资料,这里简单举几例。如果你还想搜索其他的,请去我们博客的搜索栏检索。
1.下载最新版GO,并且解析好
http://www.bio-info-trainee.com/1211.html
2.用R画GO注释二级分类统计图
http://www.bio-info-trainee.com/771.html
3.转录组-GO和KEGG富集的R包clusterProfiler
http://www.bio-info-trainee.com/370.html
4.转录组-GO通路富集-WEGO网站使用
http://www.bio-info-trainee.com/359.html
参考资料
1.云之南博客:http://fhqdddddd.blog.163.com/blog/static/1869915420128289474633/
2.郑俊娟科学网博客:http://blog.sciencenet.cn/blog-1271266-803860.html
2.生信菜鸟团博客:http://www.bio-info-trainee.com/
点击阅读原文,可获得关于Gene Ontology的更多介绍,不过相关学习资源仅本文才有哦。还有更多文章,请移步公众号阅读
如果你生信基本技能已经入门,需要提高自己,请关注上面的生信技能树,看我们是如何完善生信技能,成为一个生信全栈工程师。
如果你是初学者,请关注下面的生信菜鸟团,了解生信基础名词,概念,扎实的打好基础,争取早日入门。