干货|教你如何轻松查找代谢物的详细信息
在鉴定代谢物后,经常会遇到很多代谢物的没有见过,不了解它们的理化性质,是否与我的研究方向相关等问题,此外一个代谢物可能有很多名字,可能展示的名字并不认识,这对于数据分析和筛选造成很大困扰。虽然代谢物分类注释信息可以帮助了解代谢物,但对于代谢物详细的化学性质、分子结构、功能作用等不可能一一列举,在实际分析中常常需要我们自己去查询代谢物的具体信息。
关于代谢物信息的查询,大致可分为两种方式,通过代谢物相关网站查询、搜索文献查询,或者简单的物质可以直接百度查询。
一、通过代谢物相关网站查询
上次,我们介绍的METLIN、MassBank、mzCloud、HMDB、MetaCyc、Lipidmaps、MS-Dial以及NIST、Fiehn、GMD等代谢物鉴定数据库实际上也包含代谢物的一些信息。但由于数据库收录代谢物信息的侧重点不同,通常我们需要了解代谢物的名称、CAS号、物理化学性质、相关功能,以及与其他代谢物或者基因、酶间可能的相互作用等,并不需要了解代谢物的谱图信息、仪器参数等用于代谢物分析的信息,所以常用一些综合性的代谢物数据库来查询,如:Pubchem、ChemSpider、CHEBI、HMDB、KEGG、Lipidmaps等数据库。
Pubchem由美国国家健康研究院(US National Institutes of Health,NIH)创建,主要收录有机小分子物质,包括化合物的化学结构标识符、化学和物理性质、生物活性、专利、毒性数据等许多信息。
搜索Pubchem网址(https://pubchem.ncbi.nlm.nih.gov/)进入官网,输入ATP进行检索
Pubchem数据库(https://pubchem.ncbi.nlm.nih.gov/)
选择最佳匹配物质
ChemSpider是一个免费的化学结构数据库,提供对来自数百个数据源的超过1亿个代谢物结构的快速文本和结构搜索访问,是代谢物查询非常常用的数据库,访问可能卡顿。同样在ChemSpider网址搜素ATP得到相关信息如下图。
ChemSpider数据库(http://www.chemspider.com/)
CHEBI是是一个收录生物医学相关化学条目的数据库,属于EBI(欧洲生物信息研究所(European Bioinformatics Institute))旗下代谢物数据库。
CHEBI数据库(https://www.ebi.ac.uk/chebi/)
关于HMDB、KEGG、lipidmaps数据库上一章节已进行介绍,作为代谢组常用的三大数据库,常用来进行代谢物注释,根据注释信息中代谢物在各数据库的id号,或者直接使用代谢物名字,在三个数据库官网查询代谢物的详细信息。
如搜索进入KEEG官网,输入ATP进行检索
KEGG数据库(https://www.kegg.jp/)
之后点击id号C00002可查看ATP各种信息以及可发生的反映和信号通路等信息,如需进一步探究与其他代谢物、基因的调控关系,可点击Reaction、Pathway查看,
如点击R00002,可查看此步分析参与的代谢物、产物、酶等信息,点击即可查看各物质的详细信息
如点击map00190 可查看此条pathway的通路图,标红的即是ATP在通路中位置。在图上点击参与该通路的蛋白、代谢物上即可了解其详细信息。同时可点击Help了解pathway的各种图形含义。
在HMDB数据库中输入ATP检索,可得到包括ATP的命名、结构、解释、功能、应用等相关信息。
HMDB数据库(https://hmdb.ca/)
Lipidmaps是脂类物质最大最权威的综合性数据库,对于脂类物质的信息查询很有帮助。如甘油三酯(triacylglycerol,TAG)检索
在概述部分,展示了TG的通用名称、系统名称、同义词等该物质的多个名称及id号,TG的结构图,并可保存成图片格式或CSV等文本格式。在Main部分,展示了TAG在脂质八大类中类别、以及Main Class、Sub Class这三级分类。在References展示了TAG在其他数据库中的ID,并可点击ID直接跳转对应数据库中。
值得一提的是,Lipidmaps更新至最新版本后,增加了Reactions模块,可以提供代谢物间的反应情况,对脂质物质间分子机制研究很有帮助。
最后是提供TAG的信息更新日期,以及TAG所在脂质八大类GL的介绍。
Lipidmaps数据库(https://www.lipidmaps.org/)
对于一些上述数据库没有收录的代谢物,还有很多的其他专注某领域的代谢物数据库可用于查询信息,如:
植物代谢物数据库:KNApSaCK、Tea Metabolome Database (TMDB);
药物代谢物数据库:DrugBank、BindingBD、Novel Antibiotics Database、ChemIDplus、Herbal Ingredient Targets;
中药代谢物数据库:Chinese Ethnic Minority Traditional Drug Database (CEMTDD)、Chinese Traditional Medicinal Herbs Database (CHDD);
毒物代谢物数据库:Exposome-explorer、T3DB、Animal Toxin Database (ATDB);
食物代谢物数据库:FooDB、BitterDB、Phenol-Explorer、PhytoHub等。
值得注意的是,同一个代谢物很可能有不同的命名,但在数据库中一种代谢物通常只有一个ID号,所以用ID号来检索代谢物较为准确。
二、文献查询代谢物信息
此外,可以通过查阅文献来了解所关注代谢物的最新研究进展,如在Pubmed(https://pubmed.ncbi.nlm.nih.gov/)中输入ATP、Metabolome关键词来检索相关文献,可再进一步在ARTICLE TYPE中选中综述类或研究性论文。
Pubmed(https://pubmed.ncbi.nlm.nih.gov/)
三、不同数据库间代谢物的ID转换
在代谢物查询时经常会遇见不同数据库间ID转换问题,一般在KEGG、HMDB、Lipidmaps网站中会显示该代谢物在其他收录该代谢物的数据库ID。如:以ATP举例,在HMDB中显示ATP在不同数据库有很多命名,在KEGG中显示了ATP在其他数据库的ID号,数据库间可互通。
ATP在HMDB中的名称
ATP在KEGG中的其他数据库ID
由于网站间同步可能有延迟,这种查询可能不完全准确。此时可以使用工具进行代谢物在不同数据库间ID转换,常用的有metaboanalyst5.0、fiehnlab网站。
如metaboanalyst5.0(https://www.metaboanalyst)操作如下:
提交之后可查看该代谢物在KEGG、HMDB、PubChem中ID并可点击here下载。此外,对于未匹配上的代谢物,可点击View查看可能的代谢物,选择后提交。
关于使用fiehnlab(http://cts.fiehnlab.ucdavis.edu/batch)进行代谢物ID转换,操作如下:
可进入网址,在左侧框输入代谢物名称或者某数据库中ID号或者上传要转化的文件
右侧可调整输入文件中代谢物名称类型、需要输出的数据库ID。
所见即所得,绘图高规格联川云平台,让科研更自由