查看原文
其他

干货|常用的代谢数据库不知道有哪些?赶紧码住这篇文章

运营部-CST 联川生物 2024-03-27


关于代谢物的鉴定,原始数据经软件解析后得到代谢离子以及二级碎片离子的谱图信息,如:离子的质荷比(m/z)、保留时间(Retention time)及在信号强度值(intensity)等,通过与数据库中一二级代谢物的谱图信息进行匹配,来确定检测到哪些代谢物。LC-MS常用的代谢物谱图库有METLINMassBankmzCloudHMDBKEGGMetaCycLipidmapsMS-Dial等;GC-MS常用的数据库有NISTFiehnGMD等。01METLIN数据库

METLIN数据库由美国斯克里普斯研究院(Scripps Research Institute)开发的,包含超过96万种化合物,是目前最大的二级质谱数据库,在代谢组学研究使用非常广泛,目前访问该数据库需要付费。



METLIN(https://metlin.scripps.edu/)

02mzCloud数据库

mzCloud数据库由Thermo 公司基于标品使用QE系列质谱仪,构建包含一、二级高分辨率、精确质量谱图的在线数据库,该数据库包含 19000+种化合物,其中内源性物质 3700+,且在实时更新中。

 


mzCloud(https://www.mzcloud.org/)

03MassBank数据库

MassBank数据库主要包含从代谢物的化学标准品得到的质谱图,包括该标品所使用的质谱仪型号和设置参数等,MassBank为开源数据库,使用较为广泛。


MassBank(http://www.massbank.jp/)

04HMDB数据库

人类代谢组数据库(Human Metabolome Database,HMDB)是加拿大代谢组学创新中心(TMIC)创立的人体代谢组学综合数据库,是最常用的代谢组数据库之一。HMDB数据库开源,可免费访问下载,目前已更新至4.0版本,收录内容包括物质的化学信息、临床数据分子生物学数据等超过11万种代谢物的信息。诸如:DrugBank(常用药物数据库,包含约2280种药物代谢物信息)、T3DB(专门的毒物数据库,包含约3670种常见毒素和环境污染物代谢物信息)、SMPDB(常用的小分子代谢通路数据库,包含3万多个人类代谢物和疾病通路信息,通路图片很精美)和FooDB(专门的食品研究数据库,包含约28000种食品成分和食品添加剂代谢物信息)HFMDB(专门的粪便代谢物数据库,包含有关人类粪便中发现的许多小分子代谢物和许多浓度值的详细信息)等数据库都属HMDB旗下。

 


HMDB(https://hmdb.ca/)

 

DrugBank(https://go.drugbank.com/)


T3DB(http://www.t3db.ca/)

 


SMPDB(https://smpdb.ca/)

 


FooDB(https://foodb.ca/)

 


HFMDB(https://fecalmetabolome.ca/)

05KEGG数据库

KEGG数据库(Kyoto Encyclopedia of Genes and Genomes)全称是京都基因和基因组百科全书,是目前应用最为广泛的通路数据库,收录了所有物种大量的代谢物、反应、酶和基因信息,KEGG数据库包含旨在了解生物系统(如细胞,组织等)中基因、代谢及代谢物的功能及相互作用关系。

 


KEGG(https://www.kegg.jp/)

06MetaCyc数据库

与KEGG数据库相同,MetaCyc也是一款通路数据库,其中包含来自所有生命领域的实验阐明的代谢途径,MetaCyc 包含参与初级和次级代谢的途径,以及相关的代谢物、反应、酶和基因,在植物代谢组学中使用较为普遍。MetaCyc 目前包含 2937 条途径、17,780 种反应和 18,124 种代谢物,且在实时更新中。

 


MetaCyc(https://metacyc.org/)

07Lipidmaps数据库

Lipidmaps数据库由美国国立卫生研究院(NIH) 创立的脂质数据库,是目前最大最权威的脂质数据库,收录超过4万种脂质的结构、谱图和分类信息。Lipidmaps根据脂质的结构和功能,将脂质分为8大类,该分类标准被广泛沿用。Lipidmaps数据库开源,可免费访问下载。

 


Lipidmaps(https://www.lipidmaps.org/)

08Lipidblast数据库

Lipidblast数据库由Fiehn实验室整理的一款开源数据库,该数据库包含了约10万种代谢物的20多万张MS2质谱图,LipidBlast还包含了许多没有被LMSD数据库收录的细菌和植物脂质信息。可作为Lipidmaps分析的补充,Lipidmaps和Lipidblast是目前最常用的脂质组鉴定数据库。

 


Lipidblast(https://fiehnlab.ucdavis.edu/projects/LipidBlast)

09NIST化学数据库

NIST化学数据库由美国国家科学技术研究院 (NIST)等建立,NIST共包含超过16万中代谢物的20多万张EI质谱图,最新版的NIST数据库中也包含了小分子化合物的ESI MS/MS质谱图,是GC-MS分析最常用的数据库。

 


NIST(https://www.nist.gov/mml/odi)

10The Fiehn library

The Fiehn library中含有超过1000种代谢物的2200多个EI质谱图,包含四极杆和TOF两种质量分析器的检测信息,Fiehn数据库目前常用于GC-MS分析。

 


Fiehn数据库(https://fiehnlab.ucdavis.edu/projects/softwaredev)

11GMD数据库

GMD数据库是款植物代谢组数据库,主要用于非靶向GC-MS分析,该数据库包含大量植物代谢产物的GC-MS谱图。


GMD( http://gmd.mpimpgolm.mpg.de/ )

值得一提的是,由于鉴定到的代谢物数目太多,种类繁杂,十分不利于数据查找和分析,在代谢物鉴定时,一般会对鉴定到的代谢物进行注释,以了解代谢物的功能、分类和统计情况等。常用的代谢物注释数据库有HMDB(https://hmdb.ca/)、KEGG(https://www.kegg.jp/)、Lipidmaps(https://www.lipidmaps.org/)等综合性数据库,一般分析软件和网站会在代谢物鉴定时附带上部分注释信息,但可能比较简略,可用R、Pathon、Perl等相关包或程序来添加。



 鉴定到代谢物在HMDB数据库中super class分类统计


鉴定到代谢物在KEGG数据库中class以及sub class分类统计


鉴定到代谢物在lipidmaps数据库中class及sub class分类统计




相关阅读
用户文章The Plant Journal | 代谢组和蛋白组揭示紫杉醇在红豆杉中的组织特异性及调控机制
靶向代谢:儿茶酚胺及其代谢物检测--临床诊断中的重要指标
靶向代谢:那些你错过的苯丙氨酸途径代谢物!
干货|手把手教你代谢组学原始数据如何上传!


点击下方图片进入云平台资料汇总:

所见即所得,绘图高规格联川云平台,让科研更自由


继续滑动看下一个
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存