查看原文
其他

干货|手把手教你代谢组学原始数据如何上传!

运营部-CST 联川生物 2024-03-27


MetaboLights 是欧洲生物信息研究所(EMBL-EBI)旗下的代谢组学实验和衍生信息的数据库。MetaboLights 目前是主流代谢组学期刊推荐的代谢组学数据存储和分享数据库,该数据库内容丰度,涵盖代谢物结构及其参考光谱以及它们的生物学作用、位置和浓度,以及代谢实验的实验数据等。如果没有实际做过代谢组项目,也可根据研究方向从MetaboLights数据库下载相关代谢组原始数据进行研究和代谢组论文发表。接下来我们将一起体验如何一步步上传我们的代谢组学原始数据到MetaboLights数据库上。

根据经验,MetaboLights 上传数据流程较复杂,过程比较耗时,建议使用谷歌浏览器,以及找网速相对较好的位置。在传输过程中,这个网站同步数据相对迟缓,可能某些步骤卡顿,建议耐心等待。

MetaboLights 官网网址:https://www.ebi.ac.uk/metabolights/

(复制链接至浏览器打开或点击阅读原文)

本文会详解数据上传流程和方法,关于具体的数据上传步骤也可参考官方英文视频介绍:

https://www.ebi.ac.uk/metabolights/help

1.注册账号和创建study1)注册账号


  • 点击Login进行注册


  • 点击Create an account创建账户


  • 输入邮箱、名、姓、密码、国家、单位等,勾选同意条款,最后点击Creat。


几分钟后,邮箱会收到一封MwtaboLights的邮件,点击激活,输入账号密码登录。

2)建立Study


点击Create New Study及以下操作来创建Study(值得注意的是,一个代谢组项目创建一个Study,如文章中涉及多个代谢组项目数据,一定要创建多个Study来上传)。之后MetaboLights会分配study id,该id唯一,作为数据上传的标识写入文章。




如图是韩群花等人发表则在Aging Cell杂志中上传的代谢组学数据叙述,该文章涉及到两个代谢组项目。


 

2.项目叙述

进入创建的study,Upload files为数据上传页面,可先跳过,第3部分会详细叙述。





1)首先是项目的叙述。


需要填写项目发表文章的关键词、标题、摘要、文章状态等。

 

2)之后是项目的详细描述,该部分为第2部的重点。


点击Add technique来创建。需要根据项目实际情况来选择,联川生物目前LC-MS代谢组项目统一采用如下选择,有pos和neg两种检测模式(GC-MS项目较少见,一般只采用pos检测模式,需要根据实际项目来选择),创建两个ASSAY type。



点击Add/edit details来进行之后填写。

 


在Protocols页面样本采集、代谢物提取、色谱分析、质谱分析、下机数据质控和处理、代谢物鉴定等步骤的叙述,具体可参考公司给的实验和分析方法部分。


 

之后根据填写经验,无需在网页上填写此五个页面,直接在Sample Details、Assay details、Metabolite annotation页面下载(一个项目共五个表格,pos和neg检测模式各一张Assay details、Metabolite annotation表格,两种模式共用一个sample表格)对应表格来填写即可。

 


 


3)关于各表格具体填写:


  • Sample表格:

    一般需填写如下标黄列:

(点击图片放大查看)

  • 各列信息:

    Source Name:样本的原始数据名称(不区分pos、neg。如treat1样本原始数据为pos_1.raw和neg_1.raw,则填写1.raw)

    Characteristics[Organism]:样本物种来源

    Characteristics[Organism part]:样本的物种组织来源

    Characteristics[Sample type]:样本具体类型(QC样本:pooled sample;实验样本根据实际情况填写)

    Protocol REF:一般填写Sample collection

    Sample Name:样本名称(不区分pos、neg。如文章中命名为treat1样本,则填写treat1即可)

  • Assay 表格:

    需填写如下标黄列: 

(点击图片放大查看)

  • 各列信息:

    Sample Name:样本名称(不区分pos、neg。如文章中命名为treat1样本,则填写treat1即可)

    Protocol REF:协议参考,一般填写Extraction

    Parameter Value[Post Extraction]:参数值[提取后]:样本具体制备(联川生物一般QC样本:QC samples were  prepared by combining 10 μL of each extraction mixture;实验样本:The samples were extracted from 20 μL of sample using 120 μL of precooled 50% methanol buffer)

    Protocol REF:色谱协议参考:一般填写Chromatography

    Parameter Value[Chromatography Instrument]:色谱仪器型号

    Parameter Value[Column type]:色谱原理类型,一般使用reverse phase

    Protocol REF:质谱协议参考,一般填写Mass spectrometry

    Parameter Value[Scan polarity]:质谱检测模式,正负模式分别填写postive、negative

    Parameter Value[Scan m/z range]:参数值[质谱扫描m/z范围],根据具体实验方法填写,一般为from 60 to 1200

    Parameter Value[Instrument]:质谱仪器型号

    MS Assay Name:原始数据名称(区分pos、neg。如treat1样本原始数据为pos_1.raw和neg_1.raw,则两张Assay 表格分别填写pos_1.raw和neg_1.raw)

    Raw Spectral Data File:原始数据类型,如Thermo的QE质谱仪为raw格式、AB Sciex 的TripleTOF系列质谱仪为wiff.scan格式

    Protocol REF:数据协议参考,一般填写Data transformation

    Derived Spectral Data File:派生的光谱数据文件,QE质谱仪只有raw文件,无派生的光谱数据文件,不填写;TripleTOF系列质谱仪有派生的光谱数据文件,为wiff格式。

    Protocol REF:代谢物鉴定数据协议参考,一般填写Metabolite identification

    Metabolite Assignment File:代谢物分配文件,下载表格下拉复制即可。需要注意项目名称,如id为MTBLS2849,negative模式填写:m_MTBLS2849_LC-MS_negative_reverse-phase_metabolite_profiling_v2_maf.tsv

  • Metabolite 表格:

    需填写如下标黄列:

    (点击图片放大查看)

  • 各列信息:

database_identifier:代谢物对应的数据库注释ID,如Acetaldehyde对应HMDB id为HMDB0000990

chemical_formula:代谢物化学式,如Acetaldehyde为C2H4O

metabolite_identification:代谢物名称,如填写Acetaldehyde

mass_to_charge:代谢物的对应代谢离子质荷比,如某项目中Acetaldehyde为89.02383389

retention_time:代谢物的对应代谢离子的色谱保留时间,如某项目中Acetaldehyde为1.362933333

另外需要在最后添加上鉴定到代谢物在各样本中丰度值,可根据实际样本数据来增加列数,如下图


3.上传代谢组数据

Metabolights官网给了两种代谢组数据上传的方法。其中Aspera上传,可细分为两种方式进行,一种是通过piugin插件,可以通过网页来传输,点击Install plugin,按照提示一步步操作即可,但中间在安装扩展和Connect可能无法访问国外服务器,失败可能性较大。另一种是通过指令传输,点击Aspera Command line client可以看到每步具体指令,此种方式传输稳定,且速度较快,但需要一定的linux基础,有一定难度。




 

重点推荐大家通过FTP方式来传输。


1)首先是传输软件。

建议大家网上下载免费开源的FTP软件FileZilla。FileZilla为专业的数据传输软件,界面操作简单,已被汉化,开源免费,不仅可以传输代谢组数据至Metabolights数据库,还可上传RNA-seq数据至GEO数据库等。

2)之后点击Private FTP Upload可查看该项目登录FTP的服务器、账号、密码、以及上传路径等



3)登录FileZilla。

填写主机、账号、密码后点击快速连接即可登录。


4)登录对应远程站点

FileZilla界面如下以及操作如下:

将Remote folder路径粘贴至远程站点,即可链接上Metabolights数据库。再将需要上传的代谢组原始数据以及填写后的Sample表格、Assay 表格、Metabolite 表格等全部内容拖至此路径下即可传输。

5)检测传输有无错误

  • 检查数据传输情况。

    FileZilla界面最下方显示具体传输情况,检查是否有因网络问题没有传输成功的文件。


  • 检测具体填写错误

    数据全部传输完成,以及文章标题、作者、项目的实验方法、分析方法等全部填写完毕后,点击Study overview后进入检查页面,点击页面各项可检测已填写的各项内容。


如果检测页面有Validation:Failed显示,说明数据传输或填写中有错误。点击Study validation,选择Errors查看具体错误,返回修改并重新上传。需要注意的是,Metabolights网站刷新可能较慢,新的传输可能一段时间后才能同步上去,需要多刷新几次。


 

根据经验,可选中要删除的错误文件,进行强制删除。

并将正确的文件选中后进行强制同步。

最后,无Validation:Failed显示,说明传输无错误。点击Release Date可以根据需求修改公开数据的日期。

 

相关阅读


用户文章|IF=9.7,代谢组学揭示TFE3融合介导的NMRK2上调是Xp11.2 易位肾细胞癌能量代谢适应的关键

用户文章∣IF=8,代谢组学+微生物揭示挥发性DMNT保护植物抗小菜蛾侵害的作用机制-代谢组学专题

用户文章∣代谢组+微生物揭示中国地方性骨关节炎大骨节病患者肠道菌群和代谢物的变化-代谢组学专题

用户文章∣微生物组+代谢组联合分析揭示了直肠癌中共生细菌和代谢物之间的相互作用—代谢组学专题


点击下方图片进入云平台资料汇总:


所见即所得,绘图高规格联川云平台,让科研更自由


继续滑动看下一个
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存