教你如何上传蛋白质组学原始数据
ProteomeXchange(简称PX),是应用较为广泛的蛋白质组学质谱数据存储平台(http://www.proteomexchange.org),其旗下包括了PRIDE Archive, MassIVE, PeptideAtlas, jPOST等质谱数据存储平台,接下来我们将一起体验如何一步步上传我们的质谱原始数据到PX上。
1. 通过官网
(https://www.ebi.ac.uk/pride/markdownpage/pridesubmissiontool)下载提交工具PX Submission tool,软件运行基于Java开发环境,请确保电脑已经安装Java
(java安装流程可参考:https://www.cnblogs.com/maoning/p/10701349.html),下载之后解压缩,双击其中px-submission-tool-2.4.13.jar打开工具。
具体上传操作步骤也可点击页面左下角“?”,参考PRIDE官方说明。
2. 首先要注册账号并登陆,没有账号点击Resgister New User或在PRIDE数据库官网(https://www.ebi.ac.uk/pride/archive/)进行注册,之后在该工具登陆。
3. 登陆成功后,首先需要选择上传模式,一般选择Partial Submission模式。
点击NEXT,弹出界面中选择“是”。
之后界面中会显示上传所需信息,这一步只是提醒要准备的数据,点击NEXT。
4. 之后需要填写蛋白组数据的基本信息,包括发表文章的标题、关键词、项目描述、样品准备方法、数据处理方法和质谱实验类型,可将文章的标题、关键词、摘要和材料与方法填入即可(注意字数限制)。
5.之后选择提交的文件类型,下列为蛋白组学所要上传的文件类型。上传search文件+原始数据raw文件。
6.点击Add Files添加本地文件。
7.加载进所有文件之后,系统需要校验,等待完成。
8.此处需要添加search文件和raw之间的关联,点击Relation后勾选添加(勾连search文件与所有的raw文件)。
9.之后填入一些必要的样品和仪器信息,比如物种、组织类型、所用质谱仪型号等。
(如果在下拉列表里没有,则选择最下方的Others,之后在TermName搜索,找到后选中,点击Use Selected Term,等待搜索完成。)
10.填写负责人的姓名、邮箱和单位地址。
之后是关于大项目信息,如果上传数据不属于某个大项目,则无需填写,跳过即可。
11.确认信息,要勾选最下方的license,点击提交,会自动弹出submission.px,为所填写的上传信息,保存以方便修改和追踪。
静等数据上传完成,完成后编号非最终的序列号,最终序列号需经过官网审核,然后邮件通知,需要耐心等待几天时间。
提交数据后后可能遇到的情况:
1. 修改原始数据集:如果您需要添加少量额外的“其他文件”(如 csv、纯文本文件、电子表格、脚本等),可以将这些添加到原始数据集,而无需重新提交整个数据集;如果您使用了 PX 提交工具并且需要添加额外的 RAW 文件和随附的 SEARCH 文件,则需要再次重新提交整个数据集。
2. 默认情况下,您的数据集将在您的稿件被接受后或在PX官网收到您的指示后公开。虽然PX官网也可能会收到一些期刊的接受通知,但最好也邮件提醒PX官网,否则,可能会发生PX官网现在不知道您的手稿已经出版的情况。对于作者来说,重要的是要考虑到一些期刊也可能同时制定了这种公开发布政策,并且在数据集公开之前,文章可能不被接受。
您可以通过三种不同的方式通知PX官网:
通过 PRIDE 档案网站 (http://www.ebi.ac.uk/pride/archive)。使用 http://www.ebi.ac.uk/pride/archive/login 上的用户帐户登录后,您可以单击位于未发布数据集旁边的绿色“发布”按钮。您可以在此处提供数据集的详细信息并提交 Web 表单。
如果您不是原始提交者,但发现该数据集已包含在出版物中,您可以直接访问 https://www.ebi.ac.uk/pride/archive/projects/PXDxxxxxx/publish,其中 ' xxxxxx' 是包含 PXD 数据集标识符的整数。联系pride-support@ebi.ac.uk。
项目公开后,项目页面将在 PRIDE 中发布,也可在 ProteomeCentral (http://proteomecentral.protomexchange.org) 上找到。
3. 数据集公开发布政策的例外情况
本政策的例外情况只能在记录在案的特殊情况下被授予,这将根据具体情况进行考虑。如果原始提交者已经或计划在其他正在进行的研究中使用相同的数据集(应该发布),他们可以申请一次延期未发布状态,此延期最长为 6 个月。数据所有者必须向 PRIDE 提出正式请求,并适当证明该请求的合理性。需要注意的是,这 6 个月的延期并未考虑文章发表所在科学期刊的要求,某些期刊可能会要求数据立即发布。
相关阅读
干货必备!Olink蛋白质组学六大知识点你知道吗?|Olink蛋白质组学
所见即所得,绘图高规格联川云平台,让科研更自由