查看原文
其他

【实用贴】原始数据上传SRA新版流程

流星飒沓 百迈客医学 2022-08-10


众所周知,做完高通量测序,发表文章前,大部分杂志都会要求上传NGS原始数据到SRA(要发paper了,不会提交原始数据肿么办?),或者转录调控方面的数据,如转录组原始数据和表达量结果上传到GEO,相关教程贴心的小编已经给各位分享过了,参见【实用帖】手把手教你如何上传GEO数据库

讲到这里,各位要疑惑了,既然都分享过了,又来絮叨啥啊。小编最近在上传数据到SRA,发现上传流程更新了,小编差点不知道怎么搞了,故而把经验分享一下。(莫担心,GEO的上传流程,小编不巧最近也上传了,依旧简单如前。小编这絮絮叨叨的毛病,也真是不好改啊。)

首先,虽然新版的上传流程有更改,但是前面的步骤,基本没有变,简单写写;

准备工作:注册NCBI账号,已有账号则跳过此步骤,网址

https://www.ncbi.nlm.nih.gov/account/?back_url=http%3A%2F%2Fwww.ncbi.nlm.nih.gov%2Fpubmed


1、创建BioProject


https://submit.ncbi.nlm.nih.gov/subs/bioproject/,在界面上选择 new submission 填写项目描述信息建立账号,依次填写SUBMITTER、PROJECT TYPE、TARGET、GENERAL INFO、BIOSAMPLE等信息,后面的BIOSAMPLE和PUBLICATIONS两个界面可以不写相关信息,都直接点Continue,进入OVERVIEW界面。如果有问题可返回修改,没问题的话即可点击submit提交。创建成功后,再次进入该网址,会出现BioProject编号,以PRJNA开头,可放在文章中注:所有界面中都是带星号的为必填项。


2、创建BioSample


https://submit.ncbi.nlm.nih.gov/subs/biosample/,在界面选择 new submission。大致提交过程如下截图所示,最终提交完成后,每个样本会有一个样本编号,以SAMN开头,用于后面提交原始数据时,填写biosample_accession,和对应原始数据相匹配。


向下滑动显示更多图片


3、原始数据提交SRA(Sequence Read Archive)



https://www.ncbi.nlm.nih.gov/Traces/sra_sub/sub.cgi,选择 NCBI PDA入口,填写个人信息后,点击 create new submission >> New submission。


向下滑动显示更多图片

重点来了:填完描述样本和数据对应关系以及文库信息的SRA_metadata_acc.txt后,点击continue,单个样本数据量超过10Gb以上或者数据太多,需要用其他方式上传,比如FTP,勾选PTP上传选项后,会在下方出现“Select preload folder”,我们点击后发现没有文件夹。这时我们点击FTP upload instructions,会出现如下提示:



Address: ftp-private.ncbi.nlm.nih.gov   

Username: subftp   Password: w4pYB9VQ

向下滑动显示更多图片


数据上传比较慢,等数据都上传完成后,点击“Select preload folder”,即可出现上传好的原始数据,点击“Use selected folder”,继续即可。(其实可以先将数据上传到NCBI中,即先完成上述preload,到这步可以直接选择文件夹,不用等数据上传时间)

向下滑动显示更多图片


后面全部提示Processed即上传完成。登陆https://submit.ncbi.nlm.nih.gov/subs/或SRA website,可查看数据提交结果。一般从ncbi-BioProject数据库查询该PRJNA号时,隔一至两天后可以看到原始数据已经链接至该PRJNA


延伸阅读

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存