Dr. Tom助力自有数据分析,轻松实现数据挖掘
很多熟悉Dr. Tom的用户都知道,在华大购买了RNA项目的分析服务后,分析结果会通过Dr. Tom多组学数据挖掘系统进行交付。Dr. Tom可帮助用户进行数据的可视化及无限深度的数据挖掘,加快从数据到文章的速度,从推出以来受到了用户的广泛好评。
那如果没有在华大进行测序,
还能够使用Dr. Tom进行数据分析吗?
答案是:可以!
Dr. Tom系统支持用户上传自有数据进行可视化,不需要通过专业的生信分析人员即可自行操作。目前,系统支持用户上传基因/转录本的表达量及相关属性进行RNA数据分析。
接下来,由科技君带大家一起探究如何上传表达量数据进行转录组数据分析:
01
登录系统后,首先需要创建一个新项目并确认物种信息
需要注意的是,在选择项目对应的物种参考版本时要谨慎选择。项目一旦创建,物种的参考版本就不能更改了。
02
进入项目后,点击“上传”
选择相应要上传的内容
一般我们在基因层面进行转录组数据的分析,当然,如果想进行转录本层面的分析,上传转录本的定量信息即可。
在准备文件时,文件格式、样本命名规则等有相关要求,这里列举一些要点:
1. 文件格式为“文本文件(制表符分隔)(*.txt)”
2. 单次上传文件需小于20M
3. 样本命名规则:支持英文字母、数字与下划线,不支持空格与其它特殊字符
详细的要求请用户务必提前查看系统上的文件说明。
如果表达量文件以Gene ID作为基因标识,则对应选择“NCBI Gene ID”或“Ensembl Gene ID”(依实际情况而定)。如果以Gene Symbol作为基因标识,则对应选择“Gene Symbol”。
系统支持上传Read count,FPKM, RPKM三种表达量,以及其他属性,例如基因/转录本在其他数据库中对应的注释等。
这里需要注意的是,如果仅需要使用表达量作图,例如表达量热图、表达量箱线图等,可以选择上传Read count、FPKM、RPKM。但如果要进行差异基因分析,则只有上传了Read count的情况下,系统才支持进行差异分析。
上传文件后,可以在页面上方的“历史记录”中查看文件是否上传成功。如果不需要进行差异分析,可以关闭上传页面,在项目里直接使用工具进行绘图。
03
如需进行差异分析,上传read count成功后,在系统中填写差异分析方案
填写完方案并提交后,系统会自动关闭该页面,自动运行差异分析及注释流程。分析完毕后,系统会通过站内信及邮件的方式进行提醒,用户进入项目后即可查看分析结果。
常见的报错及解决方案
(1)
报错信息:
本文件中含有与已上传文件重复的表头
报错原因:
样本名重复
解决方案:
检查上传的文件中样本命名。样本名称与项目中已有的样本名称不能重复
(2)
报错信息:
出现无效行
报错原因:
1. 文件中的Gene ID/Transcript ID/Gene symbol不存在于Dr. Tom数据库中。
2. 若上传的是表达量文件,文件中可能存在空值/NA/非数值型数据。
解决方案:
1. 核对参考基因组的选择是否有误;
检查ID/symbol是否存在于Dr. Tom系统中(进入项目主页查看Dr. Tom数据库中的ID和symbol)。
2. 若上传的是表达量文件,确保文件中不存在空值/NA/非数值型数据。
若购买了RNA项目分析服务并在Dr. Tom交付,用户会额外获得3个项目的创建权限用于上传自有数据进行分析(一年有效)。如需获取Dr. Tom系统上传数据及数据分析权限,可联系当地销售咨询。
零基础做生信,轻松get数据挖掘
Dr. Tom系统将高通量测序数据挖掘推向一个全新的高度。基于强大的背源数据库及“图表交互”的设计逻辑,Dr. Tom帮助您快速实现数据可视化及数据挖掘。不再局限于BGI数据,让Dr. Tom系统成为您数据挖掘的首选,开启您的数据探索之旅吧!感兴趣的老师可以在https://biosys.bgi.com注册账号,使用系统中的Demo数据玩转Dr. Tom!
明年Dr. Tom又会带来什么新功能呢?让我们拭目以待!
最近微信改版了
大家记得把华大科技“星标”⭐哦
从此科研资讯不迷路~
撰稿:鱼
编辑:市场部
近期热文
点击“阅读原文”直达Dr. Tom网页