转录组分析原来如此简单
对于刚接触高通量测序的老师来说,海量的测序数据和难于上青天的分析结果让每一个初次接触它的老师们都望而生畏。同样的测序数据经由生信大神的手在那里妙笔生花,开出一朵朵美丽而迷人的SCI论文。同为科研人的你,甚至自己想要的结果文件都不知道在哪里找。
作为一个科技服务工作者,小编自然能够明白每一位老师的痛处和难点。今天开始,小编将开始为期6期的基于百迈客云的转录组数据分析和挖掘讲解,从原始的测序数据上传百迈客云分析平台到数据挖掘分析直至最后完美的SCI论文图表,小编将为您娓娓道来。
所谓的原始数据,就是我们建库测序后下机后经过初步数据过滤后的数据,也就是我们的clean date数据。这部分数据一般来自于两种渠道,第一是老师做的建库测序后拿到的数据,这部分数据以硬盘或者保存在我们云平台老师的账号下;另外是来自于已发表的转录组文章中的原始数据,关于这部分数据,老师可以在NCBI上根据文章的链接查找下载,当然还有一种更方便的方式就是直接在百迈客云平台文献栏搜索该文章,然后直接将数据保存在自己的账号下。接下来小编就为你演示如何在百迈客云上下载已发表文章的原始数据。
打开文献后,文章的最后会附件有测序数据,老师可以选择性的保存自己需要的样本数据。保存后数据便自动保存在云文件夹中。
接下来原始的数据有了,那该上传云平台分析工具里呢,看下一步操作。
根据基因组的有无和数据的类型,选择合适的分析APP。如有参考基因组,数据类型是二代转录组数据,就可以选择真核有参转录组APP。
打开APP后,在项目名称栏填写项目名称,然后点击选择文件夹,打开数据所在文件夹上传原始clean date数据。
上传后的数据长这样式的
数据上传后点击第二步综合选项,在这里流程版本选择默认版本即可。文库类型一般普通转录组数据选择第一个非链特异性建库方式。注意,有的老师在建库的时候,做的是链特异性文库,区分了转录本来自于正义链或者反义链,这情况下就选择后面的选项。如果数据是下载文章中的,需要在文章材料方法处确认下建库类型。不过,我们现在常见的转录组测序都是非链特异性文库。
针对于有参转录组来说,第三步就是参考基因组的选择了。老师可以在参考物种栏输入对应的物种名称和拉丁名称,就可以选择对应的物种的基因组。这里需要注意一点,有的物种有多个组装版本的基因组,在这里小编给老师们一个选择标准建议,第一选择组装参考基因组的品种与自己研究的品种是同一个种或者品种的基因组,总之亲缘关系近的物种。在此基础上,选择组装水平最好的基因组作为本研究的参考基因组。无参物种则没有基因组选择这一步。
针对于无参物种来说,第三步是基因功能注释这里,组装方式上有合并组装和分组组装两种选择,如果老师的样本属于同一个种或者同一亚种情况下,选择合并组装。如果老师的样本是不同种或者亚种就可以选择分组组装。关于注释物种这一块,老师可以根据自己研究的物种大类来选择注释物种类别。
第四部就是差异基因的表达,在这一步骤参数相对比较多。首先是FDR值的选择,通常FDR值有0.1、0.05、0.01、0.005、0.001这几个值,一般老师在初次运行APP的时候可以选择0.01或者0.05这两个数值。后期根据差异基因的数目,如果差异基因数目太多,这时候就可以将阈值设严苛,降低假阳性。如果差异基因数目太少可以放宽阈值。接下来是差异倍数,一般初次运行选择2即可,后期根据差异基因数目可以调整。常见的差异倍数为2或者4,在人或者哺乳动物里,差异倍数可以放宽至1.5。最后就可以添加实验组和对照组
添加完差异分组后,点击提交即可对数据开始分析运行。等待结果了。根据样本数据量,一般24-48h左右大家就可以看到一份完整的分析结题报告和分析数据了。
到这里呢转录组数据的标准分析已经分析完成,但是对于很多初次接触转录组测序的老师来说,后面的数据挖掘才是真正的迷茫。下期小编为各位老师解读基于百迈客云针对项目所有基因挖掘分析。
最后小编给各位老师再次安利一下我们百迈客云平台。转录组分析其实只是我们百迈客云平台的冰山一角。小编给各位老师整体展示一下百迈客云平台的强大功能。
具体注册流程如下:
登录百迈客云科技官网(http://www.biocloud.net/)——进入注册用户界面——填写注册信息——注册成功——分析——农学/小工具。
选百迈客做科技服务,
送百迈客分子实验试剂盒活动火热进行中,
欢迎您参加!
文:张倩丽
排版:市场部
往期回顾