查看原文
其他

转录组分析原来如此简单--所有基因数据挖掘

tips


     上期小编给各位老师介绍从测序或者已发表的原始clean data数据到一份完整的分析数据如何在百迈客云平台上运行出来。但是拿到一份完整的分析数据才是考验各位老师的开始,海量的分析数据里如何挖掘自己感兴趣的基因,如何找到调控表型相关的数据呢?别着急,本期小编就带各位老师如何在所有测序数据里挖掘出关键的调控候选基因。另外:本期讲的所有基因挖掘分析还有对应的视频教程,可供老师们更加方便直观的观看了解,具体视频接如下:http://live.biocloud.net/course/179 当然,老师们也可以搜索百迈客云平台,注册账号后点击课堂,在全部课程里查找百迈客云分析与个性化实操讲解课程即可。

接着上一期的结果,主流程运行结束后,会有一份完整的结题报告和分析结果数据在老师的账号下。点击项目结果下载,可以下载分析结果和结题报告。对于初次接触的老师,结题报告的解读也是必不可少的,在这里老师可以直接点击结题报告讲解,就会有对应的视频讲解接可供您了解整个转录组的分析结果。了解完转录组分析的数据结果后,接下来就需要各位老师进行数据挖掘了。在转录组数据挖掘里,主要有三大模块可供数据挖掘,所有基因模块、差异基因模块以及基因结构模块。今天先介绍第一模块,所有基因挖掘。

所有基因挖掘顾名思义,是针对整个项目里测到的所有表达的基因进行数据挖掘。第一个是基因检索。在这里可以根据根据功能信息进行检索,点击功能注释,输入自己关注的通路信息或者调控的酶、信号因子等。根据功能注释信息找到相关调控的候选基因。当然这一步数据挖掘一般需要老师对自己的研究方向有深入的积累,拿到数据后可以根据注释信息直接查找候选基因。当然,还可以进行基因ID、基因名称、序列信息检索等另外:很多老师在后期做功能验证或者RT-PCR验证的时候,需要查找基因序列,也可在根据基因ID检索,调取对应的核苷酸序列信息。点击下载对应的序列信息和注释信息。

表达基因韦恩图分析,主要是针对老师挖掘样本的特有以及共有基因的分析。一般老师的项目都是有生物学重复的,表达阈值这里,一般阈值设置的越小,老师将低表达的基因也纳入分析,但是表达量低于0.1的基因相对测不饱和,在每个样本中的检出率也不是十分准确,所以,除非特别关注低表达的基因,一般阈值设置默认即可。合并重复样本时,有交集、并集、均值三种方式。交集:某个基因在一组生物学重复中的FPKM都大于或等于一定阈值,则认为该基因表达;并集:某个基因在一组生物学重复中的任意一个样品中的FPKM大于或等于一定阈值,则认为该基因表达;均值:某个基因在一组生物学重复中的FPKM平均值大于或等于一定阈值,则认为该基因表达。通过这个分析老师们就可以得到SCI论文中常见的韦恩图。

 接下来就是基因名称替换,这个主要是针对有参转录组的分析。也是很多老师数据分析过程中遇到的问题。为什么别人发的转录组文章里,关键的候选基因有基因名称,而自己的项目只有基因ID。这里跟各位老师答复下,目前并不是所有的转录组测完后,都有基因名称,有无基因名称主要是取决于参考基因组,如果参考基因组注释完善,基因组注释文件GFF有基因名称,那么您的转录组测序注释的时候就会有基因名称。否则就没有基因名称。对于无参转录组来说,就更加不会有基因名称了。但是这一点也不妨碍老师后续文章的发表。所以老师们也不必担心。回归今天将的,有的参考基因组上没有基因名称,但是老师从其他方式获取了更新的基因注释文件或者根据基因注释信息调取了一些名称。拿到了和基因ID的对应表,我们也可以在平台上通过基因名称替换,给现有项目所有的基因ID添加上基因名称。

 表达量PCA分析,这个分析主要是来看重复样本有没有很好的聚类到一起,重复样本有无离群样本。差异样本间有无很好的离散分开。这个SCI论文里常见的图可以通过在所有基因PCA分析里完成。在这里添加完分组信息后,基因筛选和表达量值选择默认,点击提交即可运行出我们想要的PCA图。

 样本相关性分析,很多老师面临一个问题,通过样本相关性分析后,发现有重复样本间相关新性很低,而且重复样本还没有聚类到一起。害怕发文章的时候被审稿人质疑,这样就面临提出重复比较差的样本和重复样本聚类的问题。在这里,样本选择环节,可以剔除相关性低的重复样本,在是否聚类选择上,可以选择不聚类。点击提交后就可以运行出一张合老师要求的相关性图表。

 

最后就是很多转录组文章里出镜率最高的分析了,WGCNA分析。这个分析主要是将基因模块与表型数据或者表型样本进行关联,从而快速的锁定一批候选基因。主流程下的分析操作比较简单。但是这个分析一般要求老师样本量在15个以上,分析结果的可靠性才比较高。阈值一般默认即可,是否设置性状值这一块老师需要根据自己样本来定,例如老师的每一个样本都有株高数据,就可以将株高表型数据上传,后期可以直接分析与株高相关的基因。但是表型数据需要跟样本相一致。小编觉得这个分析还是很能提高文章的分析水平的,后期小编会专门有一期来讲WGCAN分析结果如何看,用小工具运行的。

 运行后的分析图表是这样的

本期分享就到这里了,下期小编将继续给大家解析基于差异基因数据挖掘分析以及高分文献中常见的分析如何运行。


END



  重要的事情再说一遍  

寻找幸运儿


第一期幸运儿:

我们在6月1日推出的微信稿“转录组数据整理和作图,还在用Excel?掉队了哦~”文末的留言和转发活动还有几位幸运儿未兑奖,你的奖品在呼唤你,快来联系我们呀。

 活动1中奖者(留言点赞前2名送20个转录组样品云分析):“下一站”“甜甜的”——未兑奖活动2中奖者(留言未中奖人员随机抽取1名幸运人员送20个转录组样本云分析): “振子” 活动3中奖者(转发并发送图片给后台送20个样本转录组次账号分析或4套课程,任选其一):
“追梦000”——未兑奖“欣欣”——未兑奖“清念”——未兑奖“马志慧”——未兑奖“嘘”——未兑奖 第二期幸运儿:我们在6月8日推出的微信稿《转录组分析原来如此简单》中,给大家详细介绍了从原始测序数据上传百迈客云平台到数据挖掘分析,直至最后完美的SCI论文图表的操作过程,文末也给大家发放了课程福利,本期的幸运儿的微信昵称为:故里 恭喜以上小伙伴们~请未兑奖的小伙伴们在7月1日前兑奖,过期作废哦。特别注意:培训课程需要6月底兑换完成,有效期1年

 

兑奖请长按识别下方二维码


 

百迈客现提供测序分析+分子试剂一站式解决方案:基因表达量验证:反转试剂盒+qPCR试剂盒;SNP验证:PCR Mix;克隆验证:PCR Mix+无缝克隆;DNA、RNA提取试剂盒解决疑难物种提取。期待与您的合作!具体可咨询当地销售!咨询热线:400-600-3186咨询邮箱:tech@biomarker.com.cn



文:张倩丽

排版:市场部

百迈客11周年大回馈,尊享5大优惠,测序正当时!

转录组数据整理和作图,还在用Excel?掉队了哦~

转录组分析原来如此简单



您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存