查看原文
其他

盗墓笔记——公共芯片数据?

2014-05-28 右哉 实验万事屋


小师妹郭芙的秘笈就是挖掘公共数据库上的芯片数据(如想查看郭师妹的逆推法门,请回复“活柯南”查看),数据的挖掘犹如盗墓一样,紧张刺激。简单介绍个最常用的数据库:GEO。基因表达综合数据库( GEO; heep: / /www. ncbi.nlm. nih. gov/geo)是一个巨大的基因表达数据库,并逐步开始被科学界所使用。



举个实际点的例子,让大家能明白是怎么回事。比如我们需要搜索一下GEO的数据库,首先我们要打开的是NCBI的网页,找到GEO DataSets


  

  点击搜索肠癌“Colorectal Cancer”即可获得所有肠癌的芯片数据。



  选择需要研究的芯片点击进入,例如我们搜索了一个II期肠癌的芯片数据库。



直接点击进入后,会获得该基因芯片的芯片,并进入分析工具的页面。



DataAnalysis Tools中可以进行进一步的数据分析,例如将原有样本群按照自己需要的分类在进行细分,并可筛选需要了解的某基因的表达谱。例如,郭师妹想要找的是耐药相关的基因,那通过逆推法,就要从P-gp入手,于是搜索该芯片中P-gp的表达谱。



 获得表达谱信息之后,在链接中可以发现Profile neighbors,及表达谱相近的基因,这就是我们需要寻找的与P-gp相关的有可能共表达的基因了。同样,通过GEO Profiles的搜索,也同样可以得到所有芯片数据中该基因的表达谱情况,并根据需求进行查找可能的共表达基因。



对所有的该基因的表达谱分析后,同样可以获得可能的Pathway哦……



点击后,可直接转入Flink显示可能的通路,是不是很方便。



好了,今天就策到这里了,感谢大家的支持!盗墓愉快!


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存