查看原文
其他

能不能少做点实验就搞高大上的科研呢?

2014-08-26 右哉 实验万事屋

提示:请点击标题下方蓝色“实验万事屋”,添加关注后,发“嗯”可以查看我们之前的文章。


小林子成天除了若有所思地做实验,就是若有所思地想问题,经常会问出这样那样奇怪的问题来。对于这些,他的莫愁师姐总是一一解答。小林子最近关心的是所谓大数据的问题,虽然大数据这个词是如驴灌耳的,也看有些文献,就是对大数据随便分析分析,就稍微做两个验证试验就发了文字。但他却从来没弄明白过究竟是怎么回事。这种事情只能去问师姐啊,拔兹道是不是大家都会羡慕他有辣么好的师姐呢?

莫愁:其实也觉得挺难三言两语说清楚这件事情的,就举了两个栗子。

第一个栗子很简单,要知道大数据,那就先知道知道什么是小数据咯。比如十七八个盲人在那里摸象,每个人都会获得自己心目中的数据,但仅仅是局部的“小数据”,代表不了整体。当数据达到一定的体量之后,才会把整个事件看得清楚和透彻,这就是大数据和小数据。在生物学上,各种组学及表型的数据整合在一起,就形成了“大数据”。这样的大数据,就能在整体上把握像肿瘤这样的“大象”,而不再是片面的。


第二个例子有点复杂,要知道那么大体量的数据能干嘛呢?最简单的例子就是算命,当然不要以为算命不科学,其实算命就是延续了5000多年的一个问卷调查,拥有大体量的数据,以及对相应目标未来的一种预测,这就是大数据能做到的事情了。比如:五年前,谷歌的一个研究小组在《nature》上宣布了该小组可以追踪美国境内流感的传播趋势,而这一结果不依赖于任何医疗检查.他们的追踪速度甚至比疾控中心(CDC)要快的多。也就是说,通过对大数据的系统分析,就有可能找出或预测出一些新的机制或分子间的相互联系。


但小林子还觉得不是很清楚:那师姐,我们做科研要大数据干嘛呢?

莫愁:小林啊,要记住,任何数据对于我们来说都是珍贵的。大数据对于科研来说是必不可少的哦!

倒是可以给你,再举几个例子,给你几种运用大数据的科研思路,给你的科研思路添点干货。

一、最常见的思路:运用芯片技术,对少数几个肿瘤组织进行研究(20例),找出差异基因,再将这些筛查出来的差异基因,回归到大数据的芯片数据库中(200例以上)去进行独立验证;

二、容易被忽视的思路:细胞系中进行表型或敲减的筛选,选出可能的较为重要的基因,通过已发表的芯片数据与临床表型数据,找出该基因与临床表型之间的关系,反映出它临床上的重要性;

三、Topic指导的Story:一般来说这种也是比较常见的运用大数据的科研思路了。比如我有一个Topic,我要make astory。这个story要有一定的结构:肿瘤,基因,机制。比如“我做的肿瘤是肠癌”,“最近一直在关注miRNA,不知道能不能扯上点关系”,“最好和自噬有辣么点关系”。好了,所有要素都全了。那下一步怎么做呢?首先,通过拥有大数据的数据库(例如TCGA),找出mRNAmiRNA及临床相关数据,筛选出已经发表过的与自噬相关的基因。预测通过自噬来影响肿瘤发生发展的miRNA及其靶基因。紧接着,细胞实验验证其与自噬的相关性。紧接着,动物实验……


…华丽丽的分割线…


今天就先介绍到这里了,有一个不错的数据库“Oncomine”,有一些文章就是通过这个数据库来的,回复“Oncomine”就给你普及一下初级的Oncomine使用方法。

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存