查看原文
其他

生信小硕乱入生物实验室的幸福生活(二)

2015-09-09 小丫 嘉因生物

尹师妹:哈师兄。。。虽说师妹我早两年进组,但您贵为博士,我乃小硕,所以理应尊称您师兄。

小哈:!# ?

尹师妹:哈师兄能帮我看看我这些差异表达lncRNA哪些在lncRNA disease数据库里已经有收录了吗?挨个去搜这200个lncRNA可不是个好主意,哈师兄会生物信息,编程最棒了,帮我处理一下哈!

小哈:这个好说,文件发给我。

一盏茶的功夫,尹师妹qq上便收到了小哈处理好的文件。

尹师妹指着黑背景绿色字的终端窗口道:这样的活我可真干不了。

小哈:(妹子不错,得多交流哇!)尹师妹,我教你一招,不用写代码,只要点点鼠标就可以批量完成,把你也变成生物信息达人。

尹师妹:你是说我也能做生物信息?

小哈蛋定的打开lncRNA disease网页,这里的数据,是可以全。部。下。载。哦。

http://www.cuilab.cn/lncrnadisease


The experimentally supported lncRNA-disease association data ( txt and xls ).点击这里的xls,下载Excel文件,是这样滴,一共1102行:


第B列就是lncRNA的名字

尹师妹的差异表达lncRNA列表是这样滴,是200个lncRNA的名字


把尹师妹的lncRNA复制,粘贴到lncRNA-disease列表的1103行B列,变成这样:


在右侧空白单元格N1里面输入=COUNTIF(B:B,B1),回车。


类似的,在O1里面输入=COUNTIF(B$1:B$1102,B1),回车。

在P1里面输入=N1-O1,回车。

选中N1、O1、P1三个单元格,把鼠标放在P1右下角,光标就回变成+,


双击,这三个单元格的内容就被复制到下面所有的行。


选中P列,复制,粘贴到Q列,选择“只有值”。


鼠标点击排序,降序,Q列里面数值为1的行就是尹师妹的lncRNA喽!


尹师妹:我这些lncRNA的确跟肿瘤有很大关系呢!用这个方法,我还可以找到那篇Cell paper发现的lncRNA跟我的交集。

小哈:嗯,尹师妹已经看到了这个方法的核心,就是找某个名字重复出现的次数,可以用来找两个列表的交集。


预知哈师弟的更多秘密武器,请长按二维码!



您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存