生信小硕乱入生物实验室的幸福生活(二)
尹师妹:哈师兄。。。虽说师妹我早两年进组,但您贵为博士,我乃小硕,所以理应尊称您师兄。
小哈:!# ?
尹师妹:哈师兄能帮我看看我这些差异表达lncRNA哪些在lncRNA disease数据库里已经有收录了吗?挨个去搜这200个lncRNA可不是个好主意,哈师兄会生物信息,编程最棒了,帮我处理一下哈!
小哈:这个好说,文件发给我。
一盏茶的功夫,尹师妹qq上便收到了小哈处理好的文件。
尹师妹指着黑背景绿色字的终端窗口道:这样的活我可真干不了。
小哈:(妹子不错,得多交流哇!)尹师妹,我教你一招,不用写代码,只要点点鼠标就可以批量完成,把你也变成生物信息达人。
尹师妹:你是说我也能做生物信息?
小哈蛋定的打开lncRNA disease网页,这里的数据,是可以全。部。下。载。哦。
http://www.cuilab.cn/lncrnadisease
The experimentally supported lncRNA-disease association data ( txt and xls ).点击这里的xls,下载Excel文件,是这样滴,一共1102行:
尹师妹的差异表达lncRNA列表是这样滴,是200个lncRNA的名字
把尹师妹的lncRNA复制,粘贴到lncRNA-disease列表的1103行B列,变成这样:
在右侧空白单元格N1里面输入=COUNTIF(B:B,B1),回车。
类似的,在O1里面输入=COUNTIF(B$1:B$1102,B1),回车。
在P1里面输入=N1-O1,回车。
选中N1、O1、P1三个单元格,把鼠标放在P1右下角,光标就回变成+,
选中P列,复制,粘贴到Q列,选择“只有值”。
鼠标点击排序,降序,Q列里面数值为1的行就是尹师妹的lncRNA喽!
尹师妹:我这些lncRNA的确跟肿瘤有很大关系呢!用这个方法,我还可以找到那篇Cell paper发现的lncRNA跟我的交集。
小哈:嗯,尹师妹已经看到了这个方法的核心,就是找某个名字重复出现的次数,可以用来找两个列表的交集。
预知哈师弟的更多秘密武器,请长按二维码!