临床医学生的艰难生信路,触动你的经历
现在你看到的是是生信故事会专栏,欢迎大家投稿哦:
详见:生信故事会栏目征稿启事(价值3万元的生信资料等你来拿)
本人是临床医学专业的,就读于300名以后普通一本医院,从小学开始就对编程可感兴趣,导致大学就开始跳编程的坑了,临床学的不咋地。
本文写的结构较乱,大体记载了过去几年的感悟。
01
1. 第一次接触生信
初
识
高考毕业后,我一个在深圳公务员的表哥跟我说,大学要去看看万方、知网数据库,现在比他混的好的,都是大学偷偷看那些数据库的,可我当时根本不知道啥叫知网,知网是什么。大一以后,我才知道原来做实验的需要看知网上的论文。据说本科发了文章研究生考试会好通过一点,于是萌发了进实验室的念头,可是最后直到大一毕业的暑假才进了实验室做了一暑假实验。回想起来当时的自己真是单纯,毫无一点功利心。慢慢的随着我知道了论文的重要性以后,才开始逐步去追求,遇到了一位老师,给了我一批几年前的芯片数据,当时根本不知道是啥,通过大量检索文献才知道那就高通量芯片,需要做生物信息学,尽管公司提供了所有结果,可是完全不知道咋写,查了很多文章,其中印象深刻的是南方医科大学的生信文章,感觉是中文核心里的标配,而且文章还不少。但是人家都是直接挖掘GEO上的数据库,跟我手里分析好的数据还不一样,实验过程也不一样,看着实验方法里说跑R,我拿着现成的成果却一点都对不上,就这样搁置了三个月,慢慢的我才知道有个东西叫做GEO数据库,而别人的芯片不是自己做的,所以我的实验方法始终难以完成,而且我询问了华大的几个负责人,估计是后来都被我问烦了, 直接让我去看书,我也知道自己很菜,然后还不知道看啥书,就这样又搁置了。
总之那之后的两年,我都在研究各类生信文章,可是自己的还发不出去,主要觉得自己并不懂,硬写的话出错了容易出事儿。我也寻遍了学校大多数的老师,似乎都没有会跑R的,生信这一块在我们学校是个巨大的软肋,无人帮助,而且大多数的公司生信教学,都是上万元,只教一个狭窄的套路,去酒店住2-3天的那种培训。无奈没钱,也怕文章发不出去又亏,后来虽然知道了生信技能树,可以说是打破了大多数的公司生信垄断的局面,然而作为一个菜鸟,我只会完全照着代码去跑,自己根本不会修改,导致不断报错,自己天天熬夜到凌晨3-4点熬了大半年,每天就睡3-4小时。虽然进度缓慢,但也小有收获,稍微能跑成功几行代码了,还记得光读取一个表格都花了我2-3个月,读取以后开心了贼久。虽然这样,但是生信技能树当时省略了很多细节代码,很多包需要装,也一直报错,又过了几个月,我才发现是网速的问题,老是需要在学校、网吧和手机数据网之间切换,才能把一个R package给下载下来。于是我也放弃,那两年着实十分的绝望,很喜欢数据挖掘,虽然自己也考了C语言二级,但是完全没有用。也无人能帮助我,当时就可羡慕那些好学校的学生,有个老师带,速度起码是我的10000倍,一行代码我要跑2-3个月,甚至1年才能找到问题所在,我想有人指点的话,也许几分钟就好了。
02
个人科研之路
与相对的自卑
科
研
♮
♮
♮
♮
2016-2018那两年很多时间都给了生信,看了无数的文章,慢慢地自己终于会写一点了,在2018年第一篇文章出去了,虽然是二作,还是篇水文,而且是摆分析好的数据,但还是很开心,终于能撰写了,也能做轻微的修改。但同时也有点自卑和烦躁,因为毕竟看了两年的文章,始终停留在转录组学的档次上,代码还无法完整跑下来,现在随着高通量技术的成熟,更新只会越来越快,以这么慢的速度前行,永远也无法跟上。后来2019年随着生信技能树发布更详细的代码,还有很多抄袭生信技能树修改代码的公众号等出来以后,我也东拼西凑了一套代码,虽然不完善,但也能强行分析,当时就想过,我接触生信算是早的了,要是2016年就会了,那我也许能水上上百篇文章了(在此yy下),但是我也分析过自己,当转录组学还能发篇2-3分的sci时我不会,会时已经是miRNA的天下了,可是也不会miRNA,当我能蹩脚的分析miRNA时,发现已经是LncRNA和CirleRNA-miRNA-mRNA的时代了,可当我刚能看懂的时候,发现肿瘤微环境都早已经快不行了,已经进入单细胞测序的时代了。还记得m5C甲基化的时候价格不到一年就降了,后来m1A甲基化出来没几个月就没信了,m6A甲基化又火了,只让我感到时代进步太快了,自己已经跟不上了,实在是很绝望。于是后来慢慢接触了很多其他领域,比如肿瘤、临床数据、meta分析再到网络药理学。
再到2019年,整个科研学习环境都好多了,尤其是生信技能树B站教学视频,一样打破了国内科研的垄断,慢慢的我也学了很多领域的知识,虽然很菜,但也水了好几篇的中核和低分SCI,对于编程,基本都快认命了。总结过去,没人带,在R上浪费了大量时间,一直在产文和学习之间拼命的寻找平衡,因为发文的话很多细节不懂,学习的话,又耽误了发文,实在是很折磨人。当自己能独立发一篇SCI的时候,基本就打算退了。
03
发现问题到解决问题
问
题
♮
♮
♮
♮
生信的路一直在光明和黑暗之间徘徊,每当我以为要攻克一个问题了,总是会再跳出更多的问题,不过也培养了我发现问题和解决问题的能力,就比如从一开始一个代码报错,我找了1年发现了问题,后来变成了半年,三个月,1天,几小时甚至几分钟,才让我明白也许时间并没有完全白费,面对全新的英文软件时,我的摸索速度也越来越来,后来在完全没有教程的情况下,基本完全摸会了cytoscape,剩下的就是探索个个插件的作用,总之训练自己发现问题到解决问题的能力我感觉对于科研工作者极为重要。科研往往是孤独的,很多时候也无人帮助。
04
与生信技能树再次结缘
结
缘
前几天看到了生信技能树的帖子说是给本科生提供学习资源(没想到吧,四年过去了我还是本科在读,因为我高中就结识了生信技能树,而且我们医学生是五年本科),一起探索代码,之前看帖子要成为学徒条件很高,我特别菜,也就只在公众号留言过,我抱着试试的心理,没想到曾老师居然通过了,一下子丢了一堆代码和网站,那个下午摸索着一点点的跑完了,人生第一次完整的做完了KEGG、GO富集等完整的流程,代码确实极其令人惊讶,我才感觉到有人指点,有时只需一句话就点破了一切。直到我跑完了所有的代码,我才进入到一个新的世界,我才发下自己能稍微看懂生信技能树的帖子了,以前很多根本看懂不懂代码,仅仅几天我就完成了以前好几个月都不一定摸索出的问题,再次让我萌生了将R语言学习下去的动力,也许再过一段时间,就能感受到完全不一样的我。
写在最后,我是临床半道子出来学R的,虽然很菜,过去摸索了好几年没啥进展,但是感觉期间不断加深了我的理解,当我再次接触到完整的代码时,很多问题迎刃而解,仿佛积累了很久突然爆发了一样!
05
如果你也要学R语言
结
语
R语言在整个生信领域的地位是举足轻重的,如果你也是一样想要入门生信而苦于无人带领,一定要看看生信技能树广州GEO挖掘课程,(2月因疫情取消课程一次,可以咨询3月及之后的课程)是目前市面上最实惠最良心,价值最大的线下学习班了。老师会从初学者的角度一步步带你走正确的学习路线,不知道可以少走多少弯路!如果能早一点遇见该多好呢。
最后再感谢曾老师,感谢生信技能树!
生信技能树的2019年终总结 这里面记录着我博士期间抽空做的一点教程分享事业
2020学习主旋律,B站74小时免费教学视频为你领路 这里面记录着我为生物信息学教学行业做的一点贡献