查看原文
其他

我从研究生生活中得到的经验

机智的叉烧 CS的陋室 2022-08-08

往期回顾:

最近研究生刚毕业,后台不少人问过我有关研究生期间经验的问题,由于问题以及对应回答基本比较统一,所以我把他们总结起来,撰写一篇文章来和大家谈谈我的研究生期间是怎么生存和进阶的,希望能帮到大家。我的出发点从研究生身份出发,但是本身落脚点是希望所有读者都有所收获。

首先还是先说说我研究生期间的情况吧,北京科技大学统计学理学硕士毕业(2年制学硕),研究方向是时间序列预测、机器学习、自然语言处理,研究生期间发表论文6篇,学生一作3篇,SCI4篇,还有2篇近期会投稿(没错,毕业了还在写论文哈哈哈),一次参加国家级以上会议4次,优秀论文一次,特刊推荐一次,一项国家自然科学基金学生第二参与人,国家奖学金,北京市优秀研究毕业生,另外实习时间接近1年,曾在去哪儿网担任产品数据、美团点评算法工程师、oppo机器学习算法工程师。

这是我的历程吧,大家可以根据自己的情况与规划,参照我的经验。

开始之前先建议两点:

  • 认真看完。

  • 觉得有道理,就要动手做。

懒人目录

  • 科研怎么开始

  • idea怎么来的

  • 读论文方法

  • 时间安排

  • 难的东西怎么看下去

  • 学习建议

  • 与导师沟通

  • 其他问题

  • 总结

科研怎么开始

科研的一开始多半由导师带着,从背景与基础知识开始逐步展开学习,随着深入开始考虑真正需要深入的点,产生idea,完成一篇论文后,你就算入门,知道科研是怎么回事了,如果是这种情况,那么你其实非常幸运,你只需要按照老师的指挥即可。但是如果你的导师并没有这么做,或者是你想自己开始一个自己的方向,这就不是一条平坦的路,你需要自己去探索,摸着石头过河,才能完成任务。

但是无论是哪种,你其实都是要入门,从我的角度来看,开始阶段你需要了解下面几件事。

  • 你未来研究领域是什么。例如我要做的是理论研究,还是应用,什么领域下,如金融市场、微分方程、生物信息等,都是一个领域,你要确定一个领域。

  • 掌握该领域的背景与基础知识。举个例子推荐系统下,你要知道什么是推荐系统,他怎么应用,有那些场景,目前的常见方法是什么,必要时候你还要重现这些方法,理解这些方法的思想。

  • 了解这个领域的研究背景。领域背景重在了解这个领域的内容,而研究背景则倾向于研究现状,对于大部分问题,实际应用的方法只有一个,但是方法其实很多,只是最后选了一个来用而已,你要去读论文了解目前有哪些比较先进的方法,总结这些方法的特点,甚至尝试在里面找到不足(这是你未来文献综述的雏形,你文章idea的来源)。

完成上面任务,其实你就算科研基本开始了。

idea怎么来

很多人问这个问题,相信很多人都苦于此,其实我也经历过非常痛苦的阶段。

个人认为,没有想法的根源还是在于脑子里的东西不够多,见的世面不够多,说白了,就是论文看的太少,实验做的太少了

  • 论文是你接触前沿方法的窗口,通过看论文,你能知道别人是怎么提炼创新点(文献综述部分),怎么解决问题(method部分)。

  • 多做实验,哪怕是重现也好,有时候你会发现重现不了,或者在重现的过程中出现了一些作者没考虑到的问题,这就是你的机会了。

另外,对于别人的想法,有的时候在你的场景下也会遇到,看看别人怎么解决的,你也可以在你的问题下用类似甚至更为先进的方法,这就是你的研究点了,如果足够大其实就可以写论文了,这个不是抄袭,也是一项重要的工作,之前的论文用的SVM解决疾病诊断的问题,可能结果还行,这次你换了随机森林变好了,其实这就是一个还可以的创新点。

读论文方法

我在很多场合都强调读论文,多读论文很有好处,下面我就分几个方面来谈谈怎么读论文。

读论文的一个核心是在读之前确定自己读论文的目标是什么,要带着目标去看,因为这个目标决定了你读论文的策略,我下面就按照这个思路来分不同的读论文策略。

然后,开始读之前,都看一遍摘要,来确认你是否需要继续读下去,如果是下面任意一种情况,那就不要读了。

  • 和你的方向不对。

  • 除非是经典(看被引的很多大概率就是经典了),否则太老旧的文章不用看。

  • 时间有限的话,优先看top期刊的论文,把它们当做标杆,具体哪个是top,可以问老师你的领域下那些是,另一方面,看到一个期刊查一个,中科院分区一区二区的就是好期刊。

目标是了解研究背景。如果你是为了了解研究背景,建议你读摘要、引言、文献综述,从里面抽取你要的信息。

目标是学习和重现方法。谈到丰富,一定要认真看文章的模型和实证部分,了解他的模型特点以及相比基础模型的特点,同时还要了解他比的对比的模型好多少,如果有需要,可以看看作者对他的评价,一般会在结论部分提及。

目标是模仿写作。很多人会说论文不会写,要学习,我有一个很快的技巧,但凡经历过高考的洗礼,其实写作能力就基本过关了,剩下就是具体文体的训练,对于论文而言,范文就是现在在网上看到的各种论文,他们之所以能发出来,在写作上肯定是过关的,所以你就参照他们的思路去写就好了,尤其是你的标杆文献,可以认真看,例如文献综述不会写,你就看看这篇文章的文献综述怎么写的。

时间安排

很多人看我写论文,还有时间实习,自己还学了这么多东西,怎么安排的,我这想说的其实很简单,就是——规划+执行

我其实在研究生期间就有了计划,我是不打算读博的,那就是找工作,那我就需要为我的工作配备足够的东西——论文、实习经验、基础知识,然后有计划地排期,以月份为单位,每个月主要做什么。这个规划其实能对自己起到促进作用,看到这个月快结束,其实就会催促自己加快速度完成任务。另外补充一个细节,就是我的计划都是按照120%来计划的,这个也能催促的自己提升效率,每天完成超过100%,其实就血赚,没有其实也不见得就会亏,但是这个方法会让自己压力很大,抗压能力不强的慎用。再者,就是每天预留专门的学习时间,独立于工作、科研,专门学习。总结一下吧:

  • 有一个学习排期,安排自己的学习。

  • 120%来安排计划。

  • 每天预留专门的学习时间。

另一方面就是执行了,计划大家都会,新年那会大家都会立flag,但是能不能做就是另一回事了,这个是靠坚持吧,所谓"行百里者半九十",你要真的想进步,就一定要走完,学完,不要像背四六级单词永远在"abandon",这个真的靠自己。

难的东西怎么看下去

我的经验看来,在我目前的经历下,难度一般是3种:

  • 数学难(包括某些理论),例如《统计学习方法》看不下去

  • 语言难,英文论文看不下去

  • 其他难度

数学难应该算法领域下其实非常常见,我的经验看,认为数学难主要有这几个原因。

  • 怕。建议:迈出去才知道行不行,不迈肯定不行,所以尝试一下绝对不亏。

  • 懒。建议:不克服,哪个领域都一样难

  • 基础不足。建议:这个是最常见的,一定要踏踏实实把基础补好,否则不会就是真的不会,不会爬直接飞肯定不行,微积分线代概率不会,机器学习学起来肯定难,数学系把学高代数分成为是一种开光,开光之后后面的内容都不会太难。

  • 理解实在困难。建议:很中肯吧,如果觉得难那就不在这行做了,在其他领域一定有适合你的。但是,在我看来,大部分人还没到这一步,更多是第三种情况或者是到其他难度

语言难,这是一个非常好解决的问题,你不会翻译,谷歌和百度会,他们有专门的翻译对吧,但是,推荐大家还是尝试努力啃啃,毕竟有些专业名词谷歌百度翻译会出现偏差,影响你理解,还有公式之类的是不好翻译的,另外,提升你的英语水平。

其他难度,我大都在百度、谷歌上解决,必要时候查查论文和github,希望大家能优先选择自己通过检索的方式解决问题,一篇材料看不懂,就看第二篇,对比着看,材料里有不懂的,继续查,这条路径下来其实你能理解很多东西。

学习建议

有人提到我学习东西很快,还能记住这么多的东西,我的思路主要是抽取重点记录,留印象。

一本书很厚,把这本书装到脑子里肯定是不现实的,我的策略有3个。

  • 记重点。例如SVM是间隔最大化,核函数,SMO,然后有优缺点,已经足够满足日常应用需求,具体怎么求对偶,公式能看懂但是自己其实直接写写不下来,但这个并不影响我很好的使用它。所以要记住的应该是有利于你日常使用的知识,而不应聚焦于细枝末节。当然的,要是你要应付面试笔试,那就另一回事哈。

  • 索引化。脑子留个印象,剩下的百度找。例如我看到了一个特征工程方法——z-scores,我就知道基本思想,然后要用的时候,百度直接找代码和实现。

  • 手写笔记。写完的笔记我基本不会查,相信很多人都类似,我会简单地画一遍,我只求留一个印象,然后参考前面两条。

与导师沟通

在知乎上其实看到了很多人对导师的吐槽,说实话遇到某些情况确实很复杂,我遇到一个不错的导师,但是实际上确实要面对各种压力,科研、项目等其实也有很多,但是我能一件一件做完,其实也是有些技巧的。

  • 主动。学生当久了,很容易处处陷入被动,毕竟被人安排任务、安排学习习惯了,但是到了研究生了,某种程度上算是工作了,和我吐槽的人中不少说老师不教他东西,不给他任务,问题是,老师其实不见得有时间管好每一件事,你要主动找老师去聊去谈,去说问题,推动你的事情前进,不懂的东西要自己学,不是等着别人来安排你。

  • 主见。老师给的任务,你也不一定可以照单全收,你的精力和能力有限,也需要把重要的事情做好,此时你要有自己的主见,安排好自己的时间来推进,毕竟完成一件事比什么都做单一事无成更好,现在是一个结果导向的社会。

  • 说"不"。不是让大家去反对老师,而是要根据自己的实际情况和老师讨论好自己的情况,很多老师不会对所有的学生有100%的了解,可能会给学生超额的任务,此时学生作为执行者,能全盘接受固然是好事,但是接不下来的时候要和老师沟通,优先级是什么,deadline是什么,方便自己安排,老师作为推动他项目的关键,肯定不想他的事情黄,他分配给你后他也要衡量风险,所以你和老师沟通你的时间安排等,其实老师不会不乐意,你做不了他可以另有安排。

当然了,很多时候交流也有一些基本的技术,这些大家可以通过读一些有关沟通交流方面的书籍获得。

其他问题

Q1:有关笔记怎么做。

论文的笔记,根据你的目标来看文章,然后记录的时候记录这些内容:

  • 按照一个参考文献格式记录论文(方便日后引用)。

  • 看完摘要总结一句话,谁、为了解决什么问题、提出了什么方案、结果如何。

  • 文献综述下,记录思路(先讲什么后讲什么),观点。

  • 模型,记录整个流程结构,用的主要技术和模型。

  • 实证,实证流程和结论。

读书笔记,难度越高记录越细,剩下的参考前面的"读书建议",里面选重点写一遍,最好能有个思维导图,结构化的东西更有利于记忆,而且你能结构化了,大概率就是你能理解了。


Q2:研究生如何安排时间,研一就实习吗?

我是研一下开始实习的,这里有几个关键前提,如果你满足下面所有,随时可以开始。

  • 几乎没有了毕业压力。

  • 你已经具备实习目标岗位的基础知识。

由于我已经有论文出来,课程已经完成,且已经进行了一波自学,所以有信心开始实习。

这里再强调一点,就是所有事提前做,做在前面你就有很多主动权,例如论文提前完成,你就能提前开始实习对吧。


Q3:我不知道我该学什么。

根据你的毕业去向去配备技能。

想出国的好好考出国考试,同时参考下面读博,增加科研经验。

想读博的好好在自己的目标领域下积累基础知识和科研经验,多发论文。

想工作的就看自己要做什么工作,甚至做好职业规划,在你的入门和晋升之路上你缺什么,就学什么,不知道学什么可以参照相关岗位的求职要求以及各种领域内的公众号,他们一再强调的就是你该会的。


Q4:我会XXX,我能找什么工作。

例如python,机器学习之类的。这个问题,我建议上拉勾网之类的求职网站上,把你的这个名词输入,出来的就是你可以尝试的工作,但是需要注意的是,单一小技能一般很难找到工作,找到喜欢的工作后,点进去看看他还需要什么技能,学好了再去尝试,完善好自己的技能。


Q4:我是学XX专业的,适合做YYY工作吗。

从我的角度看,如果工作和专业匹配是对找工作有优势,但不是绝对,企业要找的是具有匹配技能的人才,所以你即使不是这个专业,但是具备这个素质,一样可以,但是中肯的,本专业相比非本专业的优势在于经历了长期训练具备了一些适合这个工作的思维方式,这个才是外专业尝试某工作所很难弥补的缺陷。


Q5:实习or not

很多人问是否要实习,我觉得这个应该从你毕业去向来说明,如果你未来要工作,那找一份和你未来工作相同或者相似的工作就很好,否则,不建议实习,包括出国和读博,出国和读博的同学性质类似,都是继续做研究,所以论文积累更适合。其实总结起来很简单,就是你现在做的要和你毕业去向匹配即可,工作的话积累工作经验,读博的话积累科研经验或者论文成果。

实习是最有利于找工作的加分项,越早实习越好,毕竟实习过,东西做过,那到了新的岗位更容易上手,但是很多人其实由于实验室要求而无法实习,此时我建议大家认真写论文,同时尝试性地往你未来公司相关的方向写,HR等肯定非常了解这个设定,所以对有优秀论文成果的同学也会有很大的加分,

这里划重点,一切都要和未来你的计划匹配。

但是有个大前提,你得保证你能毕业!

总结

研究生确实并不简单,我在其中也经历过很多艰难险阻,希望我的经验能给大家一些帮助吧,我已经上岸,希望还在海里的同学加油,出色完成自己漫长求学生涯的最后一公里。


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存