既见坎途,又遇风来
"以学科交叉的方式
探索人工智能背后的根本性原理
立志做一名基础研究的探路人 "
从科研到体育
交叉信息院2018级本科生徐海珂
在一段漫长的岁月里
走着一条悠长的路
途中既见坎途
又遇风来
这是关于坚持的故事
“扎实沉稳,能踏实追求有深度的关键性突破,是难得的、不盲目追求速度和数量的、有定力的、坐得住冷板凳的基础理论储备人才。”在徐海珂的特奖推荐理由里,这样一段话引人注目。而他“定力”与“扎实沉稳”的养成,或许要从高中时学习信息竞赛的经历开始。
这段经历对他的学习起到了很大的帮助,“不仅体现在我掌握的知识,还体现在我接触的计算机领域的前沿方向和由此培养的思维方式。”并直接影响到了他的专业选择。
除此之外,这段经历也让他养成了一种习惯,“一个人在封闭的环境里,去做一件很难的事情”。
破旧立新,做基础研究的探路人
如果说高中时期竞赛经历影响了徐海珂的专业选择,那大一期间的访学经历则影响了他的未来发展和研究方向。
大一暑假,徐海珂在牛津大学进行访问。期间,他和当地的清华学长进行了交流。尽管他和两位学长交流的主要是天体物理学相关的内容,与自身专业并没有很大关联。但学长们在他乡异国独自打拼、默默仰望星空的身影,带给了他很大触动。这段经历给他留下最深刻印象的,是整个访问过程中的学术氛围。“在一个清幽美好的地方安静思考、做研究是一件很美妙的事情,是我理想的状态。”对于徐海珂来说,这件事播下了他想要从事计算机科学研究的种子。
徐海珂牛津访问毕业典礼,摄于2019.7
此后,他提前选修了高年级的“机器学习”课程。在课程中,徐海珂了解到,虽然“机器学习”已经在生活中广泛运用,但基础理论仍然不够完善,尤其来自中国的研究在这方面比较薄弱。“CS Rankings的统计数据显示,中国的计算机学科在大多数方向都发展迅速,唯有理论方向仍和世界一流高校有较大差距。”高中有过信息竞赛经验的徐海珂对理论计算机并不陌生,了解到该学科的重要性以及中国的现状后,他对“机器学习理论”产生了兴趣,他相信完善的基础理论可以更好地指导“机器学习”在实践中应用。
科研最大的魅力是什么?徐海珂用他的一次课题经历给了我们答案。在进行某个课题的时候,已经完成前90%工作的徐海珂被卡在了最后10%的证明上,“一般来说,这个时候大家都不太舍得放弃之前已经完成的90%,但是这样恰恰很容易陷入思维定式之中”。但是,他最终选择推翻了之前的全部理论,并成功解决了问题。“我觉得这个不断破旧立新的过程就是科研最大的魅力所在。”
在学科交叉的路上,徐海珂也在不断尝试着新的思路和方向。在大二暑假研究“强化学习”时,徐海珂偶然发现,该领域中前人猜测的一个不可能突破的技术障碍似乎可以用“在线学习”中的技巧解决,而那个技巧正是他在半年前研究“在线学习”中多臂老虎机问题时,在最初的文献阅读中无意浏览到的。尽管和自己当时的课题并不直接相关,但他经过大胆尝试,成功设计出了一种和前人思路完全不同的算法,最终解决了前人提出的开放性问题。审稿人给出了这样的评价:“I like the paper. I find the algorithmic approach and the analysis quite creative and I certainly appreciate the use of new techniques and algorithmic approaches.”(我喜欢这篇论文。我发现算法方法和分析非常有创意,我的确很欣赏新技术和算法方法的使用。)
在进行“非凸优化”的研究过程中,徐海珂也进一步感受到了学科交叉的乐趣与魅力。相比之前侧重于机器学习的算法设计,“非凸优化”更侧重于分析算法的运行效率,是几乎所有机器学习算法运行的底层基础,这次经历让他以更加数学化的方式去理解“机器学习”,同时也使他坚定在学科交叉的道路上,做一个敢闯、肯钻的基础研究探路人。
坐冷板凳,在起落中夯实理论基础
科研的道路总会有困难,对于徐海珂来说,他觉得自己做科研比较困难的,应该是最开始的部分。“一开始你面对全新的领域,你要先读别人的论文。那种理论的论文还特别长,50页100页,一半以上都是公式,大概率看不懂,大部分人这时候就被劝退了。”徐海珂坦言,就连自己也差点被劝退。但当他花了时间啃下这篇论文,发现文章或许很长,但核心思想可以概括得很简练,后面接下来就变得简单了。
而科研中需要花时间去啃的,又何止读论文。
徐海珂的第一次科研是跟随李建老师探索“在线研究”中的“多臂老虎机”问题。在当今大数据时代,信息安全至关重要。徐海珂的研究尝试设计出安全稳定的在线学习算法以抵御恶意数据的攻击,从而维护安全稳定的网络环境。在研究的开始阶段,徐海珂的进展非常顺利,他在三个月内便成功改进了之前的算法。而正当他准备投稿的时候,却发现这个问题已经被新近发表的论文完成了。
这对第一次参与科研的徐海珂造成了不小的打击,“第一反应当然是非常沮丧和失落”。但在老师的鼓励和自我的调整中,他放慢了投稿的速度,仔细分析了自己的算法和新发算法的差异,并在这一过程中,对自己算法的核心思想有了越来越深刻的理解,成功将其扩展到了另一个实际生活中的重要场景,展现了自己的独特优势。
最终,在一年“冷板凳”的经历之后,徐海珂成功在人工智能国际会议UAI 2021发表论文。“这一次经历也使得我认识到了深入基础、探索问题本源的重要性。尽管科研的过程中会有很多困难,可能很久都没有进展,但只要坚持,最后还是会突破的。”
虽然徐海珂觉得自己在这个问题上耗费的几个学期稍显拖沓,但回过头来,他认为,“如果没有这些波折,我可能不会去思考算法是否还有优化的空间,同时这也反映了我在研究的东西是大家所关注的,这是一件好事,而且我认为在未来的科研道路上我一定还会遇到比这个大得多的困难,也算是提前适应。”
同时他也提到,在科研过程中,如果自己的想法被发现证伪或是出错的时候,他也会经常出现情绪波动,但他已经学会快速调整自己的心态,保持定力,“我们一开始做科研也许是想多发一些文章、有可以写进简历的产出,但其实渐渐地就会发现有意义的研究未必是立竿见影的,未必一经问世就能产生很大的影响。我觉得如果将来我的研究可以作为漫长研究链条上的一环,我的成果在经过多个人的迭代研究之后能有很深远的影响,这也是一件很有意义、很值得我长久坚持的事情。”
无体育不清华,把“长跑”变成兴趣
“我在高中时候就没有跑过三千米,我当时一千米就要五分钟,三千米第一次跑完是27分钟。”徐海珂坦承,自己在高中时期对体育并不感兴趣,但一直对清华的体育要求有所耳闻,直到上大学才开始突击体育锻炼。“大一为了及格一直不停地练习,最终三千米跑了十三分钟多。”
相比短跑,徐海珂觉得自己更容易在3000米上有所提高。相比短跑瞬时的力量,“三千米的(需要的)那种耐力和科研很像,我这种性格的人更容易克服。”徐海珂表示,虽然自己50米跑得不是很快,但跑3000米会快过身边的大部分同学。
每次跑步时,他都会给自己定下目标,跑完之后又会和昨天比较,这样慢慢就会有所提高。至于每学期练习多少次?“反正每次我比它(学校规定)多好多,我也不太注意。”
而从大二开始,可以自主选择的体育课则让培养起了徐海珂对体育的兴趣。从跳水、游泳到台球和定向越野,他逐渐体验到了体育的乐趣所在。“这都是我自己选的课,而且也很有乐趣,也愿意多花时间练习,参加比赛也可以有不错的成绩。”
徐海珂坦言,刚开始跳水课程的时候,自己也害怕高台的高度,但按照老师的专业讲解,自己最终还是克服了对于高度的恐惧,完成了课程的要求。而给他留下最深刻印象的,还是最终结课时站上十米台的经历。“那个时候我已经没有那么恐高了,我当时觉得可能会有点疼,但这是一次很难得的体验,所以即使疼痛也一定要跳下去。”
“其实跳完之后是既开心又遗憾的,开心的是终于完成了一直以来的目标,遗憾的是可能不会再有机会站上十米台了。我会比较在意这些新的体验,因为可能一生也就只会体验这一次。”
尽管一开始参与跳水,徐海珂抱着和很多同学一样“打卡”的心态,但“打卡打得没意思的时候,就会在意自己的技术水平能不能比上一次更好一点。”徐海珂觉得,自己是比较在意能不能进步的人。在一次跳水课上不小心被同学踢伤,一个月不能上课,而伤愈之后距离参加比赛只有两周左右的时间,在更加频繁训练的同时,他也积极向助教寻求指导,最终在清华的跳水比赛中获得了冠军。
图为徐海珂夺得清华大学跳水比赛冠军,摄于2021.05
徐海珂认为,其实三千米和科研非常相似。“大部分时间其实都是比较平淡的,这时候离目标比较远,会比较痛苦。但是三千米每过一圈你会知道自己离终点更近一步,科研也是每过一段时间你会得到一点小小的正向反馈。这两个活动最主要的特点都是大部分时间都是在漫长的等待和忍耐。”
从初探科研的跃跃欲试,到面对难题时的追根溯源,再到无意间打开学科交叉的大门,科研就像一场长跑,而在这样漫长的旅途中,徐海珂立志以学科交叉为基础的道路,做一名基础研究的探路人。
◐◑◒◓◔◕
徐海珂 / 交叉信息院
男,计科82班。现任计科82班学习委员。曾获国家奖学金、清华之友——郑格如奖学金、新生奖学金、国际大学生程序设计竞赛亚洲区域赛冠军、中国大学生程序设计竞赛总决赛亚军、清华大学第20届跳水比赛男子单人入水项目冠军、马约翰杯学生运动会毽绳比赛180秒三人计数踢毽乙组亚军等。以第一作者身份在国际会议COLT 2021和UAI 2021发表论文两篇。
往期回顾
飞=͟͟͞͞飞=͟͟͞͞飞=͟͟͞͞!
特等!一等!二等
大雪书单送达!以清华书香期待新年
点击查看👆
来源|清华小五爷园
编辑|赵姝婧 张馨
排版|张馨