你好,浙大AI少年!
他是浙大AI少年
字节跳动奖学金获得者(全球10人)
专注在人工智能跨模态计算等
国内核心技术
在CCF-A类会议中
以第一作者身份发表十余篇文章
并长期担任此类顶刊审稿人
本研就读期间共获得4次国家奖学金
……
是怎样的内在驱动力
又是怎样的校园成长环境
让少年一路凯歌
成长为人工智能领域的后起之秀?
今天让我们走进
2022-2023年度浙江大学
竺可桢奖学金获得者
软件学院2021级硕士研究生黄融杰
的成长成才之路
“尝试本身即是价值
浙大提供了这样的机会”
让许多人吃惊的是,黄融杰本科专业并非和计算机、软件相关,而是海洋工程与技术。进入求是园,他和绝大多数同学一样,还不明晰来到浙大要做什么,也不确定未来要成为怎样的人。鲜衣怒马少年时,尽管迷茫,开放包容的校园文化让这位有着强烈探索欲的大学生,在不断尝试中找到自己的热爱。
浙江大学“通专跨融合”+“四课堂融通”的培养体系为他提供了机会。“大一我在蓝田学园,寝室同学的专业并非完全一样,我们一起上了很多通识课”。浙江大学一直致力于通识课程和专业课程的深度融合,在全校共开设了500余门通识课。尝试本身即是价值,黄融杰和室友们精诚合作、勇敢体验,程序设计、力学、作图、机械装置……在这些课程中他们的兴趣不断得到开发,能力不断得到提升。“我印象最深的是程序设计课,我们自己决定能做什么”,在这门课上,黄融杰第一次开始用代码实现自己的想法,跑出了人生中的第一个小程序。这是汲取知识的过程,也是走向热爱之路,他意识到了自己的兴趣所在——编程。
黄融杰参与人工智能交流会讨论
一次偶然的机会,黄融杰加入了学校学生人工智能协会。在社团氛围的感染下,他开始尝试机器人开发,并对AI有了更深的了解。“AI当时虽然没有很火,但是它已经能帮我们完成目标检测,并且越来越流行”,人工智能学术研究开始在黄融杰心里埋下了种子。
黄融杰还与朋友们一起参加了“浙江大学中控杯机器人竞赛”。同学们分工明确,团结作战,黄融杰再次在软件开发上展现出了极大天赋,这也是他通往人工智能研究道路上的重要节点。
“就是要做没做过的事
浙大帮我实现挑战”
真正让黄融杰实现蜕变,踏上学术之路的是他在大二时期参加的“全国大学生数学建模竞赛”。“当时学校很鼓励学生参加,而且这样的比赛我从来都没参加过,它需要很强的逻辑能力,还需要极高的团队配合契合度,我觉得很有趣。”又是一次从零开始的全新尝试,黄融杰和在学生组织中认识的同学一起投身于比赛,拿下国赛省一等奖,并在随后的“美国大学生数学建模竞赛”中一举拿下一等奖的佳绩。
黄融杰(左二)与同学在一起
AI少年,在找寻到自己的道路后,便开始褪去稚嫩的外壳,迸发出一往无前的魄力和耀眼的光芒。定力,深潜,是黄融杰茁壮成长的营养剂,他将注意力收束,课堂上更加聚焦代码学习,课外专注于人工智能科研训练。在进行“基于雷达的手势识别”项目中,黄融杰可以为了一个功能从早到晚进行调试,反复一个月经历失败后仍不放弃,甚至会为了一个细节改动来到之江实验室寻求课题组博士生学长指导。大三结束时,他的成绩从大一大二的不甚突出上升到专业排名、综合排名双料第一。
进入大四,黄融杰凭借优异的成绩跨学科保研至软件学院,加入浙江大学人工智能研究所赵洲老师团队,该团队长期深耕于自然语言处理、计算机视觉和生成式人工智能领域,有着丰硕的成果。
“坚持自己的想法
浙大有片团结合作的热土”
不断尝试总会走出属于自己的路。在浙大全链条培养的土壤上,黄融杰得以早早进入了实验室,站在“巨人的肩膀”上,在人工智能领域的天赋得到充分引导和发展。
黄融杰(左四)和课题组一起参加学术交流会议
进入实验室后,研究方向是什么?人工智能研究领域重要分支——语音/音频生成。这是新兴领域,国内研究的人并不多;也是重要领域,国内的研究还落后于国外。这激发了黄融杰的斗志,又开始了一场从零开始的探索。以歌声合成为研究方向,在实验室师兄的指导下,黄融杰在大四就顺利发表第一篇CCF-A类会议论文。此后,他不局限于眼前收获,而是开始认真思考自己应当专攻的具体研究领域。深思熟虑后,他敏锐地将目光锁定在语音音乐生成模型,多模态语言处理等,这些技术在当下十分火爆的GPT-4、Sora等生成式人工智能中均发挥着重要作用。
将研究做得专精深,也意味着更多更深层次的问题需要解决。“在撰写第二篇论文时其实是不太顺利的,当时心态也有了很大的变化。”黄融杰没有在阻碍面前退缩,他积极调整心态,不断改善开发效果,对论文进行修改,并不断投稿。这条路上,黄融杰并不孤单,“我们的导师会给我们做表率。他会在实验室待到很晚,同时也会指导同学们做研究。” 富有经验的导师带来行业最新最前沿的研究成果,不同研究方向的同学带来新视野......“当你的研究思路受限,整个课题组都可以加入一起讨论”,科学的浪花,知识的涟漪不断在实验室泛起。
黄融杰(右一)与学长参与人工智能会议
在这样的氛围下,黄融杰的第二篇论文顺利发表。在这之后他势如破竹,三年时间里,在NeurIPS/ICML/ICLR/ACL等CCF-A类会议中发表十余篇文章,GitHub 星标10k+,谷歌学术中被引用近千次。在致力于减少不同语言使用者间的沟通障碍方面,黄融杰的这些研究发挥了重要作用。他专注于开发创新的直接语音到语音的翻译系统,其中包括TranSpeech 和AV-TranSpeech 这两项突破性技术。这显著降低了在不同语言环境中的沟通障碍,为来自不同文化和语言背景的人们提供了一个共享、理解和交流的平台,并相继在腾讯、字节跳动、华为等企业中得到应用。黄融杰正朝着打造能说会写的人工智能体不断前进。
在时代的号召与同道之人的互励下,黄融杰躬行未知,致力于填补空白落后领域。从刚进入大学的迷茫又富有探索欲望的学子,成长为深耕AI领域的少年,他还将继续在人工智能领域发光发热,踔厉向前。
1.探索自己喜欢的方向。通过学校全面的通识教育体系,探索自己喜欢、想要投身的领域,兴趣才是科研最持久的动力。
2.阅读大量高质量文献。通过阅读领域内优秀论文,可以了解领域内前沿和通用的研究方法。
3.加速迭代并记录思路。实验做法和自己的想法要相互作用,让想法和做法相互促进融合、齐头并进。比如,代码编写的过程中,如果有新的想法就应该及时进行调整,通过代码进行实现,验证自己的想法。
4.提升文章的写作能力。当在选定的领域内钻研一段时间之后,会做出一些成果。及时学习论文写作规范及方法,将研究成果更好地展现也是重要的技巧。
4.这个大展在意大利开幕!5.浙大学子接力救援,好样的!6.课间休息时间,学生却在教室里排起了长队……