查看原文
其他

00后大学生勇闯AI赛道,年度布道师梁明健的焦虑与探索

开源星风采 OpenMMLab 2024-04-23

【开源星风采】栏目介绍


欢迎来到全新栏目【开源星风采】!来这里,聆听社区小伙伴成长背后的故事,见证他们每一次进步的瞬间!


在 OpenMMLab 社区,每一位参与社区建设的小伙伴都是最耀眼的星星,引领着社区朝着更加光明的未来迈进!我们将定期专访做出贡献的社区小伙伴,希望 TA 与 OpenMMLab 的故事可以被更多人看到,也希望有更多的小伙伴参与到社区建设中来。


本期我们很荣幸为大家介绍社区 Committer——梁明健(昵称:明仔,GitHub ID:matrixgame2018),一起和他聊聊社区那点事!




第一批 00 后已经大学毕业了,网络上时不时冒出“ 00 后整顿职场”这样的词条,网友对这届 00 后似乎充满了期待。


梁明健(昵称:明仔 GitHub ID:matrixgame2018)也是毕业大军的一员 ,他决定继续从事热爱的科研工作,正在等待合适的机会。他的大学经历充斥着热血和奋斗,当然也不乏颓丧,和很多处于迷茫中的年轻人一样。


他早早地定下了要进入 AI 行业的目标。为此他经历过与近百人竞争转专业名额、补修 26 门课程、论文被拒等多种挑战,也体会过在本科期间就发了 3 篇文章、在顶尖实验室做科研助理的喜悦。


对于很多人而言,选择科研也是选择了一条孤独的路。在这条漫漫长路中,梁明健的探索伴随着自省和目标方向的调整,而对知识与共鸣的渴望贯穿始终,这也是他成为 OpenMMLab 核心贡献者的原因。


在这里,他获得了技术能力的提升,学校以外的广阔视野,也成为了由社区小伙伴票选的“年度布道师”。在他看来,更值得一提的是,他认识了一群同路人。


自嘲five但并未躺平


梁明健在知乎平台(ID:matrix明仔)有三千多个粉丝、八千多次赞同。他分享自己的科研日常,也关注着 AI 领域的前沿研究。


在他发布的《废物的大学生活!》这篇文章中,梁明健记述了自己本科期间的成长轨迹,并不顺利但却从未躺平,也让我们看见了他的焦虑、迷茫和思索。他最初读化学专业,大一时他虽然经常熬夜做实验,最终 GPA 也并不理想,他这样描述自己决定转专业的心路历程:“没有兴趣驱动下的高压学习,并不能实现自我价值,才华也不能得到完全的释放。于是我决心改变现状,寻找适合我发展的方向。”


一番思索后,他认为人工智能方向比较热门,因此决定转向这个领域。但热门专业的转专业考核竞争异常激烈,只有 2 个名额,他凭借努力成为了通过考核的幸运儿。同时期他也恰巧通过了面试加入到了学校的科研团队。跟随导师、师兄,系统地开展深度学习、计算机视觉、机器人运动控制等课题的研究和学习。


“我本科最大的转折点可能是跟着实验室投了第一篇论文。那时候就觉得我能发出一些成果出来,我能被大家认可,从那以后我就一门心思去做 AI 相关的研究。” 大三上学期,他与师兄共同研究实验的课题:利用注意力机制改善扫地机器人 Grid Map 正负样本的分类情况,经过多次的实验,取得不错的效果,比当时 SOTA 指标高出接近5%点。梁明健形容他当时觉得这是“离实现自己科研梦想最近的一次”,他坚定自信一定能够走出一条新道路。


但是由于当时并未提供开源代码,而且论文写作技术不够火候,这篇文章在 ICRA 2021 年被拒。“雪上加霜的是,转到新专业需要补修的课程多达 26 门,社团方面也出现了许多矛盾,他称自己并没有时间去悲伤,而是努力在社团,课题,学习中找到相对应的平衡点。


2021 年初,他接到了 RGB-T 的新课题,“这也是改变我人生的一次课题研究”。吸收之前的经验,他更着重于文章前期的 Research 工作,也由于前期的积累,他的文章在一个月的时间内就大幅超过 baseline, 方法也得到了当前的SOTA结果。后续的作图以及写作的部分,他都更有经验与信心,最后完成了的文章也中稿了 IROS 2021。


2022 年下旬,明仔在社区闲聊的时候,受到了群内大佬们的一些观点的启发,通过对普通的注意力模块的重新设计,得到一个更适用于跨模态任务上的显式注意力模块(EAEF)。明仔马上将得到的模块用于对 FEANet 进行改进和整合创新,与此同时也在 MMYOLO 的帮助下实现了EAEF模块在 RGB-T 目标检测任务上的应用。最后,在老师、同学以及 OpenMMLab 社区大佬的支持下,在 2023 年的 5 月,产出的文章中稿了 IEEE RAL。



从大学开始经营知乎帐号,梁明健说自己一开始做知乎主要是出于一种强烈的表达欲,“我真的很想有些东西想说,有时师兄比较忙,我的想法找不到人交流”。想要找到志同道合的人,一同更深入地探讨和解决问题,正是这种渴望让他加入了 OpenMMLab 。



从白嫖玩家到社区开发者


“我是因为 MMDetection 的一些使用问题加入的社群,后续想找实习是一个原因,除此之外我也想在社群中找到一些大佬讨论问题。”梁明健说自己在社区的日常就是经常在“水群”,有时候会帮助大家解决代码或者使用过程中的一些 issues,也会和大家讨论一些发 paper 的 idea,以及“锐评”一些论文。


他表示自己做研究最初是比较糊涂的,但接触了一些算法库后,他便去系统地了解了一些知识。他在 OpenMMLab 社区中学到了很多关于整套框架和算法库的使用方式,可以帮助他更好地应对新的工作挑战。


社群内的运营人员将 PR 难度进行了星级划分,他最开始接的都是一星左右的,一周内就可以解决的 PR 任务,陆陆续续利用零散时间的去改这些东西。


随着时间的推移,梁明健逐渐从简单的操作任务转向更具挑战性的任务。他开始参与一些复杂的算法库维护工作,包括修复 bug、翻译文档以及为算法库编写新功能,如 MMagic 修复 typo、MMYOLO 的 pipeline 可视化。在这些工作中,梁明健不断提升自己的技术能力,为社区做出了许多贡献。


在梁明健看来,这些工作对他自身的成长有一定帮助。通过参与社区的各项工作,他不仅锻炼了自己的解决问题的能力,还提高了对框架的理解和使用能力。


梁明健参与 OpenMMLab 多模态开发者线下聚会


在 AI 实战营活动中, 他会在群里给新手答疑,也成为了代理群主。一年后,凭借着卓越的贡献值和活跃度,他成了社区的“红人”,拿到了两次的月度活跃之星的称号。


“社区也见证了我的成长,我的两次文章在社区开放麦和线下的交流活动也得到了展示,也借助这些机会吸了很多同行的加入,壮大了我们这个领域的研究力量。”


去年 1 月,梁明健如愿以偿拿到了 OpenMMLab 团队的实习 offer,可是因为 3 月份的上海疫情,这个计划被一直搁置直到被无奈取消。“但是还好,OpenMMLab 的伙伴们一直都很照顾我,让我活跃在社区的交流群中。在交流群我和大佬们学到了很多东西,也给我自己做的一些工作带来了很多启发。”





少年闯关升级进行时


回顾过去的大学生活,他这样描述:“四年来,我不断地寻找自己应该要去的方向,令人悲伤的是我似乎选择的道路离自己想要达到的目标越来越远。”


有时事与愿违是生活的常态,但好在梁明健依然在焦虑中反省和前进。交流中他提到了自己自学的困惑,自学缺乏系统培训的过程,只能自己去看,这可能会导致缺乏对一些问题的整体了解。他认为在 OpenMMLab 社区的经历提升了他自己的影响力,更多人认识了他,他认识了更多可以分享 idea 的人。



梁明健参与 OpenMMLab 社区开放麦活动



对于做科研方面,梁明健表示灵感主要来源于平时阅读文章和自己的一些想法。他认为 OpenMMLab 社区中一些具有工业界背景的人知道有用的信息或遇到的实际问题,这些信息或问题的提出对他来说非常珍贵。“因为我们平时在待在实验室,我待在宿舍里面看论文是不会知道这些问题。业界人士做过实际的一些测试,他们才会知道有这些问题。


一路走来,梁明健肯定称不上是顺风顺水。但强大的内驱力,始终激励着他去征服下一道关卡。他表示未来还想继续在科研领域走一段时间,把该发的文章发了、该做的课题做了,积累经验后再想之后该怎么办。“我自己觉得应该给自己表扬的是,我还是完成了我的学业顺利毕业,我也有了自己的文章,也多了很多可以调侃两句的经历。”


根据明仔透露,他正在研究和开发结合上大语言模型的多模态融合感知新架构,其中书生:浦语(InternLM)就是他的首选之一。明仔觉得,大家想要做一些比较简单的小应用是可以勇敢上手的。而且 CVPR 在即,接入 InternLM 做一做多模态的图文理解工作,特别是多模态结合这些卷到起飞的视觉任务也是很值得期待的。就算发不了 paper,用一张 3090 即可微调自己的专属模型想想也是令人激动的。此外当前也有各种结合了大语言模型的 embodied 方向工作,各种解释具身智能行为的大语言模型部分也可以相应的替换成 InternLM,想必这其中还是有很大的深挖研究的空间。


不放弃,便有新的生机。正如去年 9 月,他和学长将 ICRA 2021 年被拒稿的文章针对性的修改后,重新投到 ICRA2022 会议上。经过不断的努力,他们的文章也得到了评审们的认可,最后被接收。


“经过长期的挫折和挣扎,我对自己的未来生活有了一个模糊的概念:就是发好文章,做一些有趣的,值得大家 Follow 的方向性的工作。”




年少可期,静待花开。我们相信梁明健的未来还有更多的可能性,也期待更多有梦想的人,在 OpenMMLab 社区播撒知识、成就辉煌。


一人独行不如三人成群,来加入 MMSIG ,成为明星算法库 OpenMMLab 的 Contributor 吧!




MMYOLO一站式上手指南,从安装、训练到模型优化全面覆盖

2023-11-09

仅需一块3090显卡,高效部署InternLM-20B模型

2023-11-08

OpenAI首届开发者大会,短短45分钟,如何再次让AI圈一夜未眠

2023-11-07


继续滑动看下一个
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存