查看原文
其他

一群钻研数据库的95后,如何跑完这场技术“马拉松” ?

蚂蚁集团 2023-09-28

5月10日,作为国内首个分布式数据库内核开发大赛,「OceanBase数据库大赛」落幕并公布获奖名单。


历时9个月,吸引国内外246所知名高校在内的1179支团队、近2000名数据库爱好者参赛,最终来自中国人民大学的参赛队伍夺得冠军。


大赛面向高校青年人才,由国内分布式数据库领导者OceanBase主办,联合华东师范大学、华中科技大学协办,聚集了国内十位顶尖科学家和专家教授担任评委,致力于探索国内分布式数据库领域产教融合的人才培养新模式。


数据库人才短缺是世界性难题,产教融合是培养年轻技术人的有效路径,联动高校并帮助产业培养人才,这正是OceanBase举办本次大赛的初衷。


OceanBase CTO杨传辉表示:“我们希望搭建这样一个数据库系统知识的练兵场,帮助年轻人树立信念、提供实践土壤,让他们为数据库技术创新贡献智慧和力量,成为改变国产数据库行业的下一代。”



我们也整理了一些有趣的细节,帮助你了解大赛背后的故事:

01

决战24小时

OceanBase


4月28日,来自中国人民大学、华东师范大学、中国电子科技大学等高校的20支队伍冲进决赛圈。


各队决胜的关键,是让数据和存储空间达到最完美的平衡,不仅是压缩数据,还要考虑各种性能。


最终决定胜负的考题,就是将一组300万行*48字节的数据,分为9列,存储为128M的数据文件,以及60M的索引文件。


过去,在学校实验室里,这样的数据量往往需要7到10天才能完成。现在,他们只有24个小时。




02

“未过4级”小队

OceanBase


最终获得冠军的队伍,是来自中国人民大学的“NoPassCET4”,翻译成中文,是“未过4级小队”。


在程序员圈子里,这是一个“老梗”——如果队伍里有人连大学英语4级都没过,那他肯定把所有时间都花在实验室里搞研究了。


“都这么努力了,还怕冠军不是你的吗?”看得出来,队长黄人煌的这句话里,有自嘲,也有自信。


这个队伍很特殊,三个小队里包括了一对情侣。


“跟神雕侠侣似的,他俩是侠侣,我是神雕”,爱读武侠小说的队员王元桢这样说。


图 | 中国人民大学NoPassCET 4 三人小组合照



03

为了导师D

OceanBase


来自电子科技大学的三人小组,曾在半年时间内,利用师兄师姐们打下的设计基础,实打实做出了大学数据库实验室内数据库的基本功能。


因为导师姓段,因此他们把队伍命名为“push_d_”,用那段时光鞭策自己,带着老师的期望前进。


三人看上去都有点内向,却是所有队伍里最“push”的那一支——他们是最快想到用非编码方式、对所有数据列实现直接压缩的队伍。


图 | 电子科技大学push_d_三人小组合照



04

打比赛,也打蚊子

OceanBase


“两只老虎吃萝卜”队伍,团队成员单海康、陈劲钢、李响分别在武汉、深圳两地,跨地合作。


决赛时因为场地简陋,团队打了一天比赛,也打了一夜蚊子。后来,又在比赛过程中遭遇实验室服务器宕机、分布式遭遇宕机。


但依靠默契的配合,他们在凌晨5点调通代码,拿到了三等奖。



05

一个人也要像一支队伍

OceanBase


华东师范大学的“lying_flat”队伍,名为躺平,实则全力以赴。队里只有贾宇航一人,独自扛起了一支队伍,他的生存理念是《死亡诗社》里的“seize the day”,把握当下。


最终在上海居家的他,拿到了季军,导师给出了这样的评价:“一人成队,对B+树优化分析较深入,且对列存有一定的了解,个人能力较强。”



06

技术人的马拉松

OceanBase


24小时的对决,并不是大赛的全部。从去年10月起,1179支团队,历时9个月,才有了最后这20支队伍走到决赛圈。


在技术人的称呼里,决赛还有另外一个名字:黑客松(hackathon),原指一种程序员聚集在一起、以紧密合作的形式编写程序或应用。


hackathon本身是一个合成词,它是由“编程(hack)”和“马拉松(marathon)”两部分组成,在这个数据库大赛里,它代表这最后的这24小时,也意味着这场考验恒心与耐力的技术长跑里,一群年轻人冲过了终点线。




07

不是终点,是起点

OceanBase


决赛也并非终点,而是这群年轻技术人的起点。


“NoPassCET4”的黄人煌,感受到数据库的重点之一在于平衡——平衡各方面的性能,达到综合表现更好的效果。


“东亚男儿队”的连薛超,过去做学术研究更关注性能,但实打实上手操作后,他发现除了性能,数据库生态也很重要。


“push_d_”的队员则在一边学习、一边比赛的过程,对数据库的理论和实践都有了更新的认识。


他们都相信:中国的数据库不会止步于此,而他们想为中国数据库的未来添砖加瓦。


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存