喜讯 | 香港中文大学(深圳)四名本科生入围安永2021数据科学挑战赛全球总决赛
数据科学挑战赛
安永
从数据开始
让世界变得更好
摘要
2021年4月,香港中文大学(深圳)4名本科生参加了安永2021 Better Working World数据科学挑战赛,在Challenge 1(技术任务挑战赛1)中入选为global finalists(全球决赛名单)。他们分别是理工学院2019级学生韩肇威、刘子凡,数据科学学院2019级学生何舒晴,经管学院2019级学生匡博文。
安永Better Working World数据科学挑战赛是一项全球性竞赛,面向志在取得卓越成就的数据科学等相关专业学生举办,期待参赛者能针对实际问题进行数据分析,得出有助于建设更美好的商业世界的方案。
此次比赛历时三个多月,有超过8500名来自全球115个国家和地区的大学生和年轻数据科学专家参与。经过层层筛选,最终产生了12组global finalists,仅有两组来自中国。最终的global winner(全球冠军)和global runners-up(全球亚军)将在这12组global finalists中产生并揭晓,颁奖典礼将于2021年7月20日在伦敦线上举行。
01
About the challenge
关于这次挑战赛,我们的初衷
安永的数据挑战赛一直关注于实际问题,旨在用数据分析等手段来解决实际问题,帮助改善生活、拯救生命。2020年澳大利亚山火是一个全球性的灾难,对于火灾的预防和控制再次成为了大家关注的焦点。
我们几个对于图像识别和图像处理非常感兴趣,想要借本次比赛锻炼能力,深入了解一些传统和现代的图像处理方法,同时体验比赛的乐趣。作为香港中文大学(深圳)的大学生,我们也非常希望能够利用我们在学校所学技能和知识来帮助改变世界,build a better working world.
02
What we learnt from it
求知路漫漫,所学即所得
我们选择的技术任务挑战 Challenge 1: 参赛者根据提供的129张航空拍摄的火灾红外线扫描成像图,提取坐标及相关信息,处理不同种复杂情况,通过各种机器学习及其他方法建立模型,最后对5张红外线图像进行着火情况预测。
这次比赛主办方为我们提供了服务器,并且不限制我们使用任何方法,看似自由度非常高,可实际上这才是真正的难点。本次比赛的训练集只有129张图片,图片的大小非常不均匀,再加上像素值极度不均衡的情况,复现出的传统模型的结果非常差,对于我们四个大二学生来说确实是一个不小的挑战。我们意识到:我们面临的是一个非常复杂的真实世界中的问题,而现有模型都是有针对性的,有局限性的。我们不能把比赛看成是模型的复现,而是要有针对性的,结合比赛实际情况设计出自己的方法,再与现有模型做对比、调整,最终设计出一个不仅可行,更要在现实中可以实现的模型。通过充分利用比赛中的信息,我们分析出了火灾区域的多边形集群特征,决定采用预处理+集群+多边形拟合的方法。在第一次测试这个方法时,我们就取得了之前从未有过的好成绩,这更加坚定了我们对于这一思路的信心。接下来,就是不断地讨论建模优化完善我们的这个模型,最终取得了令人满意的成绩。
这次比赛,我们最大的感受就是一个好的灵感往往来自之前不断地尝试,不断地失败。团队成员间的合作与彼此之间的信任都是我们坚持下去的源泉,最终取得这样的成绩还是多亏了我们四个人之间的精诚合作和不懈努力,希望未来继续加油,再创辉煌!
03
About us
关于我们,有无限的可能
韩肇威
2019级理工学院、逸夫书院
应用数学专业学生
高中毕业于深圳高级中学
平日里我是一个性格开朗爱交朋友的人,我特别喜爱自然风光和钓鱼。我总是对世界充满好奇心,好奇充满美感的数学世界,好奇功能强大的机器学习和人工智能。我很享受在好奇心的驱使下,去探索未知的领域。
刘子凡
2019级理工学院、逸夫书院
计算机工程专业学生
高中毕业于河北定州中学
我是一个心细内向的人,有趣的东西都会了解一些,但不求深入;比较喜欢方向是统计和机器学习。虽然内向,但是在团队中也会尽自己最大的努力发表观点。在课程、比赛和RA(做科研助理)等过程中收获了很多知识,也结交了很多朋友。
何舒晴
2019级数据科学学院、祥波书院
统计科学专业学生
高中毕业于深圳中学
我是一名有颗机器学习心的统计学子。日常沉迷乱涂乱画。努力做做研究,努力收获新知识。Never be afraid to try new things(无惧尝试新事物)!
匡博文
2019级经管学院、逸夫书院
经济科学专业学生
高中毕业于长沙市雅礼中学
业余时间喜欢打打羽毛球,去户外散散心。在下围棋爱好的影响下,自己对人工智能领域比较感兴趣。
There's always
something new going on here
图片与文字来源于参赛学生