查看原文
其他

这个 17 岁少年凭什么成为“顶级大师”?

费棋 极客宝宝 2019-03-31

编译整理 | 费棋

编辑 | 阿司匹林

出品 | AI科技大本营

Kaggle,这是个坐拥 100 万会员的数据建模和数据分析竞赛平台,目前已被 Google 收购。企业和研究者可在这个平台上发布数据,而统计学者和数据挖掘专家则可以进行竞赛以得到最好的模型。

最近,该平台再次成就了一位名叫 Mikel Bober-Irizar 的少年——刷新了他在 Competitions 中的排名,第 31 位,晋级为最高级的 Grandmaster(其他等级依次为 Masters, Experts, Contributors, Novices),达到这一级别的在全球范围内共有 122 人。更让人津津乐道的是,他是个年仅 17 岁的英国高中生。

去年 8 月,Mikel 就成为了 Kaggle 的 Competitions, Kernels 和 Discussion 三项排行榜中首位达到 Master 级别的会员,而且在 Kernels 和 Discussion 中的排名位列前 10 。

凭借其在 Kaggle 社区中的表现,Mikel 甚至成为了 AI 社区中一颗冉冉升起的新星。



在其主页上,他的简介是对机器学习、硬件、虚拟现实、网络和加密货币感兴趣,喜欢打破常规。

在过去几年里,Mikel 花了很多时间在互联网上研究在机器学习和人工智能方面的编程技能,几乎完全属于自学成才。

说起他怎么解决学习面临的困难,Mikel 称只通过 Google 搜索来尝试寻找解决问题的方案,即便网上有很多免费课程,但他也没有通过参加课程进行系统学习。当他在网上了解到 Kaggle 后,他想的是为什么不试试呢?

不过 Mikel 并没有将他全部精力投入到 Kaggle 上,他只将自己描述为“决策树拥抱者,喜欢数据,喜欢挑战。”


01 

在比赛中“打怪升级”


短期内历经各种比赛的磨砺后,Mikel 在 Kaggle 中的排名越来越高。在 2016 年 11 月的博世生产线性能挑战赛中,他们的 4 人团队在 1373 支参赛队伍中排名第 5。他们通过使用生产线上 200 万件产品和 5000 个传感器的数据构建了一种算法,以预测博世工厂的产品中存在的故障。

他们的解决方案是使用复杂的特征工程来捕获高维度训练数据中的模式,并在大型的 XGBoost 模型集合中使用,最终获得了 0.51173 的分数。

而在 2016 年 7 月,他们的团队在 Avito 重复广告检测比赛中与 548 个团队竞争获得了第 2 名。他们尝试构建了一个模型,通过大规模执行文本挖掘和图像处理,可以准确地检测同一产品的重复广告。他们的模型还广泛使用深度神经网络和梯度增强来实现这一结果。最终,他们的模型得分为 95.3%,而 Avito 的内部基线为 90.4%。

2017 年,他帮助创建了一种使用计算机视觉技术分析 800 万个 YouTube 视频以创建准确标签的算法。他的队伍在 650 支队伍中排名第 7,这引起了 Google 的注意。

该项目的目标是使用 AI 和机器学习来扫描 YouTube 视频,并确定将标签放在对应的视频上。这是一个非常具有挑战性的计算机视觉技术问题,因为这需要了解视频和上下文中的内容以选择正确的标签。这种标记方式在照片上就很难(如 Google 和 Facebook 所做的那样),不过由于缺乏用来训练 AI 的公共数据集,视频面临的是一个更大的挑战。

Mikel 的团队则编写了自己的神经网络,通过已提供的一套训练视频来训练算法,然后可以应用在新视频上。当然,由于涉及到大量的计算(数据集本身有 8TB),这也算是他们遇到的一个挑战。


02

想从事 AI 行业


Mikel 很想继续从事人工智能行业,但他首先需要从高中毕业。不过,他在高中时期的实习履历,无疑会对他以后的发展大有裨益。

在 2016 年 9 月 – 2017 年 6 月 (10 个月),他被 Udacity 选中参加自动驾驶汽车车工程师 Nanodegree 的学员(11,000 名申请者中共有 500 名),并成为该课程的 5 名学生领袖之一。

2017 年 7 月 – 2017 年 7 月,参与了 Voyage 自动驾驶汽车中部署的各种硬件和软件项目。

2017 年 9 月 – 2018 年 7 月 (11 个月),担任 EduNow 这家创业公司的技术总监,从头开始帮助构建 EduNow 平台,专注于后端和服务器开发。

现在,Mikel 正在剑桥的三菱电机研究实验室进行为期三个月的实习,研究方向是图像合成和表示学习。

他的目标是考上麻省理工学院、加州大学伯克利分校或者剑桥大学。而且他有自知之明,尽管知道自己在 AI 研究中的天赋,但现在仍然有很多知识盲区。

“我不知道算法背后的数学知识,就实际使用它而言,我认为对它的运作方式找到一个合理的解释很重要。即使我不能从头开始写,也能知道它做了什么,这有助于我理解它可能存在的其他价值。”

相关链接:

https://mashable.com/2017/07/28/16-year-old-ai-genius/#QprEihGNliqL

https://www.linkedin.com/in/mikel-bober-irizar-a46b7230


喜欢就点击“好看”吧!

    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存