OpenAI 启动迁移学习比赛，一起来玩刺猬索尼克游戏吧

Original 2018-04-07 思颖 AI研习社

雷锋网 AI 研习社按：日前，OpenAI 启动一项迁移学习比赛，这一比赛为期两个月（4 月 5 日-6 月 5 日），参赛者需要让智能体来玩风靡一时的 Sonic The Hedgehog（刺猬索尼克）游戏。这一比赛将会评出三大奖项，参赛者有机会获得丰厚奖励，并与 OpenAI 共同撰写比赛技术文档。

AI 研习社将在下文介绍关于比赛的详细信息。

在 OpenAI 官网可以看到，这次比赛将会衡量强化学习算法基于以往经验的泛化能力。“在典型的强化学习研究中，算法是在相同环境下进行训练的，这使得算法擅长记忆，并有很多超参数。此次竞赛将会在电子游戏关卡中测试算法——参赛选手需要让智能体玩 Sonic The Hedgehog（刺猬索尼克）游戏，用于测试的游戏关卡此前从没出现过。

此次比赛基于 Gym Retro 平台。此外，为了助于大家比赛，OpenAI 46 28949 46 13311 0 0 2451 0 0:00:11 0:00:05 0:00:06 2538开源 retro-baselines，这一工具展示了如何在比赛任务中运行多个强化学习算法。比赛为期两个月（4 月 5 日-6 月 5 日），获胜者将得到一些很棒的奖品。

以下是参赛详情：

参赛者训练智能体（或者编写脚本）来玩 Sonic The Hedgehog 游戏；
参赛者将智能体打包到 Docker 容器提交；
OpenAI 对提交的智能体进行一套秘密测试；
排行榜上会出现智能体的得分情况。

下面的图解对这个过程进行了详细说明。

OpenAI 表示，强化学习的下一步是利用以往经验快速在新环境中学习。目前的算法很容易记忆，但不能很好地适应新的情况。虽然这次比赛的重点是电子游戏，但他们希望获胜的技术能适用于更广泛的领域。

比赛规则如下：

一个团队只能用一个帐户；
可以与其他团队分享短代码片段或指导代码，但不能分享完整或部分解决方案；
参赛选手只能隶属于一个团队。

下面是对「最佳成绩奖」（Best Score）和「最佳代码奖」（Best Writeup）的介绍。要想争夺这两类奖项，参赛者必须在比赛最后阶段将自己提交的智能体开源。每类奖项的前三名都将获得奖励。

此外，还有额外的「最佳支持奖」（Best Supporting Materials）。

所有获奖者将受邀与 OpenAI 一起完成这一比赛的技术报告。

比赛规则页面：https://contest.openai.com/details

Leaderboard 页面：https://contest.openai.com/leaderboard

Benchmark 详细描述：https://s3-us-west-2.amazonaws.com/openai-assets/research-covers/retro-contest/gotta_learn_fast_report.pdf

雷锋网 AI 研习社编译整理。

via：https://contest.openai.com

4 月 AI 求职季

8 大明星企业

10 场分享盛宴

20 小时独门秘籍

4.10-4.19，我们准时相约！

新人福利

关注 AI 研习社（okweiwu），回复 1 领取

【超过 1000G 神经网络 / AI / 大数据资料】

OpenAI 开源最新工具包，模型增大 10 倍只需额外增加 20% 计算时间

▼▼▼

反向激励，在加速这个社会的黑化

2024【公共营养师】报名通道已开启，不限学历，23岁及以上可报!还能领2000补贴

Wealth | 中国成本轮金价涨势的前沿和中心

父亲出轨后，母亲对父亲实施了她的精确打击 | 二湘空间

多人约P大瓜！旧爱怀孕上线开撕，曝聊天记录！小白龙报警，官宣恋情！