Obstacle Tower挑战赛第二轮比赛正式开始
今年2月,Unity启动了Obstacle Tower挑战赛的第一轮比赛。我们收到了来自350多个团队的2000多个参赛作品,第二轮比赛现在将正式开始。本文我们将介绍第二轮比赛的新版本Obstacle Tower环境。
我们向获得晋级资格的团队开启了Obstacle Tower挑战赛的第二轮比赛,他们需要训练和提交能够在新版本高塔中取得平均分为5分的代理。
为了迎接新一轮的比赛,我们发布了Obstacle Tower环境的2.0版本。我们把高塔中楼层的数量从25提升至100,较高楼层包含多种新的视觉风格、障碍、要解决的谜题和需要避开的敌人。针对研究AI,机器学习领域研究者,我们也大幅扩展了环境的可定制性。
虽然仅有晋级团队会进入到第二轮挑战赛,但我们鼓励所有人下载和尝试最新版本。在第二轮挑战赛结束后,我们计划开源Obstacle Tower环境。
下载Obstacle Tower Environment v2.0
https://github.com/Unity-Technologies/obstacle-tower-env
Obstacle Tower Environment v2.0
扩展可用楼层
我们扩展了Obstacle Tower环境,进一步推动代理处理全新未知的组成和楼层的要求。Obstacle Tower环境原始版本仅在高塔上有25个楼层,新版本有100个楼层。
新视觉风格
新的楼层包含三个全新视觉风格:工业风格、现代风格和未来风格。
新的障碍和干扰
早期楼层中的所有障碍和干扰依旧可用,我们在新的楼层提高了难度。包含:需要躲避的敌人、需要避开的干扰性电视机、带有盘旋路径的复杂楼层布局、以及每个楼层中具有额外平台挑战的大型房间。
通过重置参数自定义环境
在Obstacle Tower环境的第一版中,仅可以改变起始楼层和从Python API初始化的种子代码。
我们在Obstacle Tower环境V2.0版本中,扩展了可用参数的数量,这些参数可以在重置环境时自定义,其中包括修改一些内容的功能,例如:光照、视觉主题、楼层布局和高塔楼层中的房间内容。
基于第一轮比赛反馈的变化和改进
我们基于第一轮挑战赛用户的反馈来进行改动。许多反馈由参赛者提供的Bug和功能请求组成,而一些改动基于代理在游戏中学习获得最大化得分时发现的Bug。
我们收到的其中一个反馈是:解谜房间内重置按钮的位置并不直观。因此,我们现在分离出了这些房间内的方块,目标和重置按钮位置,从而使代理不会容易意外按到重置按钮。
Obstacle Tower环境即将开源
我们的目标是给研究人员和社区提供扩展Obstacle Tower环境的基础,进一步促进强化学习的研究,我们也希望扩展的重置参数可以给研究人员更大的灵活性。
Obstacle Tower环境的问题或讨论,请访问:
https://github.com/Unity-Technologies/obstacle-tower-env
了解更多关于Obstacle Tower环境的内容,请访问:
https://arxiv.org/abs/1902.01378
我们将在第二轮比赛结束时发布该Unity项目的完整源代码,期待看到用户以全新方法使用该环境。
最后,我们要感谢帮助我们改进Obstacle Tower环境V2.0的所有贡献和测试者。
第二轮比赛入围选手
当首次启动挑战赛时,我们不知道参赛者可以在高塔中取得怎样的成绩。我们惊喜的发现,最优秀的参赛作品的代理不仅可以掌握寻找和利用钥匙的机制,而且也掌握了推动方块解决谜题的机制。
祝贺进入第二轮比赛的团队,下面的表格是第二轮比赛入围名单。
小结
本次活动感谢Google Cloud平台(GCP)合作伙伴为合格团队提供GCP平台奖励,感谢AICrowd作为此次挑战赛的举办平台。如果你对Obstacle Tower挑战赛有任何问题,请咨询:OTC@unity3d.com。
如果你对机器学习和游戏的相关领域进行工作感兴趣,我们也正在招聘多个相关职位:
https://careers.unity.com/find-position?text=AI@Unity
更多机器学习相关内容分享,尽在Unity Connect平台(Connect.unity.com)。下载Unity Connect APP,请点击此处。
推荐阅读
Unity ML-Agents Toolkit v0.8:游戏训练再提速
Childish Gambino借助Unity为粉丝创造沉浸空间
点击“阅读原文”下载挑战赛环境
↓↓↓