暴雪想把《星际争霸 2》变成 AI 实验室

2017-08-11 通达智慧

「围棋上帝」

AlphaGo 在战胜柯洁之后便宣布退役，成为围棋界难以逾越的一座高峰。而其缔造者 DeepMind 公司早就为人工智能准备了下一个目标：《星际争霸 2》（StarCraft）。

《星际争霸 2》

是由暴雪娱乐（Blizzard Entertainment）在 2010 年推出的即时战略游戏，游戏剧情主要讲述了在遥远未来，一场围绕银河系中心的种族之战。由于游戏极其考验玩家对资源的运营策略，因此也被视为 AI 研究的突破点之一。

《星际争霸 2》游戏画面

DeepMind 科学家奥利奥尔 · 温雅尔斯（Oriol Vinyals）就曾是顶级的《星际争霸》玩家之一，他曾提出这样一个观点：

玩《星际争霸》的 AI 需要有效地利用记忆力，能够进行长期战略规划，并根据新的信息不断做出调整。如果我们开发的 AI 系统能掌握如此复杂多变的技能，那么最终这些技术也将被用于服务现实世界。

因此，早在 2016 年 11 月份，DeepMind 就宣布与暴雪娱乐合作，将针对《星际争霸 2》展开一系列的研究实验。而到了 2017 年 8 月 9 日，暴雪与 DeepMind 公开了这个项目的初步研究成果，将开放《星际争霸 2》作为 AI 研究环境。这个人工智能环境包将包括：

在游戏中为开发者和研究员加入了人工智能 API，并且首次支持 Linux 环境

新增一个匿名游戏回放数据库，并且在未来的几周里，游戏回放数据将从 65000 份增加到 50 万份

加入 DeepMind 开源工具集 PySC2，让研究员可以轻松地调用暴雪底层的功能 API

新增一系列的 RL 迷你游戏，从而让研究员能够测试 AI 在特定任务下的性能

《星际争霸 2》中训练 AI 的小游戏

实际上，《星际争霸》游戏里一直都有不同难度的 AI 存在，只不过这些 AI 是通过访问游戏后台、采集全局数据来与玩家作斗争，玩家和 AI 一开始就不在同一条起跑线上。而 DeepMind 的最终目的，是训练一个能在同等条件下与人类进行竞争的 AI，这才是该项目最具挑战性的地方。

一些人类习以为常的动作，要让 AI 来做就得经过不断地训练。在接受 The Verge 采访时，DeepMind 科学家奥利奥尔举过这么一个例子：

在游戏中有一个名为「战争迷雾」的机制，黑雾笼罩了整个地图，玩家需要经过不断地探索才能找出敌人。因此，对于 AI 来说，它必须记住「我曾在这里见过某个单位，但现在这个单位不见了，所以我要回去侦查一下，看看附近有没有敌人的基地」。

对于人类选手来说，这是一个常识。但对于人工智能来说，这是一个值得学习的挑战。这是《星际争霸》与国际象棋最不同的地方，玩国际象棋的时候，双方的环境一目了然，但在《星际争霸》里，玩家无论何时都要了解自己周边的环境。

AI 眼中的《星际争霸 2》

目前，人工智能对《星际争霸》的探索还处在非常早期的阶段，不仅需要训练各种「常识」，而且在面临突发情况时的应变能力也有所不足（AlphaGo 就曾经下棋下到崩溃）。

这也就难怪 24 岁的顶级《星际争霸 2》电竞选手 Byun Hyun Woo 敢大放厥词了：

至少在我的有生之年，我不认为 AI 能够打败职业玩家。

AlphaGo 只用了一年就超越了柯洁，人工智能问鼎《星际争霸 2》世界冠军，要几年？

源自：爱范儿