AI巨头Facebook悄悄参赛却被完虐，《星际争霸》是简单的推理游戏还是AI试金石？

原创 2017-10-10 DeepTech深科技

谷歌AI是否能征服星际争霸？DT君在明年1月举办的全球新兴科技峰会，谷歌 DeepMind 研究科学家、《星际争霸》AI计划负责人 Oriol Vinyals 将发表主题演讲。预知详情，请点击图片！

上周日，由美国人工智能协会（AAAI）所赞助的、第十三届人工智能和交互数字娱乐大会（Conference on Artificial Intelligence and Interactive Digital Entertainment 简称 AIIDE'17）举办的星际争霸 AI 比赛闭幕了。

本届比赛的亮点莫过于 Facebook 的参赛：本届一个叫 CherryPi 的星际争霸 AI 是由 8 名 Facebook 人工智能研究实验室（FAIR Facebook AI Research Lab）的员工和相关人员创造的。不过，比 Facebook 毫无声息的参赛更惊人的是，比赛的结果显示 Facebook 竟然被超越了：本届前三名全是独立的发烧友，而 CherryPi 连前五都没进，只是第六名。

仅仅从 Facebook 参加这个著名的比赛这一举动来看，科技巨头争夺“XX 智力游戏首胜人类冠军”这一头衔已经越来越激烈化了。先有 IBM 的“深蓝”计算机于 1997 年战胜国际象棋世界冠军，后有谷歌的 AlphaGo 于去年战胜围棋世界冠军。而现在，人工智能界的下一个目标则是即时战略游戏了。在今年 8 月，谷歌旗下人工智能公司（也是 AlphaGo 的创造者）DeepMind 就曾公开宣布，星际争霸 2 将会是其下一个目标。

图丨 DeepMind 与 8 月 9 日在其技术博客上公开宣布将与暴雪游戏合作，开发星际争霸 2 的 AI 机器学习工具组：SC2LE（星际 2 学习环境）

而之所选择星际争霸 2，也是因为其作为即时战略游戏中的“即时”和“战略”恰恰是人工智能在创新之路上需要挑战的。

就拿“即时”来说。或许对于人类，星际 2 的那 300 多个基础操作的“操作空间”（Action Space）并不庞大。但是对于机器，星际 2 的分级操作，外加“升科技”所带来指令的变化，再加上地图的体积，其操作空间是无穷大的。比如“农民建房子”这个简单的行动就有 6 个不同的步骤：点击滑动鼠标选择单位，B 选择建造，S 选择供给站，滑动鼠标选择位置，点击建造。仅在一个 84x84 的屏幕上，机器的操作空间有大约 1 亿个可能的操作。面对着如此大的操作量，机器该如何有效的进行即时控制正是 DeepMind 和暴雪所推出的工具试图解决的。

图丨来自 DeepMind 官博的农民建房子动图

DeepMind 表示，其 PySC2 环境包装可以为 AI 玩家提供一个“灵活又简单的界面”。在初版的工具中，游戏中的每个元素，比如每种单位、血量、地图上可见的部分等都会拥有一个单独的特征层。这意味着研究人员们可以针对不同的特征（元素）进行开发和优化，有效的提高 AI 玩家的即时控制能力。

当然，星际 2 还有一些难题暂时没有技术手段解决，比如“战略”。作为一个战略游戏，很多时候，玩家做出的决定往往只会在十几甚至几十分钟之后才会产生效果。因此，AI 玩家需要学会计划。

而虽然 AIIDE 的比赛所使用的是星际争霸 1，但这并不意味着它更简单。毕竟这款游戏所要求的核心技术与星际争霸 2 无差。目前，由著名人工智能学者、卷积神经网络发明人 Yann Lecun 所带领、旗下有着超过 150 名顶尖研究员的 Facebook 人工智能研究实验室一共只发表了三篇跟星际争霸有关的论文。不过，虽然 Facebook 没有任何公开的宣言，但是很显然他们并不打算将“星际争霸 AI 冠军”这一成就拱手相让。

图丨 Facebook 人工智能实验室主任 Yann Lecun

众所周知，扎克伯格曾提过 Facebook 的未来有三个主要的发展方向，：连接世界、人工智能和虚拟现实。而毫无疑问， Facebook 人工智能研究实验室就承担了人工智能的重任，他们并没有近期产品的开发压力，专注于基础科学和长期方向上的研究。而且，为了争夺在人工智能领域的制高点，Facebook 还宣布对 AI 领域的投资额提高三倍，除此以外，Facebook 旗下目前还有由机器学习专家 Joaquin Candela 领导的应用机器学习部门（AML），他们对人工智能的重视由此可见一斑。

但是从本届比赛的成绩来看，Facebook“争霸”之路似乎没有那么简单。本届的冠军软件——ZZZKBot——是由来自澳大利亚珀斯的 Chris Coxe、一位软件开发者独自完成的。他曾在最终成绩揭晓前一天表示“它本来是一个概念验证。它的源代码挺烂的。”（当然，它和所有星际争霸 AI 一样，人类专业选手，甚至技术好的业余选手都可以将它轻易战胜。）

不过，Facebook 和谷歌对于星际争霸 AI 的思路与独立发烧友的思路并不一样。目前领先的星际争霸 AI 都是基于开发者人工编写的规则和策略。就拿本届的冠军来说，Coxe 表示，ZZZKBot 中最强大的功能也只是一个简单的学习功能：它可以针对一个对手尝试多个事先编好的策略，找出其中最有效的策略，然后在复赛中直接采取这个策略。

科技巨头们则计划在其星际争霸 AI 中注重使用机器学习，让它们可以通过观察海量的比赛数据和进行尝试后，自主创造出策略。而这也是让谷歌 AlphaGo 登顶的核心技术。（有趣的是，Facebook 并没有在 CherryPi 中采取这一方式。）

不过，随着谷歌和 Facebook 等技术巨头陆续进场，由技术发烧友独自开发出可以获胜的星际争霸 AI 软件的好日子不会有多久了。至于人类世界冠军，按照人工智能技术井喷式的发展速度，估计也不会有太多的优势了。

-End-

参考：https://sites.google.com/view/aiide2017/

https://www.cs.mun.ca/~dchurchill/starcraftaicomp/

https://www.wired.com/story/facebook-quietly-enters-starcraft-war-for-ai-bots-and-loses/

反向激励，在加速这个社会的黑化

俄乌打仗，中国损失惨重，高达数千亿美元，未来损失不可估量

重磅突发！中国银行，中国工商银行、建设银行、中信银行、兴业银行，停止接受来自俄罗斯的人民币付款！

强制购买公墓，湖北随州太随意

钢琴《偏偏喜欢你》：有些人一旦遇见，便一眼万年