查看原文
其他

人工智能不仅在下围棋,还在玩Minecraft

2017-01-05 Nature自然科研 Nature自然科研


电子游戏Minecraft很受小朋友们欢迎;现在,该游戏的一个版本也被用于测试人工智能程序。

Matthew Tostevin/Reuters


原文以Tech giants open virtual worlds to bevy of AI programs

发布在2016年12月14日的《自然》新闻上

原文作者:Davide Castelvecchi


人工智能算法能从浸入式3D电子游戏中学到很多东西。


在José Hernández-Orallo将Minecraft用于自己的研究之前,他对这款游戏已经熟悉很久了。Hernández-Orallo是西班牙瓦伦西亚理工大学的一位计算机科学家,他的工作是设计对机器智能进行基准测试的方法。他一开始知道Minecraft,是看自己的孩子在这个侧重于解决问题、而不是打倒怪兽的3D虚拟世界玩耍。


2014年,微软收购了Minecraft,其研究部门微软研究院向内部研究者提供了这个游戏的一个新版本,在这个版本中,计算机程序和个人都能探索和定制其中的3D环境。之后,微软邀请了一小群外部研究人员(包括Hernández-Orallo在内)下载这款游戏的机器友好型版本。去年7月,为了加快人工智能发展,微软开始向所有人免费开放该版本。


现在,其它公司也纷纷效仿微软的做法。12月3日,谷歌旗下的DeepMind公司对外开放了自己的3D虚拟世界DeepMind Lab,以供外部开发人员下载和定制。DeepMind Lab最初是DeepMind公司为了训练自己的AI程序而创造的。两天后,由企业家Elon Musk联合他人创立的研究公司OpenAI也发布了一个“元平台”,这个平台能让AI程序轻松地与几十个原本为人类设计的3D游戏,以及一些网络浏览器和智能手机应用交互。


这三项发布为研究者和软件开发人员提供了在前所未见的情景下测试程序的简易途径,还能让程序自我学习如何应对类似现实世界的新情境,以获取新的技能。“这样的环境将在人工智能的未来发展扮演非常重要的角色,”华盛顿大学的机器学习研究者Pedro Domingos说。



雅达利算法



几十年来,游戏一直是人工智能的试验场,但人工智能算法一般按照预定义的策略玩游戏。近年来,焦点转向了可以从自身经验中学习的机器。2015年初,DeepMind公布了一种会自学的算法。在未被告知游戏目标的情况下,这种算法通过试错方法学会了经典雅达利街机游戏的玩法,而且超过了所有人类的水平。


不过,这种游戏还仅仅停留在简单的2D世界。Minecraft等“第一人称”3D电子游戏从视觉上将玩家融入游戏环境之中,因而更接近真实世界,也成为了更复杂的试验场。


Minecraft玩家不仅可以探索预先定义好的结构并与之交互,还能用虚拟砖块来建造结构。在向开发者开放的版本Malmo中,算法也能执行相同的操作。例如,Hernández-Orallo正在用它来探索Minecraft环境能否被用于创建机器智能的基准;比如说,算法可以相互竞争将砖块搭建成最像某个特定物品的东西、或者走迷宫的能力,比起图灵测试(最著名的机器智能测试,它重点测试的是AI像人一样聊天的能力),这些测试涉及的能力范围要广泛得多。


英国剑桥微软研究院的计算机科学家Katja Hofmann说,促使Minecraft成为人工智能试验场的原因之一是,它原本就支持玩家通过文本信息交流,这有助于人工智能学习在现实世界中与人类合作。她带领的团队开发了Malmo。



机器人排练



Hofmann说,虚拟世界对于开发最终将会作为实体机器人运行的AI尤其有帮助,因为与现实世界相比,虚拟世界的环境定制成本更低,练习也更快速安全。虚拟世界也让机器人研究者得以专注于智能部分——实体机器人在机械方面的挑战会分散他们的注意力。


除了Hernández-Orallo之外,微软研究院也在与几个正在使用Malmo项目的研究实验室合作。但Hofmann猜测实际使用Malmo的实验室比这还要多,大约在100个左右。


类似地,DeepMind Lab也支持研究人员创建迷宫等结构,他们的算法可以学习收集奖品和寻路。DeepMind的一位发言人表示,DeepMind也在试验加入“更多自然元素”,比如起伏的地形和植物。由于DeepMind Lab的环境是开放的,DeepMind公司希望其他研究者能帮助他们打造对算法更具挑战性的环境。“通过开源,我们让更多研究者加入到开发中来,共同打造环境,”她说。


OpenAI的元平台Universe则更进一步。Universe为同一个AI提供了彼此极为不同的多重环境以供其采样,这或许有助于攻克人工智能领域最困难的问题之一:创建一种能利用过往经验处理新情况的算法。举例来说,模仿视皮质内脑细胞层的深度神经网络能快速学会在3D迷宫中寻路,但却无法将这一知识转移到其他迷宫中。“如果迷宫的颜色变了,系统就会完全迷路,”Hernández-Orallo说。“如此先进的技术却一败涂地。”


目前,微软正在试图让Malmo可从Universe平台获取。“社区平台将会加快每个人的进步,”OpenAI的联合创始人兼首席技术官Greg Brockman说。


Nature|doi:10.1038/540323a



点击“阅读原文”阅读英文原文



相关文章


Minecraft的现东家微软也开发了自己的学术搜索AI,但另一支队伍推出了基于语义分析的学术搜索AI。

点击此处阅读:学术搜索AI




版权声明:

本文由施普林格·自然上海办公室负责翻译。中文内容仅供参考,一切内容以英文原版为准。欢迎转发至朋友圈,如需转载,请邮件Chinapress@nature.com。未经授权的翻译是侵权行为,版权方将保留追究法律责任的权利。


© 2016 Macmillan Publishers Limited, part of Springer Nature. All Rights Reserved.










nature.com 官方微信

中国及世界科技出版业有哪些最新动态?

如何在Nature及其子刊上发表论文?

自然科研有哪些新的产品及服务适合你?

长按二维码关注我们。

 微信号:macmillan-nature



您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存