其他

阿尔法狗0:100输给了谁?

2017-11-21 译言 信息史学

继阿尔法狗之后,人工智能公司Deepmind新研发出具有自学能力的阿尔法元,在零人类经验数据输入的情况下,仅花3天时间就以100:0的成绩战胜阿尔法狗,标志着人工智能摆脱人类经验进化到自主学习阶段。

人工智能新阶段:人类经验已多余

The AI That Has Nothing to Learn From Humans

本文作者:Dawn Chan

围棋之战,源远流长,轶事颇多。1835年,日本的井上和本因坊两家为争夺棋坛盟主之位,分别派出赤星因彻与丈和决战。赤星因彻本占上风,但在丈和的夫人为他祈求神力后,丈和在棋战中接连走出制胜的三手妙棋。赤星因彻顿落下风,难挽败局后吐血而亡。这就是日本围棋史上著名的“吐血之局”。

 丈和的三手妙棋或许是借助神力,而现在,这些神出鬼没的妙招则是由人工智能来创造了。

 


不少人或许还对今年阿尔法狗和柯洁的围棋大战记忆犹新。这场博弈后,谷歌旗下的Deepmind公司继续对阿尔法狗进行了上百万次训练。据《自然》期刊最新披露,Deepmind公司开发出新一代阿尔法狗(命名为阿尔法元,“元”即初始,取从零开始自主学习的含义),在没有任何人类数据输入的情况下,仅经过3天的自我训练后,就在自我对弈中以100:0的战绩击败上一代阿尔法狗。

 

阿尔法元


抛弃对人类经验的学习,及大量的自我训练,是阿尔法元的亮点。但其与人类棋手的对战将会如何?

 

阿尔法元的最新战绩目前还未披露。但在今年五月,Deepmind公司公布了旧版阿尔法狗的55场自我对弈,将其称为“给全球阿尔法狗粉丝的礼物”。自五月起,专家们就开始煞费苦心地研究这55场棋局。他们描述其中阿尔法狗的表现时,始终围绕这几个词:“了不起”、“出奇”、“神出鬼没”。

 

“它们代表了我对未来棋局的想象。”中国顶级棋手施洁接受采访时说。一位叫乔纳森·霍普的阿尔法狗狂热粉丝反复观看其自我对弈的棋局后说,“这是一种双维的下棋方式。”以前曾有外星文明是高级人工智能的言论,在阿尔法狗的对弈视频下,有人留言声称:“这是我们可以理解的外星文明。”

 

物理系学生威尔·洛克哈特还描述了阿尔法狗人机对弈和自我对弈的区别。他声称阿尔法狗击败柯洁是“势不可挡的伟大胜利”,柯洁则像“一拳砸在了砖头上”;与之相比,阿尔法狗的自我对弈就像“在钢丝上挥剑互刺”,更动人心魄。阿尔法狗还有一项特质与人类棋手不同,人类棋手每次只能关注到棋局的一小部分,而阿尔法狗同时能下多盘棋。西方最强的阿尔法狗对战棋手迈克·雷蒙说:“人类棋手积累的知识可能只在棋盘的边边角角有用,但阿尔法狗不受人类知识的限制,能创造出人类难以掌握的新棋招。”虽然尚未完全明白这些棋招原理,但不少人类棋手已经开始在比赛中运用从阿尔法狗处学到的招数,比如星位直接点三三的标志性招法,就曾被柯洁在对战中模仿。

 

星位直接点三三


阿尔法狗在自我对弈中的一些标志性招法,即使好多专业棋手也无法理解。棋手迈克·雷蒙说:“很难弄明白阿尔法狗正在做什么,它颠覆了我们习以为常的所有认知。” 和其他人一样,迈克·雷蒙也觉得棋局显得“神出鬼没”:“阿尔法狗的招数中有些超出人类认知的东西,这使人类棋手与它对战时甚至没法进入状态。”

 

迈克·雷蒙


不过迈克·雷蒙认为阿尔法狗也并非尽善尽美,它也可能有出错的时候。人类棋手在下棋时往往会有一些定式,这些攻守套路代代相传,棋手不断深入分析这些定式,形成相应的对策。上一代阿尔法狗经过对人类棋谱的学习,在对弈中可能会犯“选择次优棋招”的错误。在阿尔法狗的决策树模型中,虽然人类棋手对一些分支已经确定了相对较优的选择,但仍还存在大片的未知领域。阿尔法狗涉猎这些未知领域时,虽然它试图作出最好的选择,但仍有可能出错,不慎选择了次优棋招。新一代阿尔法元摆脱了棋谱和人类经验的学习,或许这恰巧成为它棋艺较上一代阿尔法狗突飞猛进的重要原因。

 

过去版本的阿尔法狗从利用人类数据进行培训开始,被告知人类棋手的各种棋招。而阿尔法元不使用任何人类数据,完全通过在自我对弈中实践的方式进行自我学习。在阿尔法元的算法中,阿尔法元的陪练对手,总是被调成与其水平一致。所以它是从最基础的水平起步,从零开始,从随机招式开始,但在学习过程中的每一步,它的对手都会正好被校准为匹配当前水平,一开始这些对手都非常弱,但是之后渐渐变得越来越强大。阿尔法元的成功,标志着人工智能在强化学习领域的突破。


版权声明:

本译文仅用于学习和交流目的。非商业转载请注明译者、出处,并保留文章在译言的完整链接。商业合作请联系 editor@yeeyan.com  参考原文地址:

https://www.theatlantic.com/technology/archive/2017/10/alphago-zero-the-ai-that-taught-itself-go/543450/?from=timeline&isappinstalled=0



  

扫描二维码关注译言,获取优质译文资源,享受优质便捷的即时译服务。


逃跑的机器人

译言古登堡计划译本


原书名:The Runaway Robot

原作者:莱斯特•德尔•雷伊(LESTER DEL REY)

原语种:英语


本书简介

木星和火星上居住的人类保罗一家终于能重返地球,但小保罗却不能和心爱的伙伴雷克斯一起回去:因为机器人雷克斯的设计已经过时,他将被回收、摧毁。为了保护雷克斯,保罗踏上历险之路。他们的结局如何? 这是一部关于爱与勇气的历险小说,外太空版“哈克贝利芬”。雷克斯虽是机器人,但保罗为他付出朋友的爱,也收获了朋友的爱。对小读者来说,这是个感人至深的故事。


点击阅读原文,购买图书。

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存