查看原文
其他

李世石对不起,我们押宝阿尔法围棋|BetterRead

2016-01-29 王烁 BetterRead


文|王烁


AI崛起,最新证据来自《自然》杂志最新封面论文。Google旗下的深度学习团队Deepmind开发的人工智能阿尔法围棋(AlphaGo)以5:0战胜了围棋欧洲冠军樊麾。这是人工智能第一次战胜职业围棋手。它将于3月间挑战李世石,当下世界围棋最强者之一。胜者拿走100万美元。


作为一个曾经很强过的业余围棋手(曾经拿过一次北京市高校围棋冠军),我打了这五局棋谱,震惊。


不是震惊于阿尔法围棋下得多么惊艳。表面上,这五局棋下得反而是很平庸。樊麾抵抗不足,五盘棋没有什么激烈的战斗,开局、定式、占大场、小规模接触战、收官,对抗度很差。


令我震惊的是,如果事先不说,换成我坐在棋盘对面,我不会知道这是人工智能下出的棋。由于阿尔法围棋与樊麾在对局中展现的棋风相近,如果不说谁执黑白,哪怕事先告诉我其中一方是人工智能,我也无法准确地辨别出,哪一方是人,哪一方是人工智能。


下面是双方下的五局棋谱,不懂棋的可跳过去翻看后面文字;懂棋的务必看一下。


你看得出谁是人谁是人工智能吗?





也就是说,阿尔法围棋不仅战胜了职业棋手,也通过了图灵测试(围棋单项,如果能够这么说的话):如果机器能够跟人交流而不被认出来是机器,那么它就能思考。此前的围棋人工智能则通不过,虽时有精彩之笔,也总会露出马脚。


这不是偶然。在过往围棋人工智能通常采用的蒙特卡洛树搜索算法之外,阿尔法围棋加入了两种深度神经网络算法,分别减少了搜索所需的广度和深度:用价值网络算法评估棋子位置的优劣,用策略网络算法来选择下一步。阿尔法围棋与人的思维方式更接近。在与樊麾的对局中,靠着更精准的评估和更聪明的棋步选择,阿尔法围棋的计算量只需是20年前IBM深蓝计算机击败国际象棋世界冠军卡斯帕罗夫时的几千分之一。


竞争对手立即作出了评价。田渊栋领导着Facebook人工智能围棋项目“黑暗森林(Darkforest)”,你可在跨国围棋对弈平台KGS上与它交手,目前是业余5段水平。田在知乎上说:


“他们训练了一个走子的神经网络,又训练了一个可以评估局面的网络,然后在蒙特卡罗树搜索中同时使用这两个网络。后者用了两千万局的自我对局的结果训练。为了避免过拟合,每局只随机选了其中一个局面,然后让网络预测对局结果(胜或负)。两千万局不是个小数字,大家可以算一下一刻不停地下,15分钟一局需要多久才能下完(大约是570年)。这个规模我说实在没有想到过,谷歌在这方面是很有优势的。最后,他们的default policy也是经过处理的,能够两微秒走一步而且准确率也不错。还有一些小细节就不一一赘述了。总之,谷歌的做法充分利用了大数据+深度学习的优势,而几乎完全没有用到围棋的领域知识,所以若是以后棋力能再往上走,我也不会惊讶。”(略作编辑)


人工智能近年突飞猛进。最近还有人说,人工智能要战胜人类围棋手还要许多年。现实立即粉碎了这种预言。人工智能战胜业余强手也就是去年的事,现在已经战胜职业棋手。业余强手与职业棋手之间的差距,远大于职业棋手与职业顶尖棋手的差距。


樊麾二段出生于中国,目前是法国国家围棋队总教练,连续三年赢得欧洲围棋冠军的称号。欧洲冠军与世界最强之间水平大概差让先到让两子之间,这对人类是天堑,但对已经取得突破的人工智能来说,步子大点也许一步就迈过去了。


本文发出的时候,已经有两位世界冠军级棋手发表了看法。


芈昱廷九段:“谷歌围棋战胜职业棋手的消息很刺激,对李世石挑战赛胜负很难说。”


刚刚两次战胜李世石两夺世界冠军头衔的柯杰则称:“以现在这个计算机的实力战胜李世石可能性不到百分之五”。


但是,柯杰恐怕还不知道,阿尔法围棋战胜樊麾是在去年10月,到今年3月才会与李世石对局,时间又将过去近半年。阿尔法围棋通过与自己下棋来作加强学习,以闪电般的速度每天跟自己下无数盘。关键的技术突破已经发生,它从高手达到独孤求败水平不需要很多天。如黄文政所说,量的改进是人工智能最擅长的事情。


不要被阿尔法围棋与樊麾对局中表现出来的“平庸”所迷惑,它也许只是以樊麾的棋风打败了樊麾。跟人不一样,人工智能不会也不需要有特定的棋风,如果要猜的话,我猜它是镜像了对手的棋风。对手不同,它就不同。


模仿对手的做法,是一种常见的博弈策略。比如帆船赛里,一对一,领先者保证领先的最简单办法,就是追赶者做什么,领先者就做什么,不管这个做法本身是不是最优,这样可以确保领先的差距不会减少。


围棋当然没有这么简单,但套用这个思路也是可能的,对手什么风格,AI就什么风格,对手是人,会有无谓失误,会有漏着,会有精神力专注度问题,这些问题AI一个也没有,镜像对手的做法,岂不有姑苏慕容氏“斗转星移”一般的效果?


还是让3月对战来验证这个猜想吧。与樊麾相比,李世石是另一种动物,从始至终血战到底。如果阿尔法围棋转为采用嗜血战法,那李世石就要特别小心了。


李世石说:“作为人类代表,相信这一次我还能赢。” 


祝你好运。


我参加的一个微信群对此战结果的预测出现分歧。像所有合格的贝叶斯人那样,我们下注。最终产生的赔率是押李世石为押2赔3,认为人类会输的已占明显多数,等于预测人类获胜的概率只有40%。它是我们这个微信群集体智慧的凝结:有懂围棋的,也有懂AI的。(有关预测这件事,请参考右文:2015最佳图书|成为超级预测者


至于我自己,押阿尔法围棋胜。人类,对不起了。


围棋成为人工智能新突破选择的领域,意义重大。围棋规则简单,变化繁多,而结果不确定,没有“正解”。不是说初始输入一个值,然后直线计算到终局,而是每一步都有判断、权衡、取舍。我的体会是它好似生活的投影,简单一些,但足够复杂。认知科学家阳志平说,认知心理学实验研究智力、专家、专业技能习得常选取棋类作靶子,因为它标准化程度较高;不过,一般棋类游戏认知复杂度不足,围棋却兼具了标准测试集与认知复杂度高双重特点,人工智能在围棋上取得的突破,具有划时代意义。


那人还能做什么?


近来影响巨大的《第二个机器时代》一书认为,过往人们认为自己相对于人工智能的优势,已经越来越靠不住了,将来还可能有点比较优势的领域(暂时)只剩下:提出有趣问题;宽幅模式识别;复杂沟通能力。该书推论说,二百年来主要重视数学(ARithmatics)、阅读(Reading)、写作(WRiting)的3R式教育,与将来的需求错配,必须改革。


围棋失守在即,未来已经到来。


新时代来临前

留恋英雄气的余晖

一盘没有下完的棋 | 陈祖德

棋如人生 | 藤泽秀行

无疆 | 吴清源

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存