其他

柯洁应决胜前半盘 战AlphaGo要有自信 | 陈经

2017-05-22 陈经 风云之声


关注风云之声提升思维层次

解读科学,洞察本质

戳穿忽悠,粉碎谣言

导读

柯洁与AlphaGo的三番棋即将在2017年5月23日上午10:30开战。2017年1月28日,新浪棋牌就本次比赛在深圳对陈经进行了视频专访。在多次传出风声之后,二次人机大战终于真的要开始了。柯洁虽然处于明显下风,但并非毫无机会。



陈经


2017年4月,谷歌DeepMind宣布AlphaGo重出江湖,将在5月在中国乌镇与现世界围棋第一人柯洁展开三番棋较量。新浪就此相关话题采访了人工智能专家陈经(采访于早些时候)。

 

  新浪:用几句话谈谈您对围棋的理解

 

  陈经:因为我是搞技术的,所以围棋在我眼里是所有游戏里最复杂的一种。我说的游戏是“完全信息博弈”游戏的一种,比如中国象棋、国际象棋,子力都摊开了,大家都打明牌,但是它又很复杂。这类游戏里围棋是最复杂的一个。

 

  新浪:请您谈谈您观看AlphaGo和李世石的人机大战以及master的这60盘棋之后的感受?

 

  陈经:既非常震惊,又非常高兴。因为我长久以来对围棋人工智能的发展很关注之前有几次突破,比如日本的DeepZen能够战胜像我这样的业余棋手了,但能够战胜职业棋手还是难以想象的,以至于我们期待一个程序什么时候能够战胜人类的顶尖高手,但忽然之间,好像AlphaGo已经实现了战胜人类最顶尖棋手的目标。这个进度还是超乎了我们的预期。所以我一方面对计算机算法技术的进步感到震惊,另一方面,有个人工智能能够领先人类棋手好像一先,有点科幻色彩,又能够看到这种棋谱,令人很兴奋。因为职业高手的棋谱有的时候就会显得千篇一律,但是AlphaGo突破了以前的固有思维,不走寻常路,能够让职业棋手的技艺有飞跃的提升。

 

  新浪:您能否直观的从技术的角度让我们了解AlphaGo在第一次人机大战中谷歌公司使用的资源有多么庞大?

 

  陈经:第一次人机大战时候,AlphaGo是用了分布式版本的一个机器,在论文里提到有一个单机版,单机版是一个小规模的机器,它有48个CPU,以及8个GPU。

 

  分布式版有1202个CPU,GPU有176个,比单机版要多大约几十倍,从规模上来说还不是很惊人。真正规模比较大的是AlphaGo平时用于训练的机器,据我们估计应该是在10万个服务器以上。因为它要生成很多棋局,所以训练用的机器CPU以及GPU规模要大得多。但是下棋的时候用分布式的机器和单机版其实棋力相差并不是太大。我们得到的数据是AlphaGo单机版对分布式版也有百分之三十的胜率。

 

  新浪:从技术的角度怎么看待master快棋的60连胜?

 

  陈经:我们可以从两方面看这个问题。一方面是从master对人类碾压性的60胜可以看出它是远高于人类水平的,这是肯定的。另一方面又是快棋,我们认为应该是放大了人类的弱点。我们估计master快棋和慢棋基本实力不会差很多,所以是一个具有完全实力的master对的是只有20、30秒的时间思考的人类,所以人类实力是打折扣了,而人类对AlphaGo产生恐惧情绪的话就更容易出现错着。应该说人类的发挥并不足以说明这是一个完全的测试。但有些高手觉得快棋和慢棋好像也差不多,给他更多时间他也想不出更好的招法来,或者有些高手说快棋和慢棋差一先,这是比较正常的估计。如果两个差距在一先的高手对局60局取得60全胜也是不太可能的,所以即使人类快棋打折扣我想master和人类的差距应该也在一先以上。

 

  新浪:请您来介绍一下围棋的AI与象棋、国际象棋AI有什么区别?

 

  陈经:中国象棋和国际象棋的AI至少在10年以前用传统的搜索技术就已经能打败人类。当然它产生轰动效应该是1997年深蓝与卡斯帕罗夫在国际象棋领域的突破。那个时候在传统方面的搜索技术人们还是比较容易理解的。但是到围棋网面程序就不一样了。主要是引入了一个“机器学习”的东西,下棋和评估局面的过程都不是用人工代码写的,而是用“多层神经网络”来做计算的。“多层神经网络”在中国象棋和国际象棋代码里是没有的。而且AlphaGo用这两个神经网络的系数是非常多的,多达几百兆。AlphaGo更像一个在人类督促下自我训练慢慢成为高手的人工智能。之前中国象棋和国际象棋的AI并没有自我对局的训练过程。关于AlphaGo的论文里提到一种技术叫“强化学习”技术。通过自己对弈的过程修改神经网络中的数据,棋力就会一点点的上升。这是一个革命性的技术。

 

  新浪:那您觉得目前的AlphaGo还有什么弱点?

 

  陈经:以围棋的复杂度来说,不可能就说master已经达到了完美的程度。Master的60盘虽然没输,但中间有没有吃一点亏也还是可以找的到的。比如一开始和孟泰龄下的一局可能被孟泰龄的手筋击中了,导致优势缩水。所以我们希望能够继续强化AlphaGo,能够在棋艺上探索出更深层的东西。它是利用一种算法对局面进行评估,它的论证肯定不是完善的,而是用两个几百兆的神经网络计算。肯定不会完全接近真理,当然有些情况下它的理解比人要深,我们也不排除有些时候人的理解要比AlphaGo深。所以人一定要有一个平稳的心态,在局面判断上和AlphaGo进行一个正面的较量。这次柯洁和AlphaGo的挑战用时还没有商定,我建议用比较长的时间比为好。AlphaGo的用时其实是无所谓的,要求时间完全是为了人类。从棋艺的角度时间长也可以让观众看到更精彩的对局。柯洁比较容易犯随手的错误,经常在前半盘领先,但后面就会开始下随手棋,把大好的局面葬送了出去。如果和AlphaGo下棋发生下随手棋这种情况就太可惜了,所以一定要有充足时间来杜绝这种情况。

 

  新浪:请您介绍一下围棋这种完全信息博弈和麻将、德扑非完全信息博弈的人工智能区别?

 

  陈经:完全信息博弈就是所有信息都是摊开的,不完全信息博弈是你不知道对手的信息,所以完全信息博弈的结果一定是确定的,推理的结果是一定胜或者负。在非完全信息博弈里,比如德州扑克、桥牌,AI的思维不是这局我一定要胜,而是在一万手牌里会有一次获得较高的胜利,所以思维方式是很不一样的。非完全信息博弈就要引入概率论情况下的搜索技术。一般认为非完全信息博弈的难度是高于完全信息博弈的。人类的优势更多在于信息不完全的情况下。

 

  新浪:您觉得AlphaGo对人工智能发展的意义是什么?

 

  陈经:AlphaGo是人工智能历史上意义最大的几件事之一。有很多次人工智能都陷入了发展瓶颈,但这次AlphaGo在一个看似很困难的领域打败了人类,似乎挑战了人类的信心,从算法本身来说AlphaGo也是很有意义的,引入了“强化学习”的技术,等于一方面它学习了人类的棋谱,另一方面它还可以自我对局进行提升。这样一个自我学习的框架是人类不能达到的。人类受身理条件的限制不可能一直下棋,而且人类还可能出现水平下降的情况,但是机器不会,它是稳定提升的。AlphaGo开发出的“训练流水线”,对人工智能的意义是重大的,之前的人工智能研发都是小规模。这次是十几万台服务器产生海量数据,这样一种理念对整个人工智能界都是一个冲击。

 

  新浪:AlphaGo价值网络和策略网络相配合的这种方式,是否可以应该用到更多的领域?

 

  陈经:AlphaGo下棋首先像人类一样产生一个直觉,选择最有价值的几个选点。另外还对局面进行判断,对不同的选点判断结果,和人类棋手的思维方式有一定的相似性。如果能将这个技术应用到其他比如医疗领域,让机器吸收医生的经验和思维,然后在一些关键的节点使用策略网络和价值网络做出选择和判断。研究AlphaGo更大的意义是为了在医疗程序上取得突破,实际上他们团队已经有很多人转去做医疗程序了。AlphaGo在策略网络和价值网络已经得到验证的训练方法是很有价值的,已经在医疗程序上有所应用了。谷歌可能会投入更多精力到其他领域。

 

  新浪:您觉得从master现身到挑战柯洁这段时间能否再次完成实力上的飞跃或者说算法上的升级?

 

  陈经:我觉得存在两种可能性,一种从它本身的架构来说,它每天都在自我对局,这个提升肯定不会停止,但这个过程能否使AlphaGo的棋力有本质的提升是不确定的,因为任何自我提升都是有一个上限的,它是有一个曲线的过程,一开始进步很快,后面会趋于平缓,如果AlphaGo的水平已经到了一定程度的话,给它再多的时间也很难有所提升。还有另外一种可能性,引入一种新的技术,重新开始新的训练,研发产生算法实力的本质飞跃也是可能的。

 

  新浪:有一种观点说AlphaGo的代码在人工智能领域并不算大工程,自动驾驶领域需要的代码很多,比AlphaGo的代码要多很多,这种观点您怎么看?

 

  陈经:这种观点是完全正确的,AlphaGo应该比之前的围棋程序代码量还要少,但是AlphaGo的神经网络的系数特别多,高达几百兆,人写代码不可能达到这么多。AlphaGo的棋力秘密是隐藏在它的两个神经网络里,不可能通过代码得到,而是通过十几万台服务器将数据灌注到神经网络的系数里,所以它不是一个简单的工程。

 

  新浪:您如何看待AlphaGo与柯洁的这个慢棋对决?

 

  陈经:这次AlphaGo和之前与李世石对局不同,之前并没有公布太多的棋谱。这次和柯洁对战有60局高质量的棋谱,而且取得了60比0的胜利,应该完全展现了它的实力。人类对柯洁的预期也是比较一致的:柯洁如果能取得一局的胜利应该已经算很大的一个成功了。如果柯洁全负也不是一件很震惊的事情。之前是AlphaGo挑战李世石,甚至有人说一盘都不能让AlphaGo赢,而这次是柯洁如果能够取胜一盘就表明AlphaGo还存在缺陷,让AlphaGo继续提升,到最后和国际象棋一样宣称不可能输给人类了。当然我相信现在还没达到这种程度。柯洁对AlphaGo能够有1到2局胜利对职业棋手来说是件很欢欣鼓舞的事情。

 

  新浪:既然现在AlphaGo已经如此强大,为什么还要和柯洁对战?

 

  陈经:首先谷歌公司二老板个人对围棋是非常感兴趣的,包括AlphaGo和李世石对战的时候还亲自到了韩国。即使不考虑胜负,从棋艺本身来说也是非常有价值的。只有在慢棋这种比较公平的测试情况下才能够不仅让职业棋手信服,也让开发团队比较有信心。谷歌团队在这方面还是比较保守的和谦虚的,在没有充足的证据时不会做出夸张的宣称。Master60连胜后他们只是说一起和职业棋手探讨围棋中美妙的部分。

 

  新浪:请您给柯洁一些建议

 

  陈经:首先柯洁的目标应该是对AlphaGo取得一局胜利就成功了,他应该作为一个完全挑战的心态准备这次比赛,这有利于他实力的发挥。同时他必须对AlphaGo下棋的过程有了解,如果不知道对手是怎么做出决策的就会感到慌张,所以一定要把AlphaGo看成一个可以理解的对手。和懂算法的人进行交流,理解AlphaGo的思维。第二,如果AlphaGo在中盘取得优势,不建议柯洁纠结于如何收官子,应该把决胜点放在前半盘,当然后半盘要顶住,不能将优势葬送。柯洁应该主动把局面倒向自己擅长的部分,应该建立信心,对一些局面自己估算比AlphaGo要准确的时候,要相信自己确实取得了优势。(文玄)

背景简介本文作者笔名陈经,香港科技大学计算机科学硕士,科技与战略风云学会会员,微博@风云学会陈经,文章2017年5月17日发表于新浪微博(https://sports.sina.com.cn/go/2017-05-17/doc-ifyfeius8031558.shtml)。

责任编辑:孙远



欢迎关注风云之声


知乎专栏:

一点资讯:

今日头条:



您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存