查看原文
其他

想赢“近乎上帝”的阿尔法狗,柯洁必须这样

2017-05-24 陈经 观察者网

文 观察者网专栏作者 陈经

► 风云学会会员,《中国的官办经济》

2017年5月23日上午10:30,广大棋迷与人工智能爱好者非常关注的柯洁与AlphaGo的三番棋首局终于开打。经过4个小时的战斗,柯洁执黑以1/4子的最小差距负于AlphaGo,三番棋暂时以0:1落后。这盘棋有哪些看点?AlphaGo又展示了哪些新东西?

一个很受观众关注的问题是,与柯洁对弈的AlphaGo是不是从零开始训练,没有受人类棋谱“污染”的“纯净”版本?赛后发布会,Deepmind负责人哈萨比斯回答说,并不是!它是在年初快棋60:0战胜人类高手的Master基础上的升级版。而且,这次用的只是单机版,而非与李世石对战的分布式版本。

这个单机版由于有10块黑科技TPU(据说一个TPU相当于15-30个GPU),所以这个“单机版”算力并不差。腾讯开发的绝艺,实力排围棋AI第二,用的只是GPU,在硬件技术上和AlphaGo有差距。这次AlphaGo虽然是单机版,但以每步一分钟的节奏下棋,比Master的思考时间要多十倍,计算力是足够的。

总的来说, 这次的AlphaGo从软件硬架构上来说,应该就类似于Master,并没有再次创新,但自我训练实力有小的提升。但相对于去年与李世石对战的版本,无论是算法还是硬件都有巨大的创新,实力要强得多。

对局中AlphaGo的表现也确实和Master差不多,在局面领先后,它慢慢将差距送成了最小差距的1/4子(相当于1.5目 胜)。我在对局中看到AlphaGo的着法,就提前预测最后会是1-2目的差距,其实当时领先优势应该是一个贴目(7目左右)。

虽然最后柯洁显得是以最小差距“憾负”,但职业棋手们认为,AlphaGo本局展现的实力,领先柯洁是有一先的(也就是一个贴目)。但这并不是说柯洁发挥不好,他发挥得其实不错。对比去年李世石,面对实力要差得多的AlphaGo版本,本局柯洁的表现要好得多。

5月27日笔者将做客观天下讲坛“人工智能革命,中国距离世界第一还有多远”,希望有机会能跟大家更为深入地就“人机大战”、“AlphaGo”、“人工智能”进行探讨。下面介绍本局的一些关键点。

一.开局

柯洁在与人类对手的实战中,连续七八局试用了开局占三三、点三三的手法,有相当的心得。本局我就发微博预测他会开局点三三,果然他在第3手占三三,第7手对白星位点三三。

这几手说明柯洁是有精心的准备的,而且提前演练了。以下是柯洁的预想图:

这个变化实际是Master下出来的,黑棋夺掉了白星位一子的根据地,还能够利用8位点的弱点,对白一串进行攻击。面对柯洁的“以其人之道还治其人之身”,AlphaGo会如何应对呢?AlphaGo给出了答案。

AlphaGo针锋相对的预想图

AlphaGo没有下在R5位扳,而是下在三角位,这是AlphaGo的预想图,黑1位托3位顶这样定型。与柯洁的理想图相比,白棋的外势更为完整,P6位很难说是弱点了。可以预期,以后碰到开局点三三,棋手都会用这招应对。柯洁在这个局部变了个次序,但并没有得到好结果。

实战结果

实战柯洁11位先顶,再13位扳,遭到了白R2位(后来被吃)的反击。最后19位的黑子被白22征掉了!碰巧的是,左上角黑三三一子,没有引到征,而如果这个子在星位上,白就征不掉黑棋了。黑棋两个三三的组合手段,换来这个局面,应该说没有实现战略意图。

黑占的角并不大,而白吃掉19这个子后外势很厚,特别是24这手很有想法,注重中央的战斗。AlphaGo相对于人的优势就是利用厚势的能力,应该说开局黑的三三战术落空了。

二.左上角的战斗AlphaGo可能亏了?


AlphaGo26位打入,28跳起再30位罩,这个手法人类棋手不太能想到。而白34粘,让黑35位挺出,这个感觉相当异常。应该会有相当多的职业棋手不赞同AlphaGo的选择,白两块被完全分断,感觉黑棋主动。

AlphaGo选择了吃角,中间四子基本被吃。这个局面白这四子是不敢跑的,因为黑有F18位左右的借用,白跑会被黑追杀得特别惨。行棋到此感觉黑应该是不落下风的,一些围棋AI对此局面的胜率评估也认为此时黑并不落后,开局吃亏后,黑挽回了局势。

但是柯洁局后说,他本来是想“先捞后洗”(先抢占实地,让白做模样,黑冲进去捣乱找机会),占两个三三就说明这个意图非常明显。但是这个局部下来,白棋反而吃掉了黑左上角。考虑到左上角本是黑的三三,三三被吃掉的局面极其罕见。

所以这个局面白棋反而捞了实地,柯洁需要利用厚势作战,不是他的意图。这就是Master的典型棋风,看着它是厚势作战,但一有机会它就变现转实地,不会搞看不太清的宠大模样。

三.柯洁非常可能的败招与AlphaGo的胜招


AlphaGo没有盲目动出四子,而是抢了48位大棋,黑49打入是眼见的好手。这时白下了50位骚扰。柯洁这时可能心理上稍有一点松劲,选择了51位吃死消除不安定因素,而不是54位粘继续紧绷局面。AlphaGo在52位尖顶后,下出了令柯洁本人在内的不少职业棋手佩服的好棋,54位断!

这招棋本身是后手。白从F13扳动出跑不了,在B12跑也会被黑A12扳快一气吃死。那这招的好处是什么?让柯洁局后非常佩服的是,这招棋韵味深长,虽然是后手,但是以静制动,能发挥极大作用。有了54这手切断,白在B9是先手能在左中部做一排厚势支援左下部。另一方面,白也可以选择在G10位跳,在靠近中央的地方做出一排厚势。对白这四个死子的利用非常灵活。

柯洁意识到局面不利,怕白棋左下角实空太大(黑实空本来就不领先,中间的厚味又被白54限制住了),就急躁恨空地在55位打入了。白56位立,这一手就决定了白棋的优势,其它AI的判断也是白优势了。因为白有中间的借用,黑活左下角以后,49、53两子会被攻击,很难有生路了。白棋仿佛所有子力都配合起来,让黑这两子异常困难。

四.AlphaGo优势下的稳健运转


面对难局,应该说柯洁表现不错,使出了69靠、71扳的灵活手段。结果黑弃掉两子,中间大块通过83断回家,维持住了局面。行棋至此,不少棋手和观众感觉局面还早,胜负在后面。

但是AlphaGo可能对局面评估更为准确。白下方与左上角的空是比较实在的,而黑右上角三子虚虚的形势价值多少却不好说。实际上,白84手的打入正击中了黑棋的弱点,在白下面厚势的影响下,黑棋在此围不到多少空,落后的局面迅速就要明朗化。

左上角的结果,白棋又捞了十余目实地扩大了实地优势,黑只收获了一道有缺陷的外势。白84子在P15打后有余味。柯洁97位令不少人感到奇怪,但其实是没有办法。不下在中间,白吊这里,利用84的余味以及白N5切断黑三子的手段,黑中间会很惨。这时白悠然拆在98位,职业棋手应该基本看清了白必胜的局面。

98这手进得不深,黑如果L17拆二互围,白左上能多围不少,黑右上中间围不到多少,白盘面都要好一些。实战黑只好攻击白98这一子。

黑99攻击,白100拆一几乎是胜利宣言,似乎在说吃不掉我就胜了。而且这两个子活力很好确实吃不了,下到110逼黑111吃,这时白做眼与出逃都不难,应该说已经解决了问题。

行棋至此,从子效上来说,黑左边一团当初以为的厚势,虽然吃了五子,但全是干目没围到多少目。而白下面的厚势吃三子却围得效率高不少。黑右上的厚势其实也围不了多少空。因此白棋盘面领先是可能的,后面收官白明显手段多,黑到处欠目。

柯洁后面没有放弃,收官撑得很厉害。但AlphaGo领先优势够多,早早进入了安全运转模式,时不时地送出1目半目,送出去了6、7目,最后1/4子获胜。如果熟悉Master的棋路就会知道,白不断地送目,正是必胜的证明。所以后面柯洁虽然收官有收获,其实早已心知肚明必败了,表情痛苦。本局并非双方差距微小,在官子争夺中柯洁最小差距落败,而是差距大到了一先。

五.全局综述与展望

本局柯洁黑棋并没有领先的时候,没有胜机。黑棋开局两个三三先捞后洗的战术准备不算成功。白棋领先的局面出现在50多手,虽然优势并不是太大。但是柯洁一直没有崩溃,不断地出招试图化解困境或者翻盘,也逼出了白棋的一些好招,双方的对战招法颇有看点。柯洁的状态应该说还不错,但是一点点的松劲就导致局面落后无法挽回。柯洁本人对自己的发挥并不太满意,应该是意识到了自己的问题。

AlphaGo本局的表现非常稳定,能够领先发挥不差的柯洁一先,展示了强大的实力。AlphaGo本局的招法相对Master给人的震惊来说,容易理解多了。这个对局显得很有逻辑,不象Master的某些棋局,人类莫明其妙就大大落后,输了还不知道怎么回事。本局AlphaGo也有一些令人惊艳的招法,但下出来棋手们能品出妙味,不致于茫然不知所措。这说明,人类棋手的水平也在进步。

柯洁说,想要赢AlphaGo,必须逼出它的bug。从本局来看,确实如此。如果只是局面选择、打入、围空、攻击这些较为常规的局面,AlphaGo的局面判断能力比人类棋手明显要强。在双方上百手的进程中,人类总是容易出错。一旦进入AlphaGo小有优势的控制流局面,它总是能简化局面,找到简明获胜的分枝。

想要逼出AlphaGo的bug,柯洁必须把局面撑得很满,让双方都不能退,不进入复杂变化就吃亏。从本局的局面来看,柯洁如果发挥得再好一些,可能会有这样的机会。如逼使AlphaGo大吃柯洁一块棋,而不是吃下面两子就够了。或者逼得AlphaGo进柯洁的模样里艰难找生路,而不是象98与100两子一样一眼看去就能轻松做活。从AlphaGo的棋路选择来看,它明显在避免算不清的开放型复杂死活变化,因为那样它有不少分枝是会被吃,或者被柯洁整体活出,不如控制流胜率高。

希望柯洁后两局能将局势引导得更为复杂、更为紧张,让棋迷们看到更精彩的棋局。哈萨比斯也说要继续开发提升,例如以后真的开发出“纯净”版的AlphaGo,与职业棋手们共同探索围棋更多的奥秘。

观天下讲坛第5期报名链接

猜你喜欢

新西兰小城举办“人肉中国人”大赛,结果出人意料
首位在哈佛毕业典礼演讲的华人告诉你,什么叫真正的不卑不亢
来听听其他马里兰大学留学生的反击

转载规范请后台回复:转载

商务合作/广告投放

market@guancha.cn

QQ 2920915625

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存