查看原文
其他

【新智元—世纪对决】AlphaGo 惊天逆转李世石 ,关键棋局解析

2016-03-09 新智元

 新智元原创1

整理:王嘉俊

感谢陈雷及新智元群友的参与

万众瞩目的李世石 VS AlphaGo 世纪大战结果出炉!


AlphaGo 惊天逆转,战胜李世石!开局李世石有些动摇,但随着棋局的进行,李世石渐入佳境,形势越来越好了。但正当大家都认为棋局已到垃圾时间的时候,李世石一个小失误,局面重新变得扑朔迷离。AlphaGo 成功凭借李世石的失误,成功逆转,AlphaGo 获得了胜利!


这是人工智能和围棋领域的历史性事件,人工智能第一次在围棋领域战胜了世界冠军!


从整体来看,AlphaGo 的水平表现的强弱分明,有非常好的妙手,也有非常“业余”水准的电脑棋,但 AlphaGo 一直没有太大的失误,在李世石出现大失误的时候成功抓住,惊天逆转!


从招法来看,AlphaGo 似乎一直在制造变数,希望搅乱局面,似乎都算清了似的。AlphaGo 在复杂的环境当中,表现的稳定性要优于李世石。而当李世石出现失误的时候,AlphaGo 准确抓住并获得了胜利!


不过这盘棋还没有出现“打劫”的情况,我们还没有办法看到机器的缺陷。


在李世石占据很大优势的时候,明显选择了求稳的心态,但不小心犯了错误。嘉宾说李世石的性格就是越挫越勇的性格,当给他足够压力的时候,李世石有很强的韧性,但是一直很顺利的时候,不一定步步下的很好。


昨天新智元专访了周志华和王飞跃,也提到了心理因素,是这场比赛的胜负手。比赛结果也表明了,面对没有情绪的计算机,人类的情感是比赛的不稳定因素。


在比赛前,新智元就建立了人工智能 & 围棋领域的专家微信群。Caffe 作者贾扬清说,AlphaGo 是拿 Torch 写的程序。


香港科技大学杨强教授在群里贴出了美国 AAAI Fellow 的预测,其中专家认为 AlphaGo 胜利的比例占到了 69.1%。不过杨强教授也说,美国人大部分不懂围棋。




新智元也在比赛前做了即刻调查,例如调查中计算机界参与过半,其中 51% 的人认为李世石会获得胜利。




感兴趣的朋友可以加入我们的人工智能 & 围棋专家微信群,扫描下面的二维码加入。




关键棋局解析



AlphaGo 白棋,李世石黑棋,按照中国的规则。


李世石的开局很怪异,第 7 手选择了很少见的变化,也许是李世石觉得必须下机器没学过的招法。




AlphaGo 托角,在人类看来是非常不好理解的,这一步普通跳一个也可以,黑棋右边位置很低。新智元微信群里的职业选手说,这一步基本上围棋高手都不会那么下。




从开局来看,倒感觉退步了似的,下出了人绝不会选择的招法,也可能电脑真的超越人了。




不过这时候王飞跃老师说:“要沉住气。”


白棋这步有意思了,有人说这是“俗而有力”,让李世石有些难受。




到了这一步,陈雷说现在还没到计算的环节,依然是靠感觉在走。计算的时候考验程序的实力,Policy NetWork 在感觉环节还是很准的,后面得看在计算的环节,AlphaGo 的走子能力。


到了这个阶段,李世石还是占有一些优势,但李世石陷入了思考。




李世石选择了挡,李世石刚正面,这步的意思就是我力量比你大。这就进入了计算的环节,开始看 AlphaGo 的走子能力!




进入到复杂的战斗,开始冲断白棋。AlphaGo 的时间控制很不错,不浪费时间在简单的地方。田渊栋说这个程序写起来很容易。




李世石和 AlphaGo 继续力抗。




李世石坚定的一挡,AlphaGo 白棋选择了断。黑棋开始冲断。




白棋拐出。群里开始有人说,李世石在“放水”。这个局部非常重要,基本决定了整个棋局的走势。古力说,李世石这个走法,已经失败了。




黑棋扳,为了避免左边的两个子被直接征吃。在这个局部,AlphaGo 占据上风。李世石之前的挡住太丧了,这局面黑棋难收拾。




白棋在防止被黑棋征吃的同时,也瞄着四路冲断。因此李世石补在了 2 路,以防冲断。白棋选择了 44 逃出 3 子。这个变化应该是 AlphaGo 选择不简明。




李世石意图补强自身,并威胁右边的眼位。唐奕说,AlphaGo 48 以下应保留,把右边大块的眼位给卖了。




李世石选择了攻击白棋。




提问:


【提问】硬件当中会有gpu和cpu共同工作吗?


【张峥】是,用少见的开局也许可以增加长距离蝴蝶效应的可能性。一进入局部就不好办了。


【田渊栋】一直是两者同时工作的,cpu搜索,gpu评估局面。




越来越多人说李世石在放水了。李世石补断点。




目前 AlphaGo 表现出的战斗力是惊人的。几乎没什么漏招。AlphaGo 至今表现出极其冷静。




白棋选择了靠,大家表示不理解......电脑棋?AlphaGo 确实不走寻常路,优劣倒也难说,黑棋吃了是不见得便宜。




有人说李世石确实勇猛,但 AlphaGo 的棋是陷阱么?


提问:


【董飞】我记得有人问google作者,电脑是怎么下这一步的,他也不知道。不是靠背棋谱就可以知道的。


【提问】为什么google作者自己都不知道电脑怎么下棋的呀?不是他们设置学习机制的吗?


【田渊栋】设置了机制但是不知道这个机制如何学得棋谱模式。要是知道了,对AI来说是非常大的突破。所以AlphaGo可以走很好的棋,但是制作者不知道这个是通过什么推理方式算出来的。



李世石选择了不吃。吃了要俗一手而且愚形还要被引征一个,不一定便宜。柯洁说,顶级选手下棋,都是直觉有几个点,然后进行验算。刘知青教授说计算机也是这样。






现在有 7 块棋做对杀,如果 AlphaGo 能找到机会,那么已经非同寻常了。




他们要在这个地方做形状整理,黑棋防止白棋挖断,在整形的同时,双方都在争取获得先手。





作战对李世石作战有利。





白棋贴,不放弃。继续肉搏。但 AlphaGo 既然敢于这么下,肯定是算过有信心的。






李世石 77 吃住中央白棋两子,将中间完全控制住,此时黑棋形势主动。


李世石逐渐获得优势。大家开始看好李世石获得胜利。


77手,李世石首次离席。对手一般会等对手回来才落子,但电脑就没有这样的“觉悟”,果然电脑马上就落子了。


【主持人】插播媒体朋友的提问:我们能否说 AlphGo 现在已经能够判别局势,而不是只判断接下来的几步范围内,哪个位置最优?


【田渊栋】value network和playout都是用来判断局势的,判断哪步棋最优也要靠这两个.policy network给出候选的走子,然后由上面这两个判断哪步比较好





目前来说,支持李世石的占多数。


现在谷歌围棋程序的风格来看,AlphaGo 不怕事儿多。王小川解释说,因为机器没有“事儿”多的概念……事儿多事儿少对它处理起来都一样…


李世石回来了,左下挂角。AlphaGo脱先在上方补了一手。AlphaoGo的这步棋非常稳健。




吴肈毅:从现在的下法来看,如果 AlphaGo 没有变化,败下阵来的可能性比较大。


古力说,李世石回来的时候,有一个很熟悉的手势,这是找回信心的标志。李世石赢面很大。




白 84 这个下法不太常见。





韩国金成龙九段:成为职业棋手27年来,第一次看到白断这手棋!那么问题来了,既然 AlphaGo 是跟别人学的棋谱,那么这招是和谁学的?


李世石看到断这步棋,摇了摇头。




白棋有些地方下的莫名其妙,从进程看,黑棋越来越满意的局面。但是没确定的地方还多,黑棋不能放松。


都说人类要把局面搞乱,让机器犯错,现在看来机器也是这么想的。




王小川说,虽然自己坚信机器赢,但是在看到《Nature》的论文后,其实信心是下降的,特别是关注到谷歌围棋的“补丁”方式。不过今天来看,谷歌围棋进步很大……昨天也关注到了樊麾和谷歌比赛的细节,特别是找樊麾的时候谷歌是有“心机”的。樊麾虽然是欧洲冠军,但段位不高……还签了保密协议配合围棋宣传,所以一下子引爆了舆论。 


正是看到了谷歌在“全局”的部署,开始觉得AlphaGo在和樊麾比赛时候展现出的状态和论文分析,还不是全部……所以现在来看,谷歌围棋程序现在展现出的,确实很强大。再透露一下,昨天晚上谷歌工程师接受了新浪科技采访,他们说,这次谷歌围棋程序给李世石的胜率,可能是0%…....................................





左下边是明显的坏棋,明显黑棋得利。柯洁判断,AlphaGo 要输了。有评白棋最大的优势是心理稳定,换成人已经投降了。机器可能没设计认输的程序。





双方用时:李世石一小时5分 AlphaGo一小时2分


俞斌:从目前棋局的表现来看,李世石内心已经感觉胜利在望了! Google 工作人员表示,AlphaGo有投子认输的选项




AlphaGo使用蒙特卡洛树搜索算法,借助值网络与策略网络这两种深度神经网络,通过值网络来评估大量选点,并通过策略网络选择落点。机器最初通过模仿人类玩家,尝试匹配职业棋手的棋局,一旦它达到了一定的熟练程度,它开始和自己对弈大量棋局,使用强化学习进一步改善它。




【主持人】古力认为ALphaGo已经具备职业5-6段 但在某些细节上面却不如业余


俞斌:从现在来看,李世石风格放缓了,这么看的话,黑棋(李世石)已经占优了。赢面大增…




黑1立,局部杀气白棋不太行,但如果出现转换的情况让白棋把右下吃的太舒服,也不太好。




AlphaGo局部占了便宜,目数接近了。似乎电脑发挥并不稳定,有时候有惊喜,有时候也有瑕疵,仅从一盘棋还很难整体评估。




直播嘉宾表示现在已经近入白热化的状态了。峰回路转了吗,李喆说:我现在认为白棋(谷歌围棋程序)非常有希望赢。王小川说,我当时在知乎写了是机器完胜。


从招法来看,AlphaGo似乎一直在制造变数,希望搅乱局面,似乎都算清了似的。


黑1只能接了。




判断一下形势,目前白50目左右,黑不算右下是55目,右下还未定型。




黑127或许应128虎,实战实地损失有点大,看李世石表情也不轻松。柯洁现在说小李可能悬了,现在来看,这个程序的表现即使是最终输了,也已经足够经验了,他们的研发团队真的很了不起。




俞斌:之前AlphaGo算错了一步,但是比起李世石的两步来……谷歌围棋的失误要轻微很多。这个可能是转折点。李世石危险了!!!


李喆:现在基本进入大收官了。俞斌:之前还说樊麾下得不好,现在来看,李世石这两步也走得不好,可能是胜负点啊。


唐韦星和党毅飞说李世石不好,要输。



盘面李世石好,但贴目困难




李喆:现在谷歌围棋程序出现了一个不应该的失误。很意外。




双方用时:李世石37分钟,AlphaGo20分钟。


在李世石占据很大优势的时候,明显选择了求稳的心态,但不小心犯了错误。嘉宾说李世石的性格就是越挫越勇的性格,当给他足够压力的时候,李世石有很强的韧性,但是一直很顺利的时候,不一定步步下的很好。


王小川:现在比较奇怪的是,谷歌围棋程序的用时越来越多了,这个比较奇怪。按理说变量空间在变小,思考应该更快才对。李喆:谷歌围棋程序可能在用value(决策网络)做攻击了。


王飞跃说,最后计算粒度小度深,当然费时更多。


李世石贴目不太乐观。




开劫了!AlphaGo还剩15分钟。


俞斌:谷歌围棋程序出现的两个失误加起来,都比李世石的失误小得多。所以现在基本进入胜负判断状态了。




这次对战的人如果换成柯洁,会怎么样?李喆:这个不好说,因为谷歌围棋程序这次没有展现出完全碾压人类的实力。而且风格也不好判断。


如果赢了李世石,那电脑就是深不可测了。必须要有人赢了 AlphaGo,才知道它水平到了哪里?


李喆:这棋基本定了,谷歌围棋程序差不多取胜了。


俞斌:这棋基本可以宣判了,如果是我们比赛研究室,在这个阶段,可以收子了。 李喆:如果电脑不犯特别低级的失误,李世石基本输了。




李世石投子认输!!!


李世石 


1983 出生,1995 年入段,1998 年二段,1999 年三段,2003 年因获 LG 杯冠军直接升为六段,2003 年 4 月获得韩国最大棋战 KT 杯亚军,升为七段,2003 年 7 月获第 16 届富士通杯冠军后直接升为九段,拥有十多个世界冠军头衔。把他作为当今围棋界世界顶尖水平的代表应该不会有人提出异议。 


AlphaGo 


Google 旗下 DeepMind 公司开发的一款围棋人工智能程序,在与同类程序 Crazy Stone、Zen 的对抗中,以往的战绩为 495 战,494 胜,在让四子的情况下(让对方先下四个子),与 Crazy Stone、Zen 对战还能保持 77% 和 86% 的战胜率。可以说,AlphaGo 是现阶段围棋人工智能领域最厉害的角色。  



「招聘」

记者、编译和活动运营

全职和实习生都要

以及人工智能翻译社志愿者

详细信息请进入公众号点击「招聘」

或给 aiera_jobs@163.com 投邮件




您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存