【新智元—世纪对决】AlphaGo 惊天逆转李世石 ，关键棋局解析

【新智元—世纪对决】AlphaGo 惊天逆转李世石，关键棋局解析

2016-03-09 新智元

新智元原创1

整理：王嘉俊

感谢陈雷及新智元群友的参与

万众瞩目的李世石 VS AlphaGo 世纪大战结果出炉！

AlphaGo 惊天逆转，战胜李世石！开局李世石有些动摇，但随着棋局的进行，李世石渐入佳境，形势越来越好了。但正当大家都认为棋局已到垃圾时间的时候，李世石一个小失误，局面重新变得扑朔迷离。AlphaGo 成功凭借李世石的失误，成功逆转，AlphaGo 获得了胜利！

这是人工智能和围棋领域的历史性事件，人工智能第一次在围棋领域战胜了世界冠军！

从整体来看，AlphaGo 的水平表现的强弱分明，有非常好的妙手，也有非常“业余”水准的电脑棋，但 AlphaGo 一直没有太大的失误，在李世石出现大失误的时候成功抓住，惊天逆转！

从招法来看，AlphaGo 似乎一直在制造变数，希望搅乱局面，似乎都算清了似的。AlphaGo 在复杂的环境当中，表现的稳定性要优于李世石。而当李世石出现失误的时候，AlphaGo 准确抓住并获得了胜利！

不过这盘棋还没有出现“打劫”的情况，我们还没有办法看到机器的缺陷。

在李世石占据很大优势的时候，明显选择了求稳的心态，但不小心犯了错误。嘉宾说李世石的性格就是越挫越勇的性格，当给他足够压力的时候，李世石有很强的韧性，但是一直很顺利的时候，不一定步步下的很好。

昨天新智元专访了周志华和王飞跃，也提到了心理因素，是这场比赛的胜负手。比赛结果也表明了，面对没有情绪的计算机，人类的情感是比赛的不稳定因素。

在比赛前，新智元就建立了人工智能 & 围棋领域的专家微信群。Caffe 作者贾扬清说，AlphaGo 是拿 Torch 写的程序。

香港科技大学杨强教授在群里贴出了美国 AAAI Fellow 的预测，其中专家认为 AlphaGo 胜利的比例占到了 69.1%。不过杨强教授也说，美国人大部分不懂围棋。

新智元也在比赛前做了即刻调查，例如调查中计算机界参与过半，其中 51% 的人认为李世石会获得胜利。

感兴趣的朋友可以加入我们的人工智能 & 围棋专家微信群，扫描下面的二维码加入。

关键棋局解析

AlphaGo 白棋，李世石黑棋，按照中国的规则。

李世石的开局很怪异，第 7 手选择了很少见的变化，也许是李世石觉得必须下机器没学过的招法。

AlphaGo 托角，在人类看来是非常不好理解的，这一步普通跳一个也可以，黑棋右边位置很低。新智元微信群里的职业选手说，这一步基本上围棋高手都不会那么下。

从开局来看，倒感觉退步了似的，下出了人绝不会选择的招法，也可能电脑真的超越人了。

不过这时候王飞跃老师说：“要沉住气。”

白棋这步有意思了，有人说这是“俗而有力”，让李世石有些难受。

到了这一步，陈雷说现在还没到计算的环节，依然是靠感觉在走。计算的时候考验程序的实力，Policy NetWork 在感觉环节还是很准的，后面得看在计算的环节，AlphaGo 的走子能力。

到了这个阶段，李世石还是占有一些优势，但李世石陷入了思考。

李世石选择了挡，李世石刚正面，这步的意思就是我力量比你大。这就进入了计算的环节，开始看 AlphaGo 的走子能力！

进入到复杂的战斗，开始冲断白棋。AlphaGo 的时间控制很不错，不浪费时间在简单的地方。田渊栋说这个程序写起来很容易。

李世石和 AlphaGo 继续力抗。

李世石坚定的一挡，AlphaGo 白棋选择了断。黑棋开始冲断。

白棋拐出。群里开始有人说，李世石在“放水”。这个局部非常重要，基本决定了整个棋局的走势。古力说，李世石这个走法，已经失败了。

黑棋扳，为了避免左边的两个子被直接征吃。在这个局部，AlphaGo 占据上风。李世石之前的挡住太丧了，这局面黑棋难收拾。

白棋在防止被黑棋征吃的同时，也瞄着四路冲断。因此李世石补在了 2 路，以防冲断。白棋选择了 44 逃出 3 子。这个变化应该是 AlphaGo 选择不简明。

李世石意图补强自身，并威胁右边的眼位。唐奕说，AlphaGo 48 以下应保留，把右边大块的眼位给卖了。

李世石选择了攻击白棋。

提问：

【提问】硬件当中会有gpu和cpu共同工作吗？

【张峥】是，用少见的开局也许可以增加长距离蝴蝶效应的可能性。一进入局部就不好办了。

【田渊栋】一直是两者同时工作的，cpu搜索，gpu评估局面。

越来越多人说李世石在放水了。李世石补断点。

目前 AlphaGo 表现出的战斗力是惊人的。几乎没什么漏招。AlphaGo 至今表现出极其冷静。

白棋选择了靠，大家表示不理解......电脑棋？AlphaGo 确实不走寻常路，优劣倒也难说，黑棋吃了是不见得便宜。

有人说李世石确实勇猛，但 AlphaGo 的棋是陷阱么？

提问：

【董飞】我记得有人问google作者，电脑是怎么下这一步的，他也不知道。不是靠背棋谱就可以知道的。

【提问】为什么google作者自己都不知道电脑怎么下棋的呀？不是他们设置学习机制的吗？

【田渊栋】设置了机制但是不知道这个机制如何学得棋谱模式。要是知道了，对AI来说是非常大的突破。所以AlphaGo可以走很好的棋，但是制作者不知道这个是通过什么推理方式算出来的。

李世石选择了不吃。吃了要俗一手而且愚形还要被引征一个，不一定便宜。柯洁说，顶级选手下棋，都是直觉有几个点，然后进行验算。刘知青教授说计算机也是这样。

现在有 7 块棋做对杀，如果 AlphaGo 能找到机会，那么已经非同寻常了。

他们要在这个地方做形状整理，黑棋防止白棋挖断，在整形的同时，双方都在争取获得先手。

作战对李世石作战有利。

白棋贴，不放弃。继续肉搏。但 AlphaGo 既然敢于这么下，肯定是算过有信心的。

李世石 77 吃住中央白棋两子，将中间完全控制住，此时黑棋形势主动。

李世石逐渐获得优势。大家开始看好李世石获得胜利。

77手，李世石首次离席。对手一般会等对手回来才落子，但电脑就没有这样的“觉悟”，果然电脑马上就落子了。

【主持人】插播媒体朋友的提问：我们能否说 AlphGo 现在已经能够判别局势，而不是只判断接下来的几步范围内，哪个位置最优？

【田渊栋】value network和playout都是用来判断局势的,判断哪步棋最优也要靠这两个.policy network给出候选的走子,然后由上面这两个判断哪步比较好

目前来说，支持李世石的占多数。

现在谷歌围棋程序的风格来看，AlphaGo 不怕事儿多。王小川解释说，因为机器没有“事儿”多的概念……事儿多事儿少对它处理起来都一样…

李世石回来了，左下挂角。AlphaGo脱先在上方补了一手。AlphaoGo的这步棋非常稳健。

吴肈毅：从现在的下法来看，如果 AlphaGo 没有变化，败下阵来的可能性比较大。

古力说，李世石回来的时候，有一个很熟悉的手势，这是找回信心的标志。李世石赢面很大。

白 84 这个下法不太常见。

韩国金成龙九段：成为职业棋手27年来，第一次看到白断这手棋！那么问题来了，既然 AlphaGo 是跟别人学的棋谱，那么这招是和谁学的？

李世石看到断这步棋，摇了摇头。

白棋有些地方下的莫名其妙，从进程看，黑棋越来越满意的局面。但是没确定的地方还多，黑棋不能放松。

都说人类要把局面搞乱，让机器犯错，现在看来机器也是这么想的。

王小川说，虽然自己坚信机器赢，但是在看到《Nature》的论文后，其实信心是下降的，特别是关注到谷歌围棋的“补丁”方式。不过今天来看，谷歌围棋进步很大……昨天也关注到了樊麾和谷歌比赛的细节，特别是找樊麾的时候谷歌是有“心机”的。樊麾虽然是欧洲冠军，但段位不高……还签了保密协议配合围棋宣传，所以一下子引爆了舆论。

正是看到了谷歌在“全局”的部署，开始觉得AlphaGo在和樊麾比赛时候展现出的状态和论文分析，还不是全部……所以现在来看，谷歌围棋程序现在展现出的，确实很强大。再透露一下，昨天晚上谷歌工程师接受了新浪科技采访，他们说，这次谷歌围棋程序给李世石的胜率，可能是0%…....................................

左下边是明显的坏棋，明显黑棋得利。柯洁判断，AlphaGo 要输了。有评白棋最大的优势是心理稳定，换成人已经投降了。机器可能没设计认输的程序。

双方用时：李世石一小时5分 AlphaGo一小时2分

俞斌：从目前棋局的表现来看，李世石内心已经感觉胜利在望了！ Google 工作人员表示，AlphaGo有投子认输的选项

AlphaGo使用蒙特卡洛树搜索算法，借助值网络与策略网络这两种深度神经网络，通过值网络来评估大量选点，并通过策略网络选择落点。机器最初通过模仿人类玩家，尝试匹配职业棋手的棋局，一旦它达到了一定的熟练程度，它开始和自己对弈大量棋局，使用强化学习进一步改善它。

【主持人】古力认为ALphaGo已经具备职业5-6段但在某些细节上面却不如业余

俞斌：从现在来看，李世石风格放缓了，这么看的话，黑棋（李世石）已经占优了。赢面大增…

黑1立，局部杀气白棋不太行，但如果出现转换的情况让白棋把右下吃的太舒服，也不太好。

AlphaGo局部占了便宜，目数接近了。似乎电脑发挥并不稳定，有时候有惊喜，有时候也有瑕疵，仅从一盘棋还很难整体评估。

直播嘉宾表示现在已经近入白热化的状态了。峰回路转了吗，李喆说：我现在认为白棋(谷歌围棋程序)非常有希望赢。王小川说，我当时在知乎写了是机器完胜。

从招法来看，AlphaGo似乎一直在制造变数，希望搅乱局面，似乎都算清了似的。

黑1只能接了。

判断一下形势，目前白50目左右，黑不算右下是55目，右下还未定型。

黑127或许应128虎，实战实地损失有点大，看李世石表情也不轻松。柯洁现在说小李可能悬了，现在来看，这个程序的表现即使是最终输了，也已经足够经验了，他们的研发团队真的很了不起。

俞斌：之前AlphaGo算错了一步，但是比起李世石的两步来……谷歌围棋的失误要轻微很多。这个可能是转折点。李世石危险了！！！

李喆：现在基本进入大收官了。俞斌：之前还说樊麾下得不好，现在来看，李世石这两步也走得不好，可能是胜负点啊。

唐韦星和党毅飞说李世石不好，要输。

盘面李世石好，但贴目困难

李喆：现在谷歌围棋程序出现了一个不应该的失误。很意外。

双方用时：李世石37分钟，AlphaGo20分钟。

王小川：现在比较奇怪的是，谷歌围棋程序的用时越来越多了，这个比较奇怪。按理说变量空间在变小，思考应该更快才对。李喆：谷歌围棋程序可能在用value(决策网络)做攻击了。

王飞跃说，最后计算粒度小度深，当然费时更多。

李世石贴目不太乐观。

开劫了！AlphaGo还剩15分钟。

俞斌：谷歌围棋程序出现的两个失误加起来，都比李世石的失误小得多。所以现在基本进入胜负判断状态了。

这次对战的人如果换成柯洁，会怎么样？李喆：这个不好说，因为谷歌围棋程序这次没有展现出完全碾压人类的实力。而且风格也不好判断。

如果赢了李世石，那电脑就是深不可测了。必须要有人赢了 AlphaGo，才知道它水平到了哪里？

李喆：这棋基本定了，谷歌围棋程序差不多取胜了。

俞斌：这棋基本可以宣判了，如果是我们比赛研究室，在这个阶段，可以收子了。李喆：如果电脑不犯特别低级的失误，李世石基本输了。

李世石投子认输！！！

李世石

1983 出生，1995 年入段，1998 年二段，1999 年三段，2003 年因获 LG 杯冠军直接升为六段，2003 年 4 月获得韩国最大棋战 KT 杯亚军，升为七段，2003 年 7 月获第 16 届富士通杯冠军后直接升为九段，拥有十多个世界冠军头衔。把他作为当今围棋界世界顶尖水平的代表应该不会有人提出异议。

AlphaGo

Google 旗下 DeepMind 公司开发的一款围棋人工智能程序，在与同类程序 Crazy Stone、Zen 的对抗中，以往的战绩为 495 战，494 胜，在让四子的情况下（让对方先下四个子），与 Crazy Stone、Zen 对战还能保持 77% 和 86% 的战胜率。可以说，AlphaGo 是现阶段围棋人工智能领域最厉害的角色。

「招聘」

记者、编译和活动运营

全职和实习生都要

以及人工智能翻译社志愿者

详细信息请进入公众号点击「招聘」

或给 aiera_jobs@163.com 投邮件

警察殴打打人学生，舆论撕裂的背后

你手放哪呢，出生啊

薅广电羊毛！100元话费实付94.6元，还有电费96.9充100元！招团长~

警察踢打校园欺凌者：当事人不愿返校，派出所拒收锦旗

疯传！广州地铁突发！警方介入