查看原文
其他

AlphGo zero成长轨迹16——人工智能思考的奥秘

铁船长 A铁船长围棋B 2024-03-04

这是 AlphGo zero对 AlphGo Master 版的第14局, Master再次奇迹般执白中盘胜!


本局双方历经了两次大劫争,一次大转换,最终以大龙横死这种暴烈的方式决出了胜负。执白的Master 好像是找到了感觉,再度以弱胜强,就像是神话中的勇士齐格菲尔德击败了巨龙。


棋谱1 (1—45)AI 常见定式大集合


开局就是AI流的定式大集合。

左上黑7点三三多爬一手是AI风格,黑棋虽然先手得角,但白棋的外势一样不坏。

船长从来都不神话点三三的作用,认为这个定式充其量是两分。假如点三三绝对有利的话,那么AI早就把星位占角给淘汰了,这就是铁的证据。

右上黑21以下是多次出现的AI定式。黑棋先手吃通棋筋获得厚势很舒服,不过本局左边正对着白棋的硬头也没有什么作用。但双方大神都明白这一点,做一个妥协吧,总不能好处都得了。

船长的判断:这个定式本质上讲也是一个场合定式。只有在左边黑棋没有发展方向的时候才可以使用,否则先手获得厚势无条件黑好。运用的时候要注意方向。

左下角白42的压很有意思。传统定式往往是A退,AI变化也有B位点。本局白棋就大大方方的压一下,然后占据44位大场。局部实地有损失,但全局很好,这就是Master的大局感吧,真的和人类很像。

黑45双方必争点,正是所谓“天王山”。

船长感觉:C位肩冲很醒目


棋谱2 (46—64) 怪异的进攻



黑47竟然选择从这边拆一!违反了一切人类的棋理。

白48以下连扳打劫是普通的定型。

白58和60的组合手段称得上才华横溢,值得人类学习。


黑61在这里压是一种高效的间接补强手段。说明船长下一图的担心是有道理的。

白62压64飞手段简明棋形舒展,不太在乎实地的得失,颇有人类大师的风范。而且64飞后黑棋下方的潜力彻底被打散了。


这是船长的“伪人工智能”流预想图

黑棋按照经典的“搜根—进攻”理论用尖顶,以下变化之一黑棋未见有利。不知道是否有此担心,黑棋选择47拆一。也许在AI大神的博弈中,右上角不见得被看成谁的厚势呢?

Master和zero区别在哪里呢?


首先科普一下人工智能的小常识。

第一,AlphaGo开发的原理并不是直接在后台利用坐标进行计算,而是像人类下棋一样面对棋盘,先进行图形识别,然后再进行计算。

第二,AlphaGo并非完全依靠大量的计算取胜,也就是说面对一个棋形,AlphaGo会先找到一个“魅力点”,然后再去运算验证。这个和人类高手强调的“感觉—计算—判断”的流程是一致的。

也就是说人工智能更追求的是类似于人类直觉的那种“棋感”,而不光是滴水不漏的计算。

第三,AlphaGo既然是人工智能,强调的是一种深度学习,就要利用大数据。

AlphGo Master 包括之前的版本,是把许多历史上人类大师的经典着手(比如秀策的耳赤之手)都收集起来进行学习,然后在关键时刻更多地利用一种智能,或者说“机器的直觉”,找出最佳的一手。

第四,在利用大数据学习这一点上,AlphaGo zero和Master是有区别的。

Master是大量参考了人类的棋谱,因此从原理上来讲Master的着手更加有人类大师的风范。

而 zero完全是自主学习,就是完全通过自我对局积累数据进行成长,从不参考人类的棋谱,可以说属于“外星人围棋”。

因此 zero完全不受人类“棋感”的影响,即便有和人类相同的着手只能说是“殊途同归”,这样的着手可谓“不二法门,棋之正道”!

也就是说master和zero的根本区别不一定是算法不同,也不一定是运算能力上差别,最大的不同应该是在进行深度学习时采用的大数据不同吧。一个是人类对局,一个是机器的自我对局


当然了,这只是船长的理解,不一定对。但原理应该大差不差。


棋谱3 (65—93) 搜根要到这里!


面对黑65的打入,第一感似乎应该77位镇头,而白66竟然二路飞!

也许Master在和zero的斗争中吸取了经验教训,不再走以往那种看似大局,其实华而不实的着手。代之以稳准狠的手段。从下三路开始攻击,类似于“虎爪绝户手”。

以下双方各自整形,手段大同小异。


棋谱4 (94—119)孤棋和远方

白94扳头,既瞄准右上角黑棋的弱余味,还窥视着右边黑棋的孤棋,顺便还对左边的大龙做着遥远的幻想。

这是标准的缠绕攻击,很像是人类的智谋。按照人类解说的惯例,应该说这是意味深长的一手,有一石三鸟的作用。


也许是“轻敌”,面对屡次失败的对手,黑棋展示出了临危不惧的勇气。两块孤棋各自做活,局部也是寸土不让。

白棋102,122两手方向正确。坚持厚势不围空,拼命把黑棋往自己的铁墙上面赶。哪怕左边的空被破掉也在所不惜。

至白118为止,“失之东隅,得之桑榆”。刚才看似还有些不安的右下白棋,隐然已形成20目实空。这就是攻击的收获吧。


棋谱5 (120—155) 第一次劫争

白22继续进攻,黑23似乎有失谨慎,白24以下的分断凌厉至极!

黑棋当然可以向外逃跑,但可能是对自己的治孤手段特别自信,在局部引爆了一个天下大劫,可以说是万劫不应。白棋找本身劫材,把黑棋大龙切断了半条。


从结果来看双方得失相当,但从全局上来看白棋似乎有了更多的头绪。


棋谱6 (156—175) 大转换


白58点的目的是最高效率把黑棋半条大龙吃掉,因此黑棋在局部也是拼命反击,不想让白棋得逞。

白6次序,黑63选择转换,以下变化必然,黑棋始终得不到白70位打的机会。

至白7为止告一段落。黑棋跑出中央大龙,但右上全体阵亡,目测判断白棋至少占了10目的便宜。


黑75只能切断左边白棋残子进行顽抗。


棋谱7 (176—197)吞吃残子二次劫争


白80靠棋形要点。白86冲找劫的时候儿黑棋已经无法连接,中央大龙只好单独做活。

白94粘找劫的时候黑棋局部先走可以做活,但会有无穷无尽的劫材。于是黑95破釜沉舟把劫粘上。


棋谱8 (198—226) 诸神的黄昏

白98要点,否则黑棋利用109位的一路尖能做活。以下对于AI来说就是走走过场,增加一点仪式感而已。

船长感想

Master再度获得奇迹般的大胜,船长就像盗火的普罗米修斯一样,试图从中窥视AI思考的奥秘。

在观看棋局的进程中,总是忍不住站在白棋的角度。不完全是支持弱者,更是因为白棋Naster的思路和我们人类很像,毕竟这个版本开发的时候,还有很多人类的“数据基因”在里面。而zero开发的时候,已经全都是自主学习了。因此Master看起来多少有些亲近感吧。




AlphGo zero成长轨迹15

AlphGo zero成长轨迹14

AlphGo zero成长轨迹13

AlphGo zero成长轨迹12

AlphGo zero成长轨迹之11



 铁船长微信


继续滑动看下一个

AlphGo zero成长轨迹16——人工智能思考的奥秘

铁船长 A铁船长围棋B
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存