查看原文
其他

人工智能与直觉

行者之心 心镜818
2024-11-26

人类有两种常见的思维,一种是建立在逻辑推理上的理性思维,一种是直觉思维。理性思维可以解释前因后果,直觉则属于一种神秘力量,我们能不能让电脑也模仿人类产生直觉思维呢?



01

从深蓝到更深的蓝


人脑和电脑相比,无论存储数据的量还是计算速度都远远比不上越来越先进的电脑。但早期电脑只运用纯粹逻辑运算,虽然有超强大的计算能力,但在很多智力比赛中比不过人脑。


1996年IBM推出深蓝计算机用来下国际象棋,其中包括480颗特制的超大规模象棋运算芯片,处理速度可以达到每秒计算一亿步棋,这个计算速度比人类大脑恐怕要快几百万甚至上千万倍,但当时依然败给了人类顶级棋手卡斯珀罗夫。


直到第二年,IBM推出更深的蓝,运算速度提高到每秒两亿步棋,最后才以3.5比2.5的微弱优势击败卡斯帕罗夫。虽然卡斯珀罗夫怀疑IBM公司作弊,因为一些电脑招法似乎像是有人类高手在后面操纵,但IBM拆掉了更深的蓝,宣布电脑退役,所以也不知真相到底如何。


与国际象棋相比,围棋的计算复杂性要高出太多。如果把围棋的运算复杂度比作太平洋,那么国际象棋充其量只是家中的一个小澡盆。所以当时人们猜想电脑至少需要100年,甚至永远都无法击败顶尖人类围棋高手。因为围棋的复杂性让围棋摆脱了纯粹的计算,而上升到艺术甚至求道的高度,而如何用算法计算艺术和道呢。

(卡斯帕罗夫败给更深的蓝)


02

围棋,坠下神坛


然而仅仅在更深的蓝击败人类国际象棋冠军后的20年,2016年,隶属谷歌的深思(DeepMind)公司开发的阿尔法狗就以4:1战胜围棋界传奇人物,韩国飞禽岛天才少年李世石。


深思公司刚开发出阿尔法狗时,心中还没有底气,不知道这个狗的棋力有多强,因为当时市面上最强的电脑围棋也只有业余中高手的水平,距离职业棋手的棋力相距甚远。后来他们找到欧洲围棋冠军樊麾进行测试。樊麾虽然是欧洲围棋冠军,但围棋的顶尖棋手都集中在中日韩三国,樊麾只有专业二段棋力,属于弱职业棋手。


当深思公司找到樊麾时,樊麾完全没有把阿尔法狗放在眼里,当对方问比赛用时多长时间时,樊麾就说一小时足以,他以为阿尔法狗只比一般电脑围棋稍微强一点。但比赛一开始,樊麾就发现自己犯了严重的错误,对手出乎意料的强,一小时比赛时间完全不够自己认真计算,最后樊麾0:5败北。


当阿尔法狗战胜樊麾后,它的下一个目标是传奇棋手李世石。李世石看了阿尔法狗和樊麾对局的棋谱,认为阿尔法狗并不很强,不仅他自己,当时围棋界大佬都认为李世石会轻松5:0胜出,赢得一大笔奖金。


然而谁都没有意识到阿尔法狗在和樊麾比赛结束后数月内通过深度学习又有了突破,最后竟然以4:1击败了李世石。而阿尔法狗败给李世石唯一的一盘棋也就是阿尔法狗在对人类正式比赛中的唯一败绩。而这一盘棋李世石也赢得也非常侥幸,其中一步棋被称为神之一手,一下戳中阿尔法狗软件中的一个bug,于是阿尔法狗突然发疯,胡乱走了几步就败下阵来。后来这个人类在与阿尔法狗正式比赛中唯一胜局的棋谱被以非同质化代币(NFT)的方式拍卖了约20万美元。


之后一年中,深思公司先推出阿尔法大师,在网络上先以60:0的成绩横扫几乎所有人类高手,后来又在中国乌镇3:0战胜当时世界排名第一的中国棋手柯洁。柯洁在输掉第三局比赛时失声痛哭,因为他感觉阿尔法大师太厉害了,如同围棋之神一样完全无法撼动。


但深思公司并没有停步,不久又推出更加强大的阿尔法零。阿尔法零和以前的版本有本质区别,以前的软件都是通过学习人类对局来增长棋力。而阿尔法零没有学习任何人类棋手对局,从零开始,只通过自我对局来学习围棋。三天后阿尔法零超过了阿尔法狗,21天达到阿尔法大师的水平,40天后阿尔法零已经一骑绝尘而去,再无敌手,而它自我对局留下的100张棋谱成为现在人类高手学习围棋的最高秘籍。


就这样,在不到两年的时间里,人们从开始对电脑围棋的不屑一顾,到最后谈“狗”色变。后来深思公司公布算法,于是市面上出现一批可以战胜人类顶级高手的围棋软件,而且不需要特别配置的硬件。围棋,这个象征最高智力对抗的游戏,被推崇到艺术和求道高度的神秘领域,被人工智能彻底攻破了。这之后,恐怕再难有任何智力领域,人类智能可以抵挡人工智能的挑战。

 

(排名第一的职业棋手柯洁在败给阿尔法大师后痛苦地哭泣)


03

直觉思维,开挂的钥匙


阿尔法狗在围棋上的突破并非来自于计算能力的提升,而是找到了开启思维的新思路,就是模拟人类的直觉思维。


人类下围棋依靠两种能力,一种是直觉,这就是所谓的棋感,另一个则是计算能力。计算能力大家都容易理解,就是在脑海中思索自己下一步棋,对手怎么应,然后自己再如何下。围棋高手可以计算几十步以后的变化,即使业余棋手,也至少可以计算三、五步之后的变化。


围棋计算很累,很费时间,因为脑海中要能想象出好几步甚至几十步之后的变化很不容易。如果旁边另有一个棋盘,棋手可以把自己的想法摆在真实棋盘上研究变化自然可以节省许多脑力,但真正比赛不可以这样。


如果和电脑比赛计算能力,那人类远不是对手。高手虽然可以计算几十步后的变化,但许多步往往都是一本道,就是应对方式只有一个,这样即使是计算几十步,但脑海中真正呈现的变化不会超过一百个。但电脑搜索百万,千万,甚至上亿的变化都是轻而易举的事,所以比计算,人类远远不是电脑的对手。


然而人类棋手的神秘能力是直觉,一看棋局,马上就可以感觉到关键点在哪里,这时计算也只是围绕几个关键点进行,而不是满盘统算。因为围棋每一步都可能有上百个合法选点,哪怕只是计算四步棋,如果考虑所有可能性,就会有上亿种变化,这远超出人类脑力范围。而人类棋手依靠直觉,所以每一步只会考虑数个变化,很多时候虽然计算步数很多,但很多步都通过直觉筛选掉,往往一步棋只考虑几种甚至一本道,就只有唯一一种应对方法。


职业棋手和业余棋手下指导棋时,经常一人对数人甚至十多人,那时职业棋手下棋完全凭直觉,无需计算就可以把大多数对手击败,所以看起来依然很轻松。但是这个围棋直觉到底是什么呢?


(神秘的直觉思维)


03

神经网络,模拟人类直觉


阿尔法狗结合了两种算法来模拟人类下围棋。其中一个是蒙特卡罗树搜索,这是一种典型的搜索计算方法,很早就被人采用,需要大量的计算资源,另外一个是模拟人脑结构的神经网络。


蒙特卡罗树模拟人类的计算能力,而神经网络则模拟人类的直觉。神经网络在比赛过程中并不需要很大的计算量,如同人类依靠直觉下棋不需要太费脑力一样,但神经网络却需要通过大量的训练才能建造起来,这和职业棋手的直觉或棋感也需要通过许多年的刻苦训练才可以培养出来是一样的。


谈到直觉,人们往往感觉很神秘,因为直觉判断不像逻辑判断一样可以给出理由,往往是一看就给出判断。人类中男性通常相对更加理性,而女性却更偏重直觉思维。比如见到一个陌生人马上就感觉是个可以信任的好人等等,问她什么理由,她则回答不出来。


那么神经网络到底是个什么东西,计算机如何通过神经网络来模拟人类直觉呢。作为一篇科普文章,我这里就不介绍神经网络细节,只给出大概思路。


神经网络包括输入和输出,中间部分可以认为是一个黑盒子,里面有不同结构的设置。设计一个神经网络首先确定结构,结构确定后,它的关键是里面有许多参数,参数数量的多少由结构的复杂程度决定。


当结构,参数都给定之后,神经网络就可以工作了。工作原理非常简单,在输入口给定输入值,然后经过网络计算,直接在输出读取结果。一个下围棋的神经网络,输入就是当前棋局的状况,输出则是下一步走在不同位置的胜率。当然胜率最高的点就是最优选择了。


然而神经网络的输出到底正确不正确呢?这就要依靠内部参数是否合理来决定了。复杂神经网络内部参数非常多,开始设置通常都设成一个固定值或者随机值,然后通过不断学习的反馈来调整内部参数,让参数越来越合理,最后给出的预测就越来越接近真实。


所以神经网络无法对结果给出合理性解释,只能说通过内部计算就得出这个结果,当然参数的调整是通过无数次学习反馈调整来慢慢优化的。


比如说最厉害的阿尔法零,刚开始只知道围棋规则,它下的棋如同猴子一样乱走一气,这说明它的神经网络的参数很不合理的。然而它通过自我对局,不断调整参数,慢慢地棋就越下越厉害。等40天训练结束时,它已经自我对局490万局。通过这么多次的对局,它的网络参数越来越优化,这也意味着它的围棋直觉越来越准确强大。这时哪怕它不用任何后面的树计算,单凭神经网络产生的直觉,也已经是非常厉害的围棋软件了。


人类作为地球统治者,他所依靠的就是强大的思维能力。然而人工智能首先在逻辑思维中远远超过人类,现在又掌握了模拟人类直觉的方法,并且也超过了人类,不知道将来还有什么人类智能可以完成的东西无法通过人工智能更快更好地完成。

(深层神经网络可以模拟人类直觉)


继续滑动看下一个
心镜818
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存