查看原文
其他

人工的寡头智能 | 李想主义·第11期

2016-03-20 李想主义 小也电台

 点击上方蓝色“小也电台”可快速关注

上周的一个热点,就是李世石和AlphaGo他们的围棋人机大战落下了帷幕,4:1,AlphaGo获胜。然后各种人工智能的话题就发酵了。今天,李想也来凑个热闹,也来发酵一下,来说一说人工智能。


【李想主义·第11期】

人 工 的 寡 头 智 能

主播/作者:李想 | 李想主义




欢迎来李想。


上周的一个热点,就是李世石和AlphaGo他们的围棋人机大战落下了帷幕,4:1,AlphaGo获胜。然后各种人工智能的话题就发酵了。今天,李想也来凑个热闹,也来发酵一下,来说一说人工智能。


其实在前几天工作日的时候,每天一分钟的节目,也聊过两三期关于人工智能,但是觉得不过瘾,有很多问题来不及讲透,或者说从我理解的角度,把它讲得很清楚。所以趁今天是周末,时间比较自由,我就来聊一下人工智能。


我们还是回过头,从AlphaGo和李世石的人机大战开始说起。主角当然是AlphaGo,因为它是机器。李世石是人,就不用多聊。AlphaGo我之前说到过,它的算法分为“值网”络和“决策网络”两大块。


我们先来看,什么是值网络。以前我也说过,值网络就是负责计算下一步棋的。但是它是计算什么的下一步棋呢?包括两方面,第一是计算自己这一方的棋怎么走,还有一方面就是预判对方的下一步怎么走。


为什么要预判对方的下一步棋呢?是因为如果对方下一步棋是在AlphaGo预判的范围内,那么AlphaGo 的搜索范围就会减少,也就是时间减少,围棋规则中还有时间规定的,这是我们中国的围棋规则。


具体的时间,我们先放一边,我们要知道,AlphaGo是如何知道下一步棋该怎么走。在聊这一部分之前,先说一下在这一场人机大战之前,最著名的一场人机大战就是IBM的“深蓝”对阵马斯卡洛夫的国际象棋大赛,最后当然也是深蓝赢得了比赛。


但是那一场的深蓝和AlphaGo去找下一步棋的方法是不一样的。深蓝在当时使用的思路叫穷举法。就是对方下一步棋,深蓝就会根据国际象棋的比赛规则把接下来所有的棋都计算一遍,从中选出最好的一步。虽然计算能力需要很大。


上面提到的只是一种思路,而在实战当中,深蓝并没有把所有的步骤都计算出来,因为时间不够,它只是计算了接下来的12步。这样就已经足够了,在和帕斯卡洛夫对阵中,已经战胜了帕斯卡洛夫。


那么围棋就不一样,因为围棋的变化量极其庞大。所以为什么说我们中国人下的这个围棋,以人的智慧,是能掌控这个棋局,但是他不是从计算量上面去掌控,而是从感觉上去掌控,这就是我们常说的棋感。


我们经常在观棋的时候会说“味道”不对,原因就在于说不出一种具体的计算结果,只能凭直觉,这和中国的文化有关系。但是这种直觉关注的是整体、大方向。当这种整体、大方向真确,我们就会说,“味道”比较好。


那围棋这种变化有多庞大呢?它的庞大超越了现今知道的全宇宙的原子个数的总和。所以,我们还是用穷举法来计算围棋,基本上就不可能完成了。所以,就启用了一种方法,叫蒙特卡洛树搜索的方法。


蒙特卡洛树搜索的方法,大致是随机取一个数,也就是随机下一手棋,放到棋局当中来,然后再随机下一手棋,来比较两者优劣,保存较优的那一个。循环往复,依次类推。


在计算机算法中,蒙特卡洛树搜索,是一种最常见的思维方式,不是一种算法,这种思维方式在有限的取数范围内,能找到最优解,但是如果取样范围不充分,就只能找到较优解。


这就是蒙特卡洛树搜索在AlphaGo中的运用。在AlphaGo和李世石对弈之前,已经和自己的分身下过了无数盘棋,而且它还和很多职业棋手下过棋。在这些过程中,它就积累了许多较优的下法,并存储下来。这就是“学习”能力。


如果了解计算机的人就会知道,这样会产生大量的数据存储需求。我的感觉,在整个系统中,应该还应用到了云概念。当然还有其他的算法也会和云相结合。所以它是一定会接入网络的。


问题又来了,当随机下一手棋,如何来判断优劣呢?这几乎没有办法实现,因为刚才说过,推演枚举的数据量太大,那AlphaGo就引入了另外一个概念,叫缩减算法。就把棋局缩减到某一个一个局部的区域,但不是固定的缩减。


它的缩减是基于当下的一步棋,它周围的一些变化。那有人就会问,本来蒙特卡洛树搜索对于围棋来说,要找到一步比较好的棋,就已经非常花时间了,时间复杂度非常大,还要来插入缩减算法,又是为什么呢?


这就要看算法的平衡的问题了。因为每一步棋来计算整体棋局就会花大量的时间,那么如果插入的缩减算法能够把计算聚焦到某一个局部的话,这个算法所耗的时间要比总体计算的时间少,那就自然会选择缩减算法。


如果我们有些概念,就知道,这种缩减是会带来几何级的运算缩减的。所以,嵌入缩减算法一定会是一个好的选择。我们描述一下,先进行缩减算法筛检,然后再运用蒙特卡洛树搜索,这样就是AlphaGo学习或者实战的方法描述。


刚才描述的就是值网络。我们再来看决策网络。通常来说,下棋的系统,下一步棋怎么下是重点。但是围棋里还有一个更大的点,就是怎么认输。象棋的认输是很容易看得到的,能计算出来的,但是围棋复杂得多。


围棋的认输有两种,一种是下到无子可下,然后收官,数棋子;另外一种是中盘,经过判断,认为再下都是输,就可以投子认输。这就是对于棋局的判断。所以说对棋局的总体的判断是很重要的一个点,甚至是支持你下一步怎么做。


因为在围棋的棋局中,当在局部有优势的时候,全局未必就有优势,当全局有优势的时候,局部未必就有优势。围棋的难度就在这里。当棋局比较宽松的时候,棋手可以多做一些局部意外的布局,当棋局比较吃紧的时候,就需要在局部分毫不让。


决策网络就是来判断全局的。决策网络是怎么做的呢?当下完一步棋之后,棋盘上不适还有空格吗?AlphaGo就从实现存储的大量棋谱中来匹配。通过大量的棋局匹配和结果比对,就会得出接下来的这句棋的赢面有多大。


在这次人机大战中,第四局,李世石赢过一局,这一局就是AlphaGo投子认输的,而不是收官后数棋子的。这个投子认输就是总体判断出来的。这个赢面的设置,我看到的报道中说,AlphaGo 的技术团地把赢面设置到低于20%就投子认输。


看回“决策网络”,这种决策网络的运用,对于人工智能才是真正的智能开发方向。


回到比赛中,单看第四局,就是李世石获胜的那一局,我们看到,盘中的所谓“神之一手”,在李世石下完这一手之后,因为这一手之前很少出现在对弈中,就使得AlphaGo开始“凌乱”了,即无法从经验中找到最优解。


那既然无法从经验中获取最优解,就只能在现场去获得最优解。我们就看到AlphaGo开始下“臭棋”了,而这种“昏招”,就是AlphaGo开始随机取值,进行“学习”的过表现。但是这次的比对就变成了极其和人,而不是AlphaGo自己对自己了。


这个例子就能看到蒙特卡洛树搜索的表现。而这种表现完全是机器的。我们可以想象,如果这“神之一手”的对手不是AlphaGo,而是柯结,一定不会启动“学习”程序,而是启动分析、推理、逻辑程序。所以这就是AlphaGo 和人类的区别。


这种差别也让我当前判断到,AlphaGo是无法进行全局的深入思考的。让我觉得担忧的,倒是AlphaGo能对于全局的判断。单这种判断的算法,无论是“值网络”,还是“决策网络”,都是基于神经网络算法的。


神经网络算法我了解不多,所以还去翻了一些资料,总体,还是从人脑结构的角度出发,来衍生算法的。也就是说,它的算法在单机上的效率很低,但是通过多机交互式的沟通,来发展出所谓的快速复杂的计算。这就和人脑很像了。


我也不十分说得明白,但大家如果感兴趣,可以去网上找一篇文章叫《我见过的最脑残也是最好懂的人工神经网络算法教》,这片大家也只要大致了解下就好,因为对于我是学计算机专业的学生,去理解,还是有一小点困难的。


但是这篇文章给我们了一个启示:单机的存储、计算能力比单个脑细胞是强的多,但是如果和整个大脑的功能来看,是无法比的。但是当这些终端,以某种方式接入网络,并通过神经网络算法来支配的时候,就可能会产生智慧。


因为当个脑细胞也是无所谓智慧的,正是每一个脑神经节点和其他的神经阶段相互勾连,才产生智慧的。所以在当下,我们去看人工智能,都是我们能理解的范畴,因为单个终端的运算,都是在人类的控制之内的,而且连运算的框架都是在人类的控制之内的。


所以从这个角度说,这事我们人脑功能,无论从运算、记忆等方面的一个衍生。这个和我们手里拿着剪刀,来捡东西,是功能的拓展的道理是一样的。但是一旦引入了神经网络,后果就很难猜测了。


会不会形成一种学习,真正的学习,还有能够有通盘思考的能力,那人类的历史使命就完成。就目前,人工智能是无法理解比如统一场论、相对论。也没有办法创造新的理论。


但如果将来的某一天,通过各种网络算法的组合,能够去理解了比较深的,有全局观的知识,那人类真的就走向没落的。


但另外还有一点,就是,即便是在多机交互的情况下产生了智能,那也是在网路的条件下,总体的终端共同的智能。而不是像人类,单个个体的智能。所以我猜测,可能会在网路上出现有限个的,寡头的真正的人工智能集合。而这也很可能威胁到人类的生存。


好,今天的节目就到这里,我是四眼李想,李是木子李。


再次重申,这都是我个人的想法。


主播简介

李想,因为戴眼镜,所以叫四眼李想。既然戴了眼镜嘛,就装一下知识分子,然后爱瞎想,所以就有了李想主义。希望李想的瞎想也可以让你接着继续想。

往期推荐

▼ 点击标题即可收听

☞ 太子妃里的酒器 | 李想主义·第9期

☞ 太子妃里的服装 | 李想主义·第10期

☞ 历史上没芈月这个人? 听李想说芈月 | 李想主义·第1期

☞ 义渠王本应姓翟(di)?听李想说芈月:末代义渠王 | 李想主义·第4期

东西情人节之差异 | 李想主义·第6期 


- 本期编辑:王小也 -


○ 客串主播招募中:回复“客串主播”立即获取招募说明

○ 本文所含音频、视频及图文信息乃“小也电台”独家制作,未经授权请勿转载。

○ 本文所使用文章、图片及音乐归相关权利人所有,如若侵权请联系删除。

○ 小也电台很需要你的支持,如果觉得还行,记得分享点赞哦,么么哒!

○ 欢迎加入小也电台听友群,回复“也粉”加群。

○ 点击左下角“阅读原文”收听往期所有节目。

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存