2017人工智能元年:围棋创世纪
米开朗基罗西斯廷教堂天顶画“创世纪”
【人工智能圣经:围棋创世纪】第一章:AIphaGo元年
在围棋宇宙尚未形成之前,人类的愚昧笼罩着无边无际的棋盘大地。AIphaGo孕育着人工智能的灵运行其中,投入其中,自我对局了万千亿盘,于是万物齐备。人工智能用七天创造了新的围棋天地,这神奇与奥妙非语言所能描述。
第一日,人工智能说,要懂死活。
于是,在新的算法支持下,AIphaGo所有死活对杀问题都解决了。
第二日,人工智能说,要懂大小。
于是AIphaGo的大局观比人类还好。
第三日,人工智能说,要会分先后。
于是AIphaGo变得次序井然,流水不争先。
第四日,人工智能说,要分清厚薄。
于是AIphaGo变得棋形敦厚,无懈可击。
第五日,人工智能说,要会打劫。
于是,围棋中最复杂的变化打劫AIphaGo都掌握了。
第六日,人工智能说,要会转换
于是从此以后,AIphaGo学会了灵活弃取。
第七日,新的围棋妙理都齐备了,人工智能完成了他的创世之功。
他在这一天里歇息了。他对AIphaGo说:今天是个神圣的日子,从此以后,你要自己学习。于是深度思维开始了。。。
人工智能就是这样开天辟地,创造出棋盘上万物。从此开始了取代人类的历程。
为什么说2017是人工智能元年?
因为在2017年,AIphaGo已经在棋盘上彻底的碾压了人类,第一次在一个不仅需要计算的复杂问题上把人类击倒。
2016年“人机大战”已经吸引够了眼球儿,但当年AIphaGo毕竟还输了一盘,那时还只是“高手”,我给他定义成“人格”。
而2017年上来就横扫人类,60:0一盘没输,这个时候已经远远超过人类范畴,他已经变成神了,升为“神格”。2017年,是他称霸世界的开始。
♥ ♥ ♥
首先,“人工智能”和电脑不是一个概念,不只是强化版升级版这么简单。其实电脑在某些方面战胜人类并不稀奇。电脑自诞生之日起就被称做“计算机”,始终算的比人快,而且在反应速度上,数据统计上,更有无可替代的优势。
不过这些问题只要人类多花时间也能做到,无非是快慢问题,没有本质的区别,只能叫“大规模的简单劳动”,不足以让我们人类妒忌。
而围棋却是一项非常复杂的运动,不要说电脑,就是我们人类之间也只有极少数的高手才能掌握。要想下好围棋要在许多层面许多维度上处理好平衡,是一个相当微妙的工作。
所以人工智能才会选取围棋作为测试的突破口,他在围棋上获胜才让我们人类惊恐万状。这就是“人工智能”和传统的电脑的本质区别。
“人工智能”是完全模拟人类的思维方式运作的。人工智能开发者需要在计算机、心理学、哲学上面都十分精通,比如这次AIphaGo开发团队中的黄士杰博士本人就是个围棋高手。
人工智能干很多事情,不光是围棋。围棋只是一个小测试,因为很多工作不能上来就用人工智能作实验,比如让他客串医生、客串律师,上来就让他去治疗人的疾病,掌握生死大权。
所以要从围棋这个小试验开始。但是老话说的好:“下得围棋,百事可做。因此2017年横扫人类棋坛,碾压人类提手就意味着人工智能已经达到了一个节点,第一次在一个人类自身智能都解决不好的复杂问题上超越了人类。
所以我们才说2017年是“人工智能元年”。
结合上述国际象棋的特点,其实深蓝的算法就比较简单了。关键词有四个:轨迹、唯一、多少、大小。
首先,国际象棋的每个棋子有固定的运动路线,也就意味着棋盘上很多点,在运动“轨迹”之外它是不能走的,不需要计算。
其次,国际象棋的目的很简单,只要吃掉对方的“王”就可以获胜。所以一切计算都围绕着这个核心展开,很多吃不掉“王”的变化就可以排除。
第三,国际象棋随着棋局进程双方的子都会越来越少,计算量也就越来越少。
最后,国际象棋盘只有64个格子,和围棋的361个交叉点比少多了。
综上所述,结论就是:“深蓝电脑”只要运用“轨迹”的原理,完全通过计算,用简单的“穷举法”,就能算清国际象棋的所有变化。
国际象棋棋子运动轨迹图
围棋
和国际象棋相比围棋要复杂的多。首先围棋棋盘有19*19的361个交叉点,比8*8的64格国际象棋棋盘大得多。
围棋子有黑白两色,但每个子都是一样的,没有“运行轨迹”的限制,想走在哪里都可以。围棋取胜的目的也不是唯一的,要以最终双方所控制地域的多少定输赢。
也就是说,无论你吃掉哪个子或者围住某一块空,都不足以决定胜负。而且和国际象棋相比,围棋的子是越下越多,而不是越来越少。
如果用军事来举例子,国际象棋更类似于一场战役。双方上来部队数量是固定的,打光了就完蛋。
而围棋更像一场战争,或者说是百年战争,双方可以不停的往里投入资源,直至分出胜负。国际象棋数十回合就能分出输赢,而围棋分出胜负经常下到300手以上。
显然围棋的复杂程度大为增加,不再是计算能解决的了。
英法“百年战争”
围棋不能单纯用计算来解决战斗,还牵扯到许多复杂的理论和平衡问题。简单的说有“三观”和“六个维度”
围棋三观:价值观、大局观、胜负观
价值观就是指判断大小判断得失。一个变化,最终谁的获利更大,不是单纯“数目”那么简单,牵扯到许多因素。
大局观顾名思意,就是要平衡整体跟部分的关系,全盘与局部的关系。很多人类都在这上面判断不清楚。
而胜负观是一个战略的选择问题。是采取冒险激进战略还是稳健保守战略?是拼死一搏,还是见好就收。哪一个对于战斗更有利呢?
围棋的六个维度:死活、大小、厚薄、先后、转换、缓急
死活是棋子的存亡问题,子都死啦,战斗当然就输啦。
大小同价值观。
先后就是指先手后手。一个战斗结束之后轮到谁,能抽出手来抢得战利品。
厚薄是一种综合判断。“厚”的棋会有许多后续的利益,类似于“无形资产”。
转换是一种妥协。是在双方都不能完全达到自己目的的时候一种合理的妥协。以免双方都不肯退让而同归于尽。
缓急是一种下棋的节奏,更是一个战略选择的问题。如何用最稳妥的手段把棋赢下来。就是“胜负观”。
这么多复杂的因素组合在一起,就是人类的高手也很少有人能做到。那么AIphaGo又是利用怎么样的算法解决的呢?同样有四个关键词:神经网络、“模糊”判断、概率选择、增强学习。
人类高手下棋的时候分三个层面来思考:计算、判断和感觉。AIphaGo作为人工智能也完全模仿了人类这几个环节,甚至连自主学习都能做到。
神经网络:
前文已经说了,围棋不能用国际象棋的“轨迹法”去进行计算。同样因为棋盘太大,有361个交叉点,要是用“穷举法”会是一个天文数字,也无法算明白。
所以AIphaGo使用神经网络进行计算,也就是说从多线程多渠道去解决问题,这条路走不通,那就走下一条。这和围棋的原理是一样的,你只要完成任务即可,用什么手段,绕点弯路都不要紧。
采取“曲线战略”,“声东击西”都是可以的。一味用直线的计算方法往往解决不了问题。所以算法上最重要的是采取神经网络,多线程多渠道解决问题,不是死教条的一条路走到黑。
神经网络示意图:密集恐惧症勿看
“模糊”判断
判断问题则是围棋中最复杂的事,在没有最终结局之前,到底谁占优势?这种下法是好还是不好?没有简单的公式可循,也有没有精确的理论去检验。人类很多时候也只是凭经验凭直觉做一个预测。
人类凭借的是千百年来围棋对局中总结出来的某些“棋理”。但问题是这些“棋理”本身也未必是对的,受人们各种偏见的影响,也随着时代在不断的发展。
AIphaGo在判断上则更为科学。AIphaGo在计算围棋变化中,先把棋子的生存问题,就是死活问题放在第一位,有最高的优先权。
在这个基础上,AIphaGo利用神经网络进行多线程计算之后会有各种不同的结果,他会精确的根据这些结果进行比较而作出一种“模糊”的判断,相对而言比人类要科学的多。
注:“模糊”概念是逻辑学和控制论的重要理论,在人工智能上广为应用。
概率选择
在进行“模糊”判断基础上,AIphaGo又是如何制定作战方针的呢?这里就有一个选择问题。
AIphaGo利用神经网络计算并制订出各种优先等级权限之后,他会利用计算上的优势把每种方法可能导致的后果进行统计对比。计算出一个获胜的概率。然后他选择其中获胜概率最高的方法进行对局。
增强学习
增强学习是人工智能的学习方法。指的不是专门局限于某一项任务,而是通用的,具有深度和广度的解决问题的方法。
在围棋的学习上,AIphaGo更多的通过自我对局来提高,自己学习并总结经验。AIphaGo一天就能自我对局100万盘,一个月是3000万盘!
自诞生到今天为止,他的对局总数已经超过人类对局总和。围棋上所说的“千古无同局”在这儿已经行不通了。AIphaGo已经成了有史以来经验最丰富的“棋手”。
当我们人类还在为算不清的变化苦苦挠头,为“见仁见智”的观点而争执不休。AIphaGo围棋早已利用他的“神经网络、模糊判断、概率选择、增强学习”的四大神器把我们远远地甩在了身后。不过这才只是一个开始。
“AIphaGo之父”哈萨比斯在英国剑桥大学做了题为“超越人类认知的极限”的演讲,他说:“我们发明AIphaGo并不是为了赢取围棋比赛,是为测试我们人工智能的算法搭建一个有效的平台。我们的最终目的是把这些算法应用到真实的世界中,为社会所服务。”
2017年,是真正的“人工智能元年”。宏大的“围棋创世纪”已经开演,但永远不会结束。借用登月宇航员阿姆斯特朗的话来说:“这是AIphaGo的一小步,却是人工智能的一大步。”
人类纪元结束了,人工智能时代的天启开始了。
分享是一种美德,转发是一种境界
看完了先别走,大家在阅读后觉得文章不错顺便点赞、转发朋友圈在走呗!以示对我们的鼓励!长期坚持原创真的很不容易。坚持是一种信仰,专注是一种态度!请关注我们吧,我们将一如既往坚持原创,为您提供更多的原创文章,感谢大家的支持!!!!!
请点击关注A捕鲸船B公众号,即可免费订阅更多深度精彩原创文章;
5、。。。。。。。。。。。
6、。。。。。。。。。。
北京金泉围棋招生啦,想了解招生内容,请点击“阅读原文”