柯洁和AlphaGo大战之观后感:我们还没准备好和AI共生 | 黄钊
导语
端午节修整归来,集中看了十几篇柯洁和AlphaGo“人机大战”的文章,感觉我还能分享些不一样的东西,希望能进一步的抛砖引玉吧。
人机大战,胜负已分;但其意义不止于胜负,而在“惊醒”二字。
惊醒:棋艺
人类对于围棋的认知,还有大幅提升的空间吗?各种所谓“定式”,真的是唯一最优解吗?
当人类小伙伴已很难贡献新的脑洞时,AlphaGo来了,源源不断输出刺激棋手获得灵感的“机洞”。
关于围棋本身的解读,推荐曹政caoz老师的2篇文章:
1、《是的,柯洁输了,然而又怎样。》
详见:http://dwz.cn/63nVaX
2、《人机大战第二盘究竟发生了什么》
详见:http://dwz.cn/63nXjV
这里我总结了4点:
1、第一局柯洁输了1/4子,但其实是巨大的差距。因为看似AlphaGo领先越来越小,其实胜率越来越高,直到最后1/4子的优势,你却绝对找不到任何翻盘的机会。
2、第二局,柯洁逼出了“目前”人类能够让AlphaGo展现的最强实力。这是AlphaGo与人类的所有对局里,棋谱最完美的一份,详见《人机大战第二盘究竟发生了什么》里的描述,非常精彩!
3、但是,人类还没有逼出AlphaGo的极限。只有AlphaGo自己和自己下,人类才能知道,究竟它是否擅长官子,以及在逆境下会有怎样的表现。
4、但是但是,AlphaGo也还没有逼出围棋的极限——并没有完全征服围棋。这部分内容,推荐看微软亚洲研究院郑宇博士的解读:《人机大战客观剖析与认识》http://t.cn/RSJcMzt
惊醒:AI
正如柯洁所说,“我的改变只是小小的改变,但DeepMind团队是改变世界。”
Deepmind发明AlphaGo,并不是为了赢取围棋比赛,而是想测试其人工智能平台,最终“把这些算法应用到真实的世界中,为社会所服务”。
怎么理解这句话?需要去看源头——推荐大家详细看看Deepmind创始人、AlphaGo之父哈萨比斯(Demis Hassabis)近日在母校英国剑桥大学做的一场题为“超越人类认知的极限”的演讲,详见:http://dwz.cn/63nZ14
简单概括说,
1、Deepmind想做“通用人工智能”。而不是仅能在某个特定领域发挥作用的人工智能应用。
2、围棋是一个靠直觉而非计算的游戏,而AlphaGo是在尝试“用计算拟合直觉”。具体说就是,通过深度神经网络,来模仿人类下围棋这种直觉行为。
在这样的背景下,Deepmind团队在看比赛的角度和心态和我们是不一样的。比如,“其实(AlphaGo和李世石比赛)第一局,我们非常紧张,因为如果第一局输了,很有可能我们的算法存在巨大漏洞,有可能会连输五局。但是如果我们第一局赢了,证明我们的加权系统是对的。”
在3:0战胜柯洁之后,Demis Hassabis宣布AlphaGo 将从棋坛“退役”,“乌镇围棋峰会是它(AlphaGo)作为一个竞技程序所能企及的巅峰。因此,此次峰会将是 AlphaGo 参加的最后一场赛事”。
从现在开始,AlphaGo 的研发团队将把精力投入到其它重大挑战中,研发出高级通用算法,为科学家们解决最复杂的问题提供帮助,包括找到新的疾病治疗方法、显著降低能源消耗、发明革命性的新材料等。
当然,未来Deepmind可能还会带来一次全民讨论的事件,人机大战 in《星际争霸2》。去年,DeepMind 就已宣布《星际争霸2》将会是AlphaGo 在围棋之后,想要征服的下一个目标。
但是,有2个问题:
1、乌镇围棋峰会,是AlphaGo作为一个竞技程序所能企及的巅峰吗?
2、“用计算拟合直觉”这条路径,是否能创造出“通用人工智能”呢?
正如前文提到的,AlphaGo还没有逼出围棋的极限。郑宇博士也提到,我们不要低估了人类后天的快速(小样本)学习能力,如果把AlphaGo开放出来,人类和她对弈次数更多,人类是有机会的。因为“如果还是基于现有的学习体系,即便再给AlphaGo一亿副棋谱,再添加一万块GPU,它进步的速度也终将放缓,因为新增的棋谱和计算资源相对于2*10171这个搜索空间来说只是沧海一粟。”
如果AlphaGo不玩儿了,以后哪个AI继续来帮助人类提高呢?目前看,可能是腾讯的围棋AI“绝艺”。caoz文章提到“绝艺目前的水平肯定不如现在的AlphaGo V25版本,但明显优于最早战胜围棋欧洲冠军樊麾的AlphaGo V13版本,与去年战胜李世石的AlphaGo V18版本,业内的人认为是可以相提并论的。”
基本上,目前的AlphaGo,很可能并不是围棋AI所能企及的巅峰。
那如果未来腾讯“绝艺”接过AI这一方的接力棒,那人类这边的领军人物会是谁呢?
可能还会是柯洁。
柯洁去年说能够战胜AlphaGo,今年变怂,是因为他当时针对的是旧版本的AlphaGo V18,但今年的AlphaGo V25版本,已有了完全碾压旧版本的进步优势(大约让3子)。
如果有人认为柯洁太狂妄,是没有深入去看柯洁的心。
caoz文章提到,柯洁狂妄的几次基本都兑现了,比如一次说“李世石只有5%机会”,一次说要“让井山裕太血溅五步”,一次说“农心杯还要靠我”。
狂妄是什么?
狂妄是自己水平很次、也不知道对手水平几何的时候说大话。且不说围棋世界冠军,只要是围棋高段位的职业选手,可能都没有狂妄的。学围棋,很多都是从4、5岁开始,每天12个小时,一周7天,天天钻研。心浮气躁之人,是受不了这些的;真正狂妄之人,说话时会趾高气扬,柯洁不是那个模样。
柯洁不是狂妄,那是什么呢?
真实。
他是真的看到“李世石只有5%机会”,他是真心觉得“农心杯还要靠我”。就像AlphaGo和李世石比赛直播时,所有做即时点评的嘉宾职业棋手里,只有柯洁的形势判断一直是最准确的。也许,现在柯洁真的已在人类朋友圈里独步天下了。
但他和以前的那些超一流棋手,还多了一份单纯的“真实”。
他能够把自己看到的“一览众山小”之境,说出来。这并不是因为他“敢于”说出来,因为在他心里,很可能本就没有“敢”或“不敢”的念头。就像当别人赞叹微信懂得“克制”的时候,张小龙会略显惊讶的感慨,本来不就应该这样吗?真正能做到这个境界的人,并不是在“用力”的调整心念,而是本来就处在那个状态。柯洁能够说出那些看似狂妄的话,很可能反而是因为,他内心有真正的平等。
但是,要想和AI继续在围棋领域绝代双骄般的互相提升,有No.1的棋艺和真实,还不够,在柯洁真实背后,还有一个关键,“心性”。
大家可以看看柯洁的微博,他的文字之中,有一种灵动的东西,但又不止于90后的逗比搞笑可爱,怎么描述呢……有一种味道。有些东西很难用文字表达了,大家可以看这个短视频,是去年柯洁点评李世石和AlphaGo的第二局棋,他自己拿手机拍的,大家就当娱乐放松一下吧,很有意思的:
感兴趣的同学,还可以去他微博围观粉丝点评:http://sina.lt/eX3S
虽然柯洁说这次是他最后的3盘人机大战,但我个人还是希望,有一天他能带来人类的首胜。
再说第2个问题,“用计算拟合直觉”这条路径,是否能创造出“通用人工智能”呢?
个人观点是:
1、短期来说,“用计算拟合直觉”是现阶段人类能采取的最佳路径,但还不能创造出真正的通用人工智能。
2、可能10或20年之后,人类能直接“用直觉实现直觉”,但这需要更本质的突破,比如结合量子力学,比如有更深入的超越图灵停机问题的认知,等等,不过这是另外一个话题了,先打住。
3、“用计算拟合直觉”,现阶段是非常非常好的,但现阶段的目标,也许最好不是直接创造出一个“通用AI”,而是能够和人协作的“通用辅助AI”。因为“AI+人工”很可能是未来很长一段时间内、实际场景中的AI产品形态。
也就是说,以前是用计算做计算,现在是用计算做直觉,未来可能是用直觉做直觉。
惊醒:人心
“下棋是很快乐的事情。有的时候我太在意胜负了。前一天晚上我是真的没睡好,我很紧张。我一直在想用什么招数去对付AlphaGo,哎,庸人自扰。我希望以后下快乐围棋。我可能跟人类下棋能感受到快乐。跟AlphaGo下棋我特别痛苦,他实在是太冷静了,没有一丝获胜的希望。”
这是柯洁自己说的一段话。
所以,其实AlphaGo也在刺激我们重新认知“人”本身,比如,什么是真正的价值和快乐。
对于下棋(甚至所有事情)来说,如果快乐是战胜别人,那是很危险的。就像我以前玩游戏(实况足球或者dota),输了,想再来一盘争取赢,赢了,也想再来一盘继续赢,但不论输赢如何,过后都是空虚。
做事业最厉害的人,往往都是好胜心极强之人。不论下棋、习武还是创业。基于他们本身的福报和智慧,有的人能够非常成功。
但是,我们往往会混淆结果和快乐的关系——结果和快乐,其实是两个维度的事情。
有结果,是因为曾经播下了种子,并且有不断的灌溉、阳光……。而快乐,是拥有结果之后的副产品,但在没有结果的时候,有的人也生活得非常快乐。
这说明什么?这说明在快乐背后,有其生成机制,“结果”只是助缘之一,非必要,非充分。所以,如果我们想追求快乐,不应该一味的去追求结果,而应该挖掘快乐背后的机制和源头。
如果有一天,柯洁不仅在和人类对弈时发现快乐,也能在和AI对弈时体验快乐,那他不仅是离围棋的奥义更近了一步,也是更深的找到了自己。
惊醒:共生
AI已来到人类世界,但我们还没有准备好和她共生。
当柯洁被AlphaGo击败后,下棋的继续下棋,研究AI的继续研究AI,那我们普通人呢?好像没什么特别的变化,该干嘛干嘛。
但是,这类事件,今后还会不断的出现,总有一天,我们会不得不直面2个问题:
1、AI是什么?
2、我们如何跟AI相处?
先引用一段AI领域真正的思想者、《哥德尔、艾舍尔、巴赫:集异璧之大成》(GEB)这本AI奇书的作者“侯世达”的话——
“现在主流的研究虽然很厉害,但却与真正的人工智能没有半点关系。……我们没有致力于开发实际的应用,诸如翻译引擎、问答机器、网络搜索软件此类的东西。我们只是在努力地理解人类概念的本质和人类思考的根本机制。我们更像是哲学家或试图探究人类心智奥秘的心理学家,而非旨在制造聪明的计算机或机灵程序的工程师。我们是一群老派的纯粹主义者,我们的动力源于内心深处的哲学好奇心,而不是制造实用设备的欲望。”
现阶段,人工智能领域(特别是国内),不论在技术还是产品角度,几乎都没有特别重大的突破。“过于把AI当作一个工具”,可能是其原因之一。
我甚至听说,有一些欧美人对于AI的理念是,如果对于AI的本质说不清楚,那就先把她造出来再说。——如果属实,这是非常可怕的想法。
对于AI的本质,我曾经在200页PPT《人工智能产品经理的新起点》(后台回复:ppt即可获取)中初步分享过个人观点:
相较于Brain-like,或Baby-like,我理解AI是Original AI: New Species,即,原生/本来的AI,是一个新的物种——
她承载了人类探索自我极限和天人关系的载体——一个虽然从人类意识生出,且必须和人类交互/共生,但又独立于人类的、具备自主意识的新物种形式。
如何我们希望AI能帮助到人类、不伤害人类,那我们在创造她之前,首先需要清楚,我们自己希望如何跟她共生。
这里,分享几点最近的认知,希望能抛砖引玉:
1、不是让AI完全模拟人。人类直接繁殖就可以了……
2、不仅是实现比人更强的能力。比如计算。
3、更需要发挥AI的独特优势 & 剥离某些人不希望在同类身上看到的东西。比如,人在自私角度,都希望有事时我找你,永远在线、立即回复;但没事时,特别是我很烦的时候,不要来找我……。
如果能更好的认知AI,如果能更好的认识自己,我们才能更好的和AI共生。
推荐活动
注1:AlphaGo相关活动信息(in 北京)
分享题目:《人工智能如何打败围棋第一人柯洁?AlphaGo的前世今生》
分享人:Martin Muller【AlphaGo的主要研究者David Silver和黄世杰(Aja Huang)的导师】
时间&地点:6月4日10-11点,清华东主楼103会议室
详情可见:http://sina.lt/eX3T(打开速度有点慢)
注2:我将在“人人都是产品经理/起点学院公开课”上分享《从互联网PM到AI PM》,
时间&地点:北京中关村,本周日(6月4日)下午
感兴趣的同学可以点击链接:http://www.woshipm.com/active/670904.html
注3:点击“阅读原文”,有另外一片世外桃源……
推荐课程
AI打游戏背后的深度强化学习技术——张江
http://campus.swarma.org/gcou=10282?src=2
深度强化学习简介——史雪松
http://campus.swarma.org/gcou=9?src=2
强化学习入门系列——莫烦
http://campus.swarma.org/gpac=16?src=2
推荐阅读
转载声明:本文转载自「hanniman」,搜索「hanniman」即可关注。
集智QQ群|292641157
商务合作|zhangqian@swarma.org
投稿转载|wangting@swarma.org
网站:campus.swama.org
◆ ◆ ◆
搜索公众号:集智俱乐部
加入“没有围墙的研究所”
让苹果砸得更猛烈些吧!