查看原文
其他

柯洁对战AlphaGo,别错过新时代的投资机会

2017-05-24 福小星 Formax金融圈

昨天,在中国乌镇举行的“人机终极对弈”第一局中,当今世界排名第一的中国围棋选手柯洁,以四分之一子惜败于 Google 旗下的人工智能程序 AlphaGo。

虽然这个结果并不意外,早前,中国棋圣聂卫平表示柯洁会被0:3击溃。古力九段认为,如果柯洁发挥出100%的状态,那么他也许有5%的胜率。李开复直言“人类胜率0%”

但此次对弈具有划时代的意义,其中也不乏很多有意思的地方。甚至接下来至27号的几天内,还有令人期待特别设置的人机配对赛和团队赛,对弈最终结果目前还存在一定的变数。

先让我们回顾一下昨天这局棋。

人机对弈

按照比赛规则,柯洁和 AlphaGo 各有三个小时的时间。柯洁执黑先行,而来自 DeepMind 的黄士杰(Aja Huang)博士则负责替 AlphaGo 落子。

在现场的比赛中,整体的节奏比预想中的要快很多,尤其是 AlphaGo,它的平均出子时间为 30 秒左右。

现场解说的职业八段棋手张璇和职业九段棋手常昊多次用“高效、果断”来评价它的表现,并多次出现“有意思”、“没想到”等评语。

而柯洁的应对状况比较多变,有时会立刻下子,有时也会因白棋相对“出乎意料”的下法陷入长时间思考。

在比赛开局阶段,双方均表现得比较强硬。进入中盘之后,双方在用时上的差距越拉越大,柯洁比 AlphaGo 多用了 1 个小时。虽然柯洁努力下出了不少好棋,比如第 97 步,但 AlphaGo 始终没有出现失误,牢牢把持着局面。

在清华 ai 团队的胜率判断中,柯洁与 AlphaGo 的胜率比例也基本维持在 45%:55%左右。

在关子阶段,下至 4 小时左右,研究室内的众世界冠军基本都认定柯洁小败成定局。而过程中柯洁也多次出现抓头发之类的纠结小动作。

最终,这盘棋柯洁输了四分之一子,这是围棋中最小的差距,半目的设置是为了避免用整数出现双方平目和棋的情况出现。

据职业棋手分析,虽然柯洁拼命厮杀,但最后的1/4子并不是黑白双方的实际差距。实际上不是半目而是更多,但也没有夸张到两个子的说法。

因为研究棋理,就像探究客观真理,当然要追求最佳,也就是最大收益;而实战,因为赢多赢少都是赢,所以完全可以追求稳健。

而AlphaGo模型设定为取最高胜率的后续下法为实际下法,所以实战中这个模型在封闭空间中可能导致非最佳下法,但一般情况下不影响胜负。

赛前,柯洁曾说:“这次能代表人类出战是我的荣幸,我将尽全力去争胜,一决胜负,抱有必胜的信念和必死的决心,不轻易言败。”

无论如何,输棋的结果并不影响这个20岁少年的优秀,至少福妹是服气的!


人不轻狂枉少年

1997年出生的柯洁最初被大众所熟知,就是在2016 年 3 月,AlphaGo 首次挑战韩国棋手李世石时,放出狂言:“就算阿法狗赢了李世石,它也赢不了我。”

当时的柯洁自2015年1月至2016年1月,在一年内夺得第2届百灵杯世界围棋公开赛冠军、第20届三星杯世界围棋公开赛冠军、第2届梦百合杯世界围棋公开赛冠军,成为世界上最年轻的围棋三冠王。

并在2016年3月5日,将自己与李世石的大赛交锋纪录扩大为8赢2输。直至目前,柯洁的围棋等级分也排在世界第一位。

▲右李世石

但遗憾的是,当时李世石以1:4不幸败北。其实在李世石输掉第三盘后,柯洁也不得不承认计算机的实力强大,并表示“跟AlphaGo下的话,同样的条件下,我输的可能性非常大”。

不少媒体抓住的只有他的狂言,甚至昨天输棋之后,王思聪在@棋士柯洁的微博底下评论↓↓

群众的眼睛都是雪亮的,看底下网友的回复就能看出大家对于柯洁的态度。连许多日本吃瓜群众也称柯洁为“温柔年轻的围棋第一人”

尤其是,王思聪评论的这条微博其实是柯洁大战前夕的感言,一番对围棋的热爱与“风萧萧兮易水寒”的离别之情跃然字上,这场人机大战,大家“且看且珍惜”↓↓


狗不再是那只狗

柯洁在昨天的赛后接受采访也称:“AlphaGo是太厉害了,我输得没什么脾气。”那这只“狗”到底是有多厉害呢?

在2016年3月李世石之战后,同年12月,神秘棋手“Master”登录中国弈城围棋网,以每天十盘的速度接连击败中外各大顶尖棋手,取得了空前绝后的60连胜。

人们耳熟能详的职业棋手如古力、常昊等纷纷被斩落马下,柯洁也不幸成为它的手下败将。

2017年1月4日,AlphaGo团队公布“Master”背后正是升级版AlphaGo的这一事实。迄今为止的公开赛事中,AlphaGo VS 人类围棋选手,战绩已达70胜1负

▲哈萨比斯

负责AlphaGo项目的DeepMind公司于2010年由杰米斯·哈萨比斯(Demis Hassabis)博士、沙恩·莱吉(Shane Legg)博士和穆斯塔法·苏雷曼(Mustafa Suleyman)共同创立。在2014年DeepMind被谷歌以4亿美元收购。

最初AlphaGo在只用原始像素和游戏得分作为输入数据的情况下,学会了包括《乓》(Pong)和《打砖块》(Breakout)在内的多种游戏的玩法,并达到了超人的水平。后来一步步向围棋巅峰挑战。

深蓝 VS 卡斯帕罗夫

要知道当年战胜卡斯帕罗夫的深蓝,在国际象棋棋盘上,能够发生的不同可能大约是 10 的 46 次方,而在围棋面前就是小巫见大巫了,围棋共有 19X19 个落棋点,加上不同的落字方式,全部可能大约是 10 的 174 次方左右。

围棋可能的下法(10^174)已经超过已知宇宙中所有原子数目的总和(10^80)。巨大的变数和可能性,让围棋棋道几乎成为一门玄学。

而战胜李世石的AlphaGo 1.0支撑它棋力的秘诀有三个:深度神经网络、监督/强化学习、蒙特卡罗树搜索。

✪ 深度神经网络

深度神经网络是包含超过一个认知层的计算机神经网络。对于人工智能而言,世界是被用数字的方式呈现的。人们将人工智能设计出不同的“层”,来解决不同层级的认知任务。这种具备许多“层”的神经网络,被称为深度神经网络。

AlphaGo包含两种深度神经网络:价值网络和策略网络。价值网络使得AlphaGo能够明晰局势的判断,左右全局“战略”,抛弃不合适的路线;策略网络使得AlphaGo能够优化每一步落子,左右局部“战术”,减少失误。

✪ 监督/强化学习

监督学习和强化学习是机器学习方式的不同种类。监督学习是指机器通过人类输入的信息进行学习,而加强学习是指机器自身收集环境中的相关信息作出判断,并综合成自己的“经验”。

在初始阶段,AlphaGo收集研究者输入的3000万部棋局数据,学习人类棋手的下法,形成自己独特的判断方式。之后,在自我博弈一百万多次,以及每一次与人类棋手对弈中,AlphaGo都能并根据结果来总结并生成新的范式,实现自我提高。

✪ 蒙特卡洛树搜索

▲ AlphaGo中的蒙特卡罗树搜索流程。图源:Nature

蒙特卡洛树是一种搜索算法。AI在利用它进行决策判断时,会从根结点开始不断选择分支子结点,通过不断的决策使得游戏局势向AI预测的最优点移动,直到模拟游戏胜利。

AI每一次的选择都会同时产生多个可能性,它会进行仿真运算,推断出可能的结果再做出决定。

如果说,跟李世石下棋的AlphaGo版本号是V18,那和柯洁下棋的则是V60。DeepMind把AlphaGo粗略分成几个版本:

 第一代  是击败樊麾的AlphaGo Fan。与Zen/Crazy Stone等之前的围棋软件相比,棋力要高出4子。

 第二代  是击败李世石的AlphaGo Lee。与上一代相比,棋力高出3子。

 第三代  是柯洁如今的对手,也是年初60连胜的:AlphaGo Master。相比于击败李世石的版本,棋力又再次提升3子。

根据公开资料,此次与柯洁对战的AlphaGo技术原理与之前又有着巨大的不同,其中最厉害的在于,新的策略/价值网络强化在“上一代AlphaGo成为下一代的老师”。

两台白痴机器,遵守走棋和获胜规则,从随机走棋开始日夜切磋,总结经验,不断批评和自我批评,实现自我超越。这画面想想就出一阵冷汗……

创始人哈萨比斯表示:“AlphaGo也能用在其他的领域,比如在制药、医疗等方面,都可以使用人工智能来解决疑难问题。”目前它帮助谷歌减少了40%在机房冷却系统上的花费。

他们还希望能够与英国国家电网合作,利用人工智能将英国的能耗减少10%。并希望在医疗领域结合,在一定准确率的情况下,给予医生诊疗判定方面的辅助。


新时代的投资机会

AlphaGo是一个标志。它的诞生,意味着人们对人工智能的探索已经到达了一个新的阶段。

据VentureScanner统计,2014年人工智能领域全球投资额为10亿美元,同比增长近50%。2015全球人工智能公司共获得近12亿美元的投资,这个数字放在过去20年全年投资总额来看,已经超过了其中17年全年投资总额。

预计2020年全球人工智能市场规模预计超千亿。在未来10年甚至更久的时间里,人工智能将是众多智能产业技术和应用发展的突破点。

由国家发改委、科技部、工信部、中央网信办制定的《“互联网+”人工智能三年行动实施方案》日前正式印发,计划到2018年,基本建立人工智能的产业、服务和标准化体系,实现核心技术突破,培育若干全球领先的人工智能骨干企业,形成千亿级的人工智能市场应用规模。

事实上,人工智能的行业应用早已开始:当浏览淘宝时,淘货将针对你的浏览和购买记录,推送你可能喜欢的商品;支付宝已经根据您的个人购买记录等建立了个人征信……

作为A股人工智能龙头,科大讯飞(002230)在以“从能听会说到能理解会思考”为目标的讯飞超脑项目上持续加大投入,保持了人工智能的核心技术上的领先地位。

神州泰岳(300002)瞄准语义理解领域,推出的专利产品“DINFO-OEC非结构化大数据分析挖掘模型”,已成为中国银行业的优先选择平台。

领域内还可关注海康威视(002415)、华宇软件(300271)、远方光电(300306)、思创医惠(300078)、工大高新(600701)、赛为智能(300044)等等。


重要的是未来

虽然汽车被创造,但依然不减博尔特百米飞人的厉害。

相信围棋这项有两千多年历史的运动的魅力,也仍然会持久地存续下去,甚至在柯洁及众多棋士的努力下,将会吸引更多的年轻人来学习这项富有智慧的古老运动。

就像著名日本动画《棋魂》中所说:

千年虽过,黑白二色依然让我迷醉!

千年虽逝,棋子拍落的金石之音仍是震撼我心!

千年沧桑,世事变迁,不变的是棋盘上惊心动魄的撕杀,棋士内心的执着,还有……对围棋恒古不灭的热情!

千年放浪,阅尽沉浮人生,不变的是我,醉心于棋盘上的千变万化,依恋于相知相伴的幸福,以及对神之一手永无停息的追逐!

而AlphaGo和它的同伴们又能走多远?这个需要时间来检验,不得不承认,新的时代在不顾及你我的情绪下来临,这种跳脱于人类进化外的全新历程,又会发生什么动人的故事呢?

也许未来,“人”不再是血肉之躯,而是一种思维,一种智慧……这是最坏的时代,这是最好的时代。


💁猜你喜欢:

《穿五星红旗蹭红毯 爱国还是炒作?》

《32岁前一无所有,现在身家500亿》

《成熟的人从不会这样发微信》

*理财有风险,投资需谨慎

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存