柯洁对战AlphaGo，别错过新时代的投资机会

查看原文

其他

柯洁对战AlphaGo，别错过新时代的投资机会

Original 2017-05-24 福小星 Formax金融圈

昨天，在中国乌镇举行的“人机终极对弈”第一局中，当今世界排名第一的中国围棋选手柯洁，以四分之一子惜败于 Google 旗下的人工智能程序 AlphaGo。

虽然这个结果并不意外，早前，中国棋圣聂卫平表示柯洁会被0：3击溃。古力九段认为，如果柯洁发挥出100%的状态，那么他也许有5%的胜率。李开复直言“人类胜率0%”。

但此次对弈具有划时代的意义，其中也不乏很多有意思的地方。甚至接下来至27号的几天内，还有令人期待特别设置的人机配对赛和团队赛，对弈最终结果目前还存在一定的变数。

先让我们回顾一下昨天这局棋。

人机对弈

按照比赛规则，柯洁和 AlphaGo 各有三个小时的时间。柯洁执黑先行，而来自 DeepMind 的黄士杰（Aja Huang）博士则负责替 AlphaGo 落子。

在现场的比赛中，整体的节奏比预想中的要快很多，尤其是 AlphaGo，它的平均出子时间为 30 秒左右。

现场解说的职业八段棋手张璇和职业九段棋手常昊多次用“高效、果断”来评价它的表现，并多次出现“有意思”、“没想到”等评语。

而柯洁的应对状况比较多变，有时会立刻下子，有时也会因白棋相对“出乎意料”的下法陷入长时间思考。

在比赛开局阶段，双方均表现得比较强硬。进入中盘之后，双方在用时上的差距越拉越大，柯洁比 AlphaGo 多用了 1 个小时。虽然柯洁努力下出了不少好棋，比如第 97 步，但 AlphaGo 始终没有出现失误，牢牢把持着局面。

在清华 ai 团队的胜率判断中，柯洁与 AlphaGo 的胜率比例也基本维持在 45%：55%左右。

在关子阶段，下至 4 小时左右，研究室内的众世界冠军基本都认定柯洁小败成定局。而过程中柯洁也多次出现抓头发之类的纠结小动作。

最终，这盘棋柯洁输了四分之一子，这是围棋中最小的差距，半目的设置是为了避免用整数出现双方平目和棋的情况出现。

据职业棋手分析，虽然柯洁拼命厮杀，但最后的1/4子并不是黑白双方的实际差距。实际上不是半目而是更多，但也没有夸张到两个子的说法。

因为研究棋理，就像探究客观真理，当然要追求最佳，也就是最大收益；而实战，因为赢多赢少都是赢，所以完全可以追求稳健。

而AlphaGo模型设定为取最高胜率的后续下法为实际下法，所以实战中这个模型在封闭空间中可能导致非最佳下法，但一般情况下不影响胜负。

赛前，柯洁曾说：“这次能代表人类出战是我的荣幸，我将尽全力去争胜，一决胜负，抱有必胜的信念和必死的决心，不轻易言败。”

无论如何，输棋的结果并不影响这个20岁少年的优秀，至少福妹是服气的！

人不轻狂枉少年

1997年出生的柯洁最初被大众所熟知，就是在2016 年 3 月，AlphaGo 首次挑战韩国棋手李世石时，放出狂言：“就算阿法狗赢了李世石，它也赢不了我。”

当时的柯洁自2015年1月至2016年1月，在一年内夺得第2届百灵杯世界围棋公开赛冠军、第20届三星杯世界围棋公开赛冠军、第2届梦百合杯世界围棋公开赛冠军，成为世界上最年轻的围棋三冠王。

并在2016年3月5日，将自己与李世石的大赛交锋纪录扩大为8赢2输。直至目前，柯洁的围棋等级分也排在世界第一位。

▲右李世石

但遗憾的是，当时李世石以1：4不幸败北。其实在李世石输掉第三盘后，柯洁也不得不承认计算机的实力强大，并表示“跟AlphaGo下的话，同样的条件下，我输的可能性非常大”。

不少媒体抓住的只有他的狂言，甚至昨天输棋之后，王思聪在@棋士柯洁的微博底下评论↓↓

群众的眼睛都是雪亮的，看底下网友的回复就能看出大家对于柯洁的态度。连许多日本吃瓜群众也称柯洁为“温柔年轻的围棋第一人”。

尤其是，王思聪评论的这条微博其实是柯洁大战前夕的感言，一番对围棋的热爱与“风萧萧兮易水寒”的离别之情跃然字上，这场人机大战，大家“且看且珍惜”↓↓

狗不再是那只狗

柯洁在昨天的赛后接受采访也称：“AlphaGo是太厉害了，我输得没什么脾气。”那这只“狗”到底是有多厉害呢？

在2016年3月李世石之战后，同年12月，神秘棋手“Master”登录中国弈城围棋网，以每天十盘的速度接连击败中外各大顶尖棋手，取得了空前绝后的60连胜。

人们耳熟能详的职业棋手如古力、常昊等纷纷被斩落马下，柯洁也不幸成为它的手下败将。

2017年1月4日，AlphaGo团队公布“Master”背后正是升级版AlphaGo的这一事实。迄今为止的公开赛事中，AlphaGo VS 人类围棋选手，战绩已达70胜1负。

▲哈萨比斯

负责AlphaGo项目的DeepMind公司于2010年由杰米斯·哈萨比斯（Demis Hassabis）博士、沙恩·莱吉（Shane Legg）博士和穆斯塔法·苏雷曼（Mustafa Suleyman）共同创立。在2014年DeepMind被谷歌以4亿美元收购。

最初AlphaGo在只用原始像素和游戏得分作为输入数据的情况下，学会了包括《乓》（Pong）和《打砖块》（Breakout）在内的多种游戏的玩法，并达到了超人的水平。后来一步步向围棋巅峰挑战。

▲深蓝 VS 卡斯帕罗夫

要知道当年战胜卡斯帕罗夫的深蓝，在国际象棋棋盘上，能够发生的不同可能大约是 10 的 46 次方，而在围棋面前就是小巫见大巫了，围棋共有 19X19 个落棋点，加上不同的落字方式，全部可能大约是 10 的 174 次方左右。

围棋可能的下法（10^174）已经超过已知宇宙中所有原子数目的总和（10^80）。巨大的变数和可能性，让围棋棋道几乎成为一门玄学。

而战胜李世石的AlphaGo 1.0支撑它棋力的秘诀有三个：深度神经网络、监督/强化学习、蒙特卡罗树搜索。

✪ 深度神经网络

深度神经网络是包含超过一个认知层的计算机神经网络。对于人工智能而言，世界是被用数字的方式呈现的。人们将人工智能设计出不同的“层”，来解决不同层级的认知任务。这种具备许多“层”的神经网络，被称为深度神经网络。

AlphaGo包含两种深度神经网络：价值网络和策略网络。价值网络使得AlphaGo能够明晰局势的判断，左右全局“战略”，抛弃不合适的路线；策略网络使得AlphaGo能够优化每一步落子，左右局部“战术”，减少失误。

✪ 监督/强化学习

监督学习和强化学习是机器学习方式的不同种类。监督学习是指机器通过人类输入的信息进行学习，而加强学习是指机器自身收集环境中的相关信息作出判断，并综合成自己的“经验”。

在初始阶段，AlphaGo收集研究者输入的3000万部棋局数据，学习人类棋手的下法，形成自己独特的判断方式。之后，在自我博弈一百万多次，以及每一次与人类棋手对弈中，AlphaGo都能并根据结果来总结并生成新的范式，实现自我提高。

✪ 蒙特卡洛树搜索

▲ AlphaGo中的蒙特卡罗树搜索流程。图源：Nature

蒙特卡洛树是一种搜索算法。AI在利用它进行决策判断时，会从根结点开始不断选择分支子结点，通过不断的决策使得游戏局势向AI预测的最优点移动，直到模拟游戏胜利。

AI每一次的选择都会同时产生多个可能性，它会进行仿真运算，推断出可能的结果再做出决定。

如果说，跟李世石下棋的AlphaGo版本号是V18，那和柯洁下棋的则是V60。DeepMind把AlphaGo粗略分成几个版本：

第一代 是击败樊麾的AlphaGo Fan。与Zen/Crazy Stone等之前的围棋软件相比，棋力要高出4子。

第二代 是击败李世石的AlphaGo Lee。与上一代相比，棋力高出3子。

第三代 是柯洁如今的对手，也是年初60连胜的：AlphaGo Master。相比于击败李世石的版本，棋力又再次提升3子。

根据公开资料，此次与柯洁对战的AlphaGo技术原理与之前又有着巨大的不同，其中最厉害的在于，新的策略/价值网络强化在“上一代AlphaGo成为下一代的老师”。

两台白痴机器，遵守走棋和获胜规则，从随机走棋开始日夜切磋，总结经验，不断批评和自我批评，实现自我超越。这画面想想就出一阵冷汗……

创始人哈萨比斯表示：“AlphaGo也能用在其他的领域，比如在制药、医疗等方面，都可以使用人工智能来解决疑难问题。”目前它帮助谷歌减少了40%在机房冷却系统上的花费。

他们还希望能够与英国国家电网合作，利用人工智能将英国的能耗减少10%。并希望在医疗领域结合，在一定准确率的情况下，给予医生诊疗判定方面的辅助。

新时代的投资机会

AlphaGo是一个标志。它的诞生，意味着人们对人工智能的探索已经到达了一个新的阶段。

据VentureScanner统计，2014年人工智能领域全球投资额为10亿美元，同比增长近50%。2015全球人工智能公司共获得近12亿美元的投资，这个数字放在过去20年全年投资总额来看，已经超过了其中17年全年投资总额。

预计2020年全球人工智能市场规模预计超千亿。在未来10年甚至更久的时间里，人工智能将是众多智能产业技术和应用发展的突破点。

由国家发改委、科技部、工信部、中央网信办制定的《“互联网+”人工智能三年行动实施方案》日前正式印发，计划到2018年，基本建立人工智能的产业、服务和标准化体系，实现核心技术突破，培育若干全球领先的人工智能骨干企业，形成千亿级的人工智能市场应用规模。

事实上，人工智能的行业应用早已开始：当浏览淘宝时，淘货将针对你的浏览和购买记录，推送你可能喜欢的商品；支付宝已经根据您的个人购买记录等建立了个人征信……

作为A股人工智能龙头，科大讯飞（002230）在以“从能听会说到能理解会思考”为目标的讯飞超脑项目上持续加大投入，保持了人工智能的核心技术上的领先地位。

神州泰岳（300002）瞄准语义理解领域，推出的专利产品“DINFO-OEC非结构化大数据分析挖掘模型”，已成为中国银行业的优先选择平台。

领域内还可关注海康威视（002415）、华宇软件（300271）、远方光电（300306）、思创医惠（300078）、工大高新（600701）、赛为智能（300044）等等。

重要的是未来

虽然汽车被创造，但依然不减博尔特百米飞人的厉害。

相信围棋这项有两千多年历史的运动的魅力，也仍然会持久地存续下去，甚至在柯洁及众多棋士的努力下，将会吸引更多的年轻人来学习这项富有智慧的古老运动。

就像著名日本动画《棋魂》中所说：

千年虽过，黑白二色依然让我迷醉！
千年虽逝，棋子拍落的金石之音仍是震撼我心！
千年沧桑，世事变迁，不变的是棋盘上惊心动魄的撕杀，棋士内心的执着，还有……对围棋恒古不灭的热情！
千年放浪，阅尽沉浮人生，不变的是我，醉心于棋盘上的千变万化，依恋于相知相伴的幸福，以及对神之一手永无停息的追逐！

而AlphaGo和它的同伴们又能走多远？这个需要时间来检验，不得不承认，新的时代在不顾及你我的情绪下来临，这种跳脱于人类进化外的全新历程，又会发生什么动人的故事呢？

也许未来，“人”不再是血肉之躯，而是一种思维，一种智慧……这是最坏的时代，这是最好的时代。

💁猜你喜欢：

《穿五星红旗蹭红毯爱国还是炒作？》

《32岁前一无所有，现在身家500亿》

《成熟的人从不会这样发微信》

*理财有风险，投资需谨慎

反向激励，在加速这个社会的黑化

官媒发声：反对调休的声音不能装聋作哑！这不是放假，是“假放”（五一假期）

平安信托深陷“爆雷”旋涡：终于尝到“偏爱”房地产的苦果

刀片电池存设计缺陷，或将导致几十万比亚迪车主自费更换or召回？

复旦陈果：低质量的独处，不如高质量的社交，有远见的人都关注了这些微信号