AlphaGo 4:1 赢了李世石，它真的赢了么？ | 硅谷直说

原创 2016-03-15 屈直世界说

世界说

屈直

发自美国硅谷

■ ■ ■

棋王李世乭虽败犹荣

人工智能面临赢者困境

3月15日下午约5点，举世瞩目的人机大战：AlphaGo vs. 李世乭终于落下帷幕。棋王李世乭以 1 : 4 惜败机器。其实，早在AlphaGo连下三局之时，就有人惊呼“人工智能已经发展成熟”，更有人担忧人工智能将会取代人类。殊不知，AlphaGo所用的这个神经网络算法，尚且处于一个蹒跚学步的阶段。

△ “人机”大战现场，阿尔法围棋创始人戴密斯·哈萨比斯（Demis Hassabis，前排左）和棋王李世乭（前排右）握手

■ 深度学习，和大多数人想象的不一样

在电影《超能陆战队》中有一个实验室的场景，小宏、泰迪、弗雷德组装智能盔甲去揭穿“面具人”的阴谋。在影片中，大家分工明确，谁去画图纸，谁去构筑材料，谁去做测试，一切按计划进行，井井有条。但电影毕竟是电影，真实世界中的人工智能并不是这样。

△电影“超能陆战队”里的实验室

AlphaGo采用的算法，叫做人工神经网络算法（后文简称“神经网络”）。它的设计灵感源于大脑中的神经网络，每一个神经元做简单计算，而连接起来计算力就非常强大了。一个神经网络可以有一层（只算一次），也可以有好几层（一层算完下一层接着算）。超过一层的神经网络，就叫做“深度学习”。研究者往往是先搭建一个初始化的神经网络，然后慢慢训练，训着训着它就会做精确计算了。

神经网络有一个奇妙的特点，那就是人们不需要知道每一个神经元具体负责什么，只要训练得当，结果自然精确。但神经网络的神奇之处，恰恰也是它的困难之处。因为它是个“黑箱子”，没人知道里面到底是怎么运作的，所以调试起来特别难。

一个人工神经网络的构建实际并不简单，它往往需要顶尖的人才和漫长的实验过程。而一个成功神经网络的构建，也面临着种种难题：

首先，要考虑构建什么样的模型。一个好的模型，计算起来快，训练时间短，结果精度高。而怎样选择这个模型、怎样处理输入的数据、怎样训练，里面学问就大了。一大堆术语会让新人们望而却步：卷积神经网络、递归神经网络、PCA whitening、ZCA whitening、Broyden–Fletcher–Goldfarb–Shanno algorithm……要全部搞明白这些，不仅要勤翻论文，还需要亲自实践。

其次，就是漫长的训练时间。如果要做深度学习，训练一个神经网络短则几小时，多则好几天。如果要快一些呢？要么换成GPU做平行计算，要么就得乖乖地多买几个服务器吧！

最后，就是精度的提高。如果现在训练出的模型不准确，问题出在哪儿呢？有时候是因为模型不好，有时候是因为参数不合适，有时候可能仅仅是因为训练数据不够。到底为什么，谁都不知道，咱们只能换个方法重头来。

△一个成功神经网络的构建非常复杂

如果要做一个比喻的话，训练一个人工神经网络不像是搭建机器人，而是像一个道士炼丹。一个老道士坐在丹炉前，琢磨是用文火还是武火？要不要多加一些丹砂？需要炼多少年？至于这炼丹炉子里到底是怎么回事儿，这个老道也是一头雾水。结果经常就是，炼丹一炼几十年，什么成果也没有。但如果方法对，炼出的丹药就会药到病除，百试不爽。

正因为上面所说的种种困难，构建神经网络也像道士炼丹一样，不仅看重数学素养，也看重经验直觉。一个老教授看到一个测试结果，会凭借他多年的经验判断可能是哪个参数有问题，该往哪个方向调。而一个初出茅庐的本科生，往往一点概念也没有，只能随机去改模型、调参数。在人工神经网络的研究中，很多时候竟然要靠直觉。当然，还有长时间的钻研和调试。

一个成功模型的搭建背后往往是多少研究者的长期付出。一个“人工大脑”的完成，背后是多少个计算机科学家和数学家大脑含辛茹苦的成果。难怪不少人工智能的研究者自嘲说，人工智能其实不那么奇妙，因为“有多少人工，才有多少智能。”

△现实生活中，开发出阿尔法围棋的谷歌DeepMind团队位于伦敦的办公室

■ 深度学习的软肋

深度学习在很多领域颇有成果，但不得不承认，它存在不少问题。

其中一个比较著名的，叫做“过拟合”。如果神经网络层数太多，训练方法不当，它有可能只对训练数据的预测准确，而实际数据一来，它就不灵了。以AlphaGo为例，因为它的训练数据是历代围棋大师的著名棋局，所以它可以很好地模拟大师下棋的套路。但假设AlphaGo出现“过拟合”的问题，它可能会被“大师们的套路”所束缚，反而犯一些低级错误，甚至下不过一个刚刚学会围棋的新手。

《天龙八部》里，逍遥派掌门无崖子创立“珍珑棋局”，难倒了一众高手。结果一个不会下棋的丑和尚（虚竹）却误打误撞破了这个千古棋局。如果AlphaGo出现了“过拟合”的情况，它倒不怕历代大师，反而怕是虚竹这种“自杀一片”的古怪棋法。

△《天龙八部》中虚竹破“珍珑棋局”的故事一直为人津津乐道

另一个让人担忧的，就是“盲点”问题。深度学习在图像和语音识别上独树一帜。不仅是人脸、动物、日常用品，连风景名胜都能给识别出来。但深度学习像是武侠小说里的“金钟罩铁布衫”一样，也有一个脆弱的“练门”。2014年，一项由谷歌、Facebook、纽约大学、蒙特利尔大学合作的研究项目中，发现了所有神经网络都有一个奇怪的特性，就是把输入数据做出细微修改之后，这个“人工大脑”就突然认不出来了。

△论文“神经网络的有趣性质”(Intriguing properties of neural networks）指出的神经网络“盲点”问题

举个例子，上图的两辆车，左边的是原图，中间的图是左图修改了几个像素点后的结果，基本看不出来有什么区别。右边的图是原图和修改过的图的像素差异（因为差异太小，把像素值都放大了一下）。研究者拿原图（左图）让神经网络去识别，能识别出来是“汽车”。但让它继续识别轻微修改过的图（中间图），神经网络竟然识别不出来了。

研究者一开始认为，这是一个不错的神经网络测试方法，但慢慢他们就觉得事情没有这么简单。研究者们拿修改过的图（中间图）继续训练神经网络，希望它更准确。这次神经网络可以识别出来新图了，但研究者再改几个像素，发现又识别不出来了。

会不会只是这两辆车的图片有问题呢？后来研究者们又实验了其他类型的图片：花卉、人脸、水果、人的动作、不同种类的狗等等。结果发现，识别这些的神经网络，都存在这这类“盲点”。而且是破解了旧“盲点”，又出现新“盲点”。他们很担心地提出了一个假说，会不会所有神经网络，都存在“盲点”呢？

直到今天，学术界还在争论这个假说是否成立。深度神经网络到底有没有普遍的“盲点”，也没有一致的答案。

最后一个困难就是，对训练数据的要求高。首先数据要连续平滑，比如像照片、语音，都有这个特征。其次数据要丰富多样，如果要识别汽车，就需要各个品牌，各个车型的数据。

最重要的是，数据量要大。训练数据越多，精度往往越高。往往一个精美的数学模型，抵不过数据的“大力出奇迹”。谷歌、百度、Facebook在深度学习的卓越表现，很大部分要归功于它们之前的大量的数据收集。一个刚刚涉足江湖的小创业公司，根本无法拥有谷歌口袋里的数据。无论是全球各地的图片，还是各国语言的语音，还是有史以来所有在案的文字资料，谷歌、百度这种搜索引擎公司真是信手拈来。难怪机器学习界有一个谚语：“有时候，赢家不是那些算法最好的，而是那些数据最多的”。

■ 深度学习的未来：任重而道远

尽管谷歌的AlphaGo击败了棋王李世乭，深度学习还有很长一段路要走。

在深度学习的研究早期，多数研究者热衷于数学模型的探索，而忽视了它广泛的应用价值。结果是，机器学习一度置身象牙塔，不少大公司因为看不到实际价值，望而却步。

然而机器学习的价值之高，远超过大众的想象。它在金融市场可以预测股市、评估风险；它在医疗界可以自动诊断，甚至可以自动排病号、安排病床、减少患者的医疗成本。它在制造业可以做质量管理、流程管理、温度和强度预测。它在人力资源管理中，可以建议人事任命、给雇员排工时、做背景调查。其他在数据科学、科学研究、能源、教育的应用更是多种多样。该给人干的，机器基本都能干。这里面任何一项应用发展成熟，都会给相关行业来个地覆天翻。

但当谷歌、百度、Facebook开始投入人工智能的研究时，发现搭一个可靠的神经网络很难。一个做机器学习的研究员，不仅需要过硬的算法基础，还需要一定的数学能力（线性代数、概率图论等）。这还只是底线要求。还记得炼丹的比喻吗？深度学习的人才需要丰富的经验和敏锐的直觉，这个要求就又高了一层。最后，在模型构建上要能读懂前人的数学论文，在优化上又需要一定的硬件基础。这样的人才，那真是凤毛麟角。

△ 杰弗里·辛顿是反向传播算法和对比散度算法的发明人之一，也是深度学习的积极推动者。

这也是为什么谷歌、百度、Facebook在机器学习的部门，基本只招名校博士生。机器学习界的开拓者杰弗里·辛顿（Geoffrey Hinton）在2013年加入谷歌，斯坦福的吴恩达（Andrew Ng）在2014年加入百度。大公司们宁愿高薪聘请一个大师，也不招一群啥也不会的应届毕业生。

高门槛、高技术的特征，决定了机器学习无法向当年移动应用、大数据那样突然爆炸式发展。有限的人才资源和漫长的培训周期，也让机器学习注定成为巨头们的玩具，而小公司们只能在一旁羡慕嫉妒恨。

机器学习当然可以改变世界，但可惜的是，我们还得等一段时间。

- END -

责任编辑 | 徐典

版面编辑 | 胡越

相关阅读，请直接点击：“人工智能”是巨头间的商业游戏 | 硅谷直说

回复你感兴趣的【关键词】即可点播

关键词：希拉里 | 桑德斯 | 特朗普 | 美国大选 | 缅甸大选 | 硅谷

如需转载或合作请在后台回复【转载须知】

反向激励，在加速这个社会的黑化

Wealth | 中国成本轮金价涨势的前沿和中心

“Green & IntelligentManufacturing” Chinese Bridge Online Program

官媒发声：反对调休的声音不能装聋作哑！这不是放假，是“假放”（五一假期）

券商大佬卸任，曾任多家券商及公募基金一把手！

AlphaGo 4:1 赢了李世石，它真的赢了么？ | 硅谷直说

■ 深度学习的软肋

■ 深度学习的未来：任重而道远

您可能也对以下帖子感兴趣

反向激励，在加速这个社会的黑化

Wealth | 中国成本轮金价涨势的前沿和中心

“Green & IntelligentManufacturing” Chinese Bridge Online Program

官媒发声：反对调休的声音不能装聋作哑！这不是放假，是“假放”（五一假期）

券商大佬卸任，曾任多家券商及公募基金一把手！

生成图片，分享到微信朋友圈

AlphaGo 4:1 赢了李世石，它真的赢了么？ | 硅谷直说

■ 深度学习的软肋

■ 深度学习的未来：任重而道远

您可能也对以下帖子感兴趣