查看原文
其他

AlphaGo 4:1 赢了李世石,它真的赢了么? | 硅谷直说

2016-03-15 屈直 世界说

世 界 说 

屈 直

发 自 美 国 硅 谷

■  ■  ■  


棋 王 李 世 乭 虽 败 犹 荣 

人 工 智 能 面 临 赢 者 困 境



3月15日下午约5点,举世瞩目的人机大战:AlphaGo vs. 李世乭终于落下帷幕。棋王李世乭以 1 : 4 惜败机器。其实,早在AlphaGo连下三局之时,就有人惊呼“人工智能已经发展成熟”,更有人担忧人工智能将会取代人类。殊不知,AlphaGo所用的这个神经网络算法,尚且处于一个蹒跚学步的阶段。



△ “人机”大战现场,阿尔法围棋创始人戴密斯·哈萨比斯(Demis Hassabis,前排左)和棋王李世乭(前排右)握手


■ 深度学习,和大多数人想象的不一样


在电影《超能陆战队》中有一个实验室的场景,小宏、泰迪、弗雷德组装智能盔甲去揭穿“面具人”的阴谋。在影片中,大家分工明确,谁去画图纸,谁去构筑材料,谁去做测试,一切按计划进行,井井有条。但电影毕竟是电影,真实世界中的人工智能并不是这样。



△电影“超能陆战队”里的实验室


AlphaGo采用的算法,叫做人工神经网络算法(后文简称“神经网络”)。它的设计灵感源于大脑中的神经网络,每一个神经元做简单计算,而连接起来计算力就非常强大了。一个神经网络可以有一层(只算一次),也可以有好几层(一层算完下一层接着算)。超过一层的神经网络,就叫做“深度学习”。研究者往往是先搭建一个初始化的神经网络,然后慢慢训练,训着训着它就会做精确计算了。


神经网络有一个奇妙的特点,那就是人们不需要知道每一个神经元具体负责什么,只要训练得当,结果自然精确。但神经网络的神奇之处,恰恰也是它的困难之处。因为它是个“黑箱子”,没人知道里面到底是怎么运作的,所以调试起来特别难。


一个人工神经网络的构建实际并不简单,它往往需要顶尖的人才和漫长的实验过程。而一个成功神经网络的构建,也面临着种种难题:


首先,要考虑构建什么样的模型。一个好的模型,计算起来快,训练时间短,结果精度高。而怎样选择这个模型、怎样处理输入的数据、怎样训练,里面学问就大了。一大堆术语会让新人们望而却步:卷积神经网络、递归神经网络、PCA whitening、ZCA whitening、Broyden–Fletcher–Goldfarb–Shanno algorithm……要全部搞明白这些,不仅要勤翻论文,还需要亲自实践。


其次,就是漫长的训练时间。如果要做深度学习,训练一个神经网络短则几小时,多则好几天。如果要快一些呢?要么换成GPU做平行计算,要么就得乖乖地多买几个服务器吧!


最后,就是精度的提高。如果现在训练出的模型不准确,问题出在哪儿呢?有时候是因为模型不好,有时候是因为参数不合适,有时候可能仅仅是因为训练数据不够。到底为什么,谁都不知道,咱们只能换个方法重头来。



△一个成功神经网络的构建非常复杂


如果要做一个比喻的话,训练一个人工神经网络不像是搭建机器人,而是像一个道士炼丹。一个老道士坐在丹炉前,琢磨是用文火还是武火?要不要多加一些丹砂?需要炼多少年?至于这炼丹炉子里到底是怎么回事儿,这个老道也是一头雾水。结果经常就是,炼丹一炼几十年,什么成果也没有。但如果方法对,炼出的丹药就会药到病除,百试不爽。


正因为上面所说的种种困难,构建神经网络也像道士炼丹一样,不仅看重数学素养,也看重经验直觉。一个老教授看到一个测试结果,会凭借他多年的经验判断可能是哪个参数有问题,该往哪个方向调。而一个初出茅庐的本科生,往往一点概念也没有,只能随机去改模型、调参数。在人工神经网络的研究中,很多时候竟然要靠直觉。当然,还有长时间的钻研和调试。


一个成功模型的搭建背后往往是多少研究者的长期付出。一个“人工大脑”的完成,背后是多少个计算机科学家和数学家大脑含辛茹苦的成果。难怪不少人工智能的研究者自嘲说,人工智能其实不那么奇妙,因为“有多少人工,才有多少智能。”



△现实生活中,开发出阿尔法围棋的谷歌DeepMind团队位于伦敦的办公室

 

■ 深度学习的软肋

 

深度学习在很多领域颇有成果,但不得不承认,它存在不少问题。

其中一个比较著名的,叫做“过拟合”。如果神经网络层数太多,训练方法不当,它有可能只对训练数据的预测准确,而实际数据一来,它就不灵了。以AlphaGo为例,因为它的训练数据是历代围棋大师的著名棋局,所以它可以很好地模拟大师下棋的套路。但假设AlphaGo出现“过拟合”的问题,它可能会被“大师们的套路”所束缚,反而犯一些低级错误,甚至下不过一个刚刚学会围棋的新手。


《天龙八部》里,逍遥派掌门无崖子创立“珍珑棋局”,难倒了一众高手。结果一个不会下棋的丑和尚(虚竹)却误打误撞破了这个千古棋局。如果AlphaGo出现了“过拟合”的情况,它倒不怕历代大师,反而怕是虚竹这种“自杀一片”的古怪棋法。



△《天龙八部》中虚竹破“珍珑棋局”的故事一直为人津津乐道


另一个让人担忧的,就是“盲点”问题。深度学习在图像和语音识别上独树一帜。不仅是人脸、动物、日常用品,连风景名胜都能给识别出来。但深度学习像是武侠小说里的“金钟罩铁布衫”一样,也有一个脆弱的“练门”。2014年,一项由谷歌、Facebook、纽约大学、蒙特利尔大学合作的研究项目中,发现了所有神经网络都有一个奇怪的特性,就是把输入数据做出细微修改之后,这个“人工大脑”就突然认不出来了。

 


△论文“神经网络的有趣性质”(Intriguing properties of neural networks)指出的神经网络“盲点”问题


举个例子,上图的两辆车,左边的是原图,中间的图是左图修改了几个像素点后的结果,基本看不出来有什么区别。右边的图是原图和修改过的图的像素差异(因为差异太小,把像素值都放大了一下)。研究者拿原图(左图)让神经网络去识别,能识别出来是“汽车”。但让它继续识别轻微修改过的图(中间图),神经网络竟然识别不出来了。


研究者一开始认为,这是一个不错的神经网络测试方法,但慢慢他们就觉得事情没有这么简单。研究者们拿修改过的图(中间图)继续训练神经网络,希望它更准确。这次神经网络可以识别出来新图了,但研究者再改几个像素,发现又识别不出来了。


会不会只是这两辆车的图片有问题呢?后来研究者们又实验了其他类型的图片:花卉、人脸、水果、人的动作、不同种类的狗等等。结果发现,识别这些的神经网络,都存在这这类“盲点”。而且是破解了旧“盲点”,又出现新“盲点”。他们很担心地提出了一个假说,会不会所有神经网络,都存在“盲点”呢?


直到今天,学术界还在争论这个假说是否成立。深度神经网络到底有没有普遍的“盲点”,也没有一致的答案。


最后一个困难就是,对训练数据的要求高。首先数据要连续平滑,比如像照片、语音,都有这个特征。其次数据要丰富多样,如果要识别汽车,就需要各个品牌,各个车型的数据。


最重要的是,数据量要大。训练数据越多,精度往往越高。往往一个精美的数学模型,抵不过数据的“大力出奇迹”。谷歌、百度、Facebook在深度学习的卓越表现,很大部分要归功于它们之前的大量的数据收集。一个刚刚涉足江湖的小创业公司,根本无法拥有谷歌口袋里的数据。无论是全球各地的图片,还是各国语言的语音,还是有史以来所有在案的文字资料,谷歌、百度这种搜索引擎公司真是信手拈来。难怪机器学习界有一个谚语:“有时候,赢家不是那些算法最好的,而是那些数据最多的”。

 

■ 深度学习的未来:任重而道远

 

尽管谷歌的AlphaGo击败了棋王李世乭,深度学习还有很长一段路要走。


在深度学习的研究早期,多数研究者热衷于数学模型的探索,而忽视了它广泛的应用价值。结果是,机器学习一度置身象牙塔,不少大公司因为看不到实际价值,望而却步。


然而机器学习的价值之高,远超过大众的想象。它在金融市场可以预测股市、评估风险;它在医疗界可以自动诊断,甚至可以自动排病号、安排病床、减少患者的医疗成本。它在制造业可以做质量管理、流程管理、温度和强度预测。它在人力资源管理中,可以建议人事任命、给雇员排工时、做背景调查。其他在数据科学、科学研究、能源、教育的应用更是多种多样。该给人干的,机器基本都能干。这里面任何一项应用发展成熟,都会给相关行业来个地覆天翻。


但当谷歌、百度、Facebook开始投入人工智能的研究时,发现搭一个可靠的神经网络很难。一个做机器学习的研究员,不仅需要过硬的算法基础,还需要一定的数学能力(线性代数、概率图论等)。这还只是底线要求。还记得炼丹的比喻吗?深度学习的人才需要丰富的经验和敏锐的直觉,这个要求就又高了一层。最后,在模型构建上要能读懂前人的数学论文,在优化上又需要一定的硬件基础。这样的人才,那真是凤毛麟角。



△ 杰弗里·辛顿是反向传播算法和对比散度算法的发明人之一,也是深度学习的积极推动者。


这也是为什么谷歌、百度、Facebook在机器学习的部门,基本只招名校博士生。机器学习界的开拓者杰弗里·辛顿(Geoffrey Hinton)在2013年加入谷歌,斯坦福的吴恩达(Andrew Ng)在2014年加入百度。大公司们宁愿高薪聘请一个大师,也不招一群啥也不会的应届毕业生。


高门槛、高技术的特征,决定了机器学习无法向当年移动应用、大数据那样突然爆炸式发展。有限的人才资源和漫长的培训周期,也让机器学习注定成为巨头们的玩具,而小公司们只能在一旁羡慕嫉妒恨。


机器学习当然可以改变世界,但可惜的是,我们还得等一段时间。


- END -

责任编辑 | 徐典

版面编辑 | 胡越


相关阅读,请直接点击:“人工智能”是巨头间的商业游戏 | 硅谷直说



回复你感兴趣的【关键词】即可点播

关键词:希拉里 | 桑德斯 | 特朗普 | 美国大选 | 缅甸大选 | 硅谷

版权声明 | 稿件视频均为世界说原创

如需转载或合作请在后台回复【转载须知】


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存