2016年:互联网行业的“深度学习年”
腾讯科技、AI世代编者按:《连线》杂志网站撰文指出,深度学习正在重塑谷歌、Facebook、微软和亚马逊这样的科技巨头,并且正在向其他公司和组织扩散,2016年可谓是互联网的“深度学习年”。以下为原文内容:
在澳大利亚西海岸,阿曼达·霍奇森(Amanda Hodgson)正在向印度洋上空发射无人机,让它们从空中拍摄水面景象。这是在珀斯附近的海湾侦测儒艮(就是海牛)位置的一种方法,目的是防止这些濒危的海洋哺乳动物灭绝。麻烦的是,霍奇森的团队没有时间来检查所有的这些航拍照片。照片太多了,大约有4.5万张照片,对于没有经过训练的人员来说,要找出儒艮并不容易,所以她把工作交给一个深层神经网络来做。
神经网络是一种机器学习模型,Facebook用它来识别照片里的面孔。它还可以识别你用语音对智能手机提出的问题,并且为谷歌搜索引擎提供帮助。这些数学模型通过分析大量的数字数据来学习这些东西。现在,位于珀斯默多克大学的海洋生物学家霍奇森正在利用这种技术在数万张照片中寻找儒艮,她使用的开源软件TensorFlow,也是谷歌公司内部机器学习服务正在使用的基本工具。
正如霍奇森所说,侦测这些儒艮需要特定类型的精确度,主要是因为这种动物是在水面下进食的。“它们有时候看起来就像白色的水涡,或是水面上的眩光,”她说。而神经网络现在已经可以识别出这个海湾各处大约80%的儒艮了。
该项目仍处于早期阶段,但它显示了深度学习在过去一年里的广泛影响。在2016年,这种古老的技术焕发了新的威力,它帮助一台谷歌机器击败全球最顶级的围棋棋手之一,而仅仅是在那几个月之前,这还是一个看似不可能完成的任务。不过这只是最突出的例子之一。2016年即将结束,深度学习不再是当初的花哨摆设了。它正在重塑谷歌、Facebook、微软和亚马逊等科技巨头,而且还在迅速传播到世界其他地方,这在很大程度上归功于这些巨头开放的源代码软件和提供的云计算服务。
新的翻译
在过去几年中,神经网络通过谷歌照片等应用大大改善了图像识别功能,还通过Google Now和微软小娜等数字助理将语音识别效果提升到了新的高度。而今年,它又带来了机器翻译的大飞跃。机器翻译指的是自动将语言从一种语言翻译成另一种语言。今年9月,谷歌推出了一个名为谷歌神经机器翻译(GNMT)的新服务,它完全通过神经网络来运行。该公司声称,GNMT把某些语言之间翻译的误差率降低了一大半(55%到85%)。
谷歌给它们输入大量现有翻译例句,以此来训练这些神经网络。部分例句带有瑕疵,包括旧版谷歌翻译得出的品质较差的翻译。但其中也包含人类专家的翻译,也就是说训练数据的质量是参差不齐的。克服缺陷的能力是深度学习最引人瞩目的地方之一:只要提供的数据足够多,即使数据存在一些缺陷,它训练后达到的水平也可以远远超越那些缺陷。
谷歌服务的工程主管麦克·舒斯特(Mike Schuster)爽快地承认GNMT远非完美。但它仍然是一个突破。由于该服务是完全基于深度学习的,因此谷歌可以更轻松地继续改进这个服务。具体来说,谷歌可以把GNMT作为一个整体来改进,而不是逐一对每种语言的机器翻译服务进行改善。
微软也在朝着这个方向发展。本月,微软更新了“微软翻译”app的版本,可以让说九种不同语言的团队成员进行即时对话。这个新系统几乎完全是在神经网络上运行的,微软副总裁沈向洋(Harry Shum)是该公司人工智能研究小组的负责人,他说这一点非常重要,因为这意味着微软机器翻译的能力可能会以更快的速度提高。
新的聊天
在2016年,深度学习也在聊天机器人(chatbot)中找到了用武之地,最引人注目的也许就是今年秋天发布的Google Allo了。Allo可以分析你收到的文本和照片,并提供如何回复的建议。它使用的是谷歌之前的“智能回复”技术。这种技术的效果非常好,在很大程度上是因为它尊重了当前机器学习技术的局限性。它建议的回复既简洁又恰当,而且可以提供好几个建议,毕竟如今的AI并不总是一次就能把事情做好。
在Allo内部,神经网络也会帮助回答你向谷歌搜索引擎提出的问题。他们帮助搜索助理了解你提出的是什么要求,并帮助制定答案。谷歌的产品经理大卫·奥尔(David Orr)说,如果没有深度学习,程序就无法找到答案。“我们需要使用神经网络,或者说,它是我们找到的唯一能做这件事的方法。”他说。“我们必须使用我们手里最先进的技术。”
而神经网络做不到的事情,就是进行真正的对话。无论科技CEO们在演讲中是怎么说的,要开发出这种聊天机器人还有很长的路要走,。但是,谷歌、Facebook和其他地方的研究人员正在探索深度学习技术,希望帮助达成这个高远的目标——我们在语音识别、图像识别和机器翻译领域看到的进步,希望也能在其他领域实现。而对话就是下一个前沿阵地。
新数据中心
今年夏天,在用一个AI战胜了顶尖围棋选手之后,谷歌DeepMind实验室领导人杰米斯·哈萨比斯(Demis Hassabis)表示他们还开发了一个AI来管理谷歌计算机数据中心的全球网络。通过使用一种被称为“深度强化学习”的技术(之前的AI学习下围棋,学习玩电子游戏都是使用的这种技术),这个AI可以在数据中心数以千计的服务器中,控制冷却风扇的开关时间,以及开窗的时间,以及使用空调的时间,毕竟使用空调成本更高一些。总的来说,这个AI可以管理数据中心里的120多项功能。
据彭博社报道,这个AI效果很好,帮谷歌节省了数以亿计的费用。换句话说,2014年谷歌斥资6.5亿美元收购了DeepMind,现在就已经完全回本了。目前DeepMind正计划在这些设施中安装更多的的传感器,以便收集更多数据来训练AI,让它百尺竿头,更进一步。
新的云计算
互联网巨头不仅在自己的服务中利用这个技术,还向其他公司进行推广。2015年底,谷歌宣布将TensorFlow开源。仅仅一年时间,这个软件就进入寻常公司,成为了阿曼达·霍奇森这些研究人员的帮手。与此同时,谷歌、微软、亚马逊也开始通过云计算服务提供自己的深度学习技术,让任何个人或组织都可以利用它们来构建自己的程序。把人工智能作为一种服务来提供,有可能成为这三大巨头的最大商机。
在过去12个月中,这种技术的火爆也导致圈内人才变得炙手可热。谷歌不久前宣布斯坦福大学教授李飞飞加入其云团队,负责云机器学习。亚马逊则挖到了卡内基梅隆大学的教授亚历克斯·斯摩纳(Alex Smolna)。科技巨头正在尽可能迅速地招揽顶尖人才,让其他公司望尘莫及。不过好消息是,这些人才希望至少把部分研究成果拿出来与其他人共享,他们正在为此而努力。
随着AI的发展,计算机科学家的角色正在发生变化。当然,世界仍然需要能够编写软件的人。但它也越来越需要可以训练神经网络的人,这是一种非常不同的技能,关键在于从数据中得出一个结果,而不是自己创建一些东西。像谷歌和Facebook这样的公司不仅雇用了新型人才,而且也在培训公司的现有员工,以便让他们更好地适应新的未来。而这个未来就是:每个人生活中的技术,都将被人工智能定义。(编译/云开)