查看原文
其他

美国科学院院士、图灵奖得主:约翰•爱德华•霍普克罗夫特——深度学习

2017-12-05 图灵君整理 图灵人工智能

约翰·爱德华·霍普克罗夫特,美国计算机科学家 ,毕业于美国康奈尔大学计算机科学系 。美国科学院院士、图灵奖得主。1986年,因在算法及数据结构的设计和分析中所取得的决定性成果,获得图灵奖。2017年11月,当选中国科学院外籍院士。



非常感谢能够参加此次论坛,有这个机会跟大家谈论一下人工智能。我们其实已经经历了好几次革命,第一次是农业革命,是十万年前;当时基本上20万年以来人类是在狩猎方面有所建树,这个就是关于农业革命。之后是1700年之后的工业革命,我们就开始采用一些机械的方式,现在我们经历了信息化的革命。在我小的时候50年前,当时我们是需要电梯的操作员来进行操作的,而那些工作后来由于自动化的取代,这些工作就消失了。还有包括一些自动驾驶的车辆在飞速自发展,美国有350万的火车司机,他们就像之前的电梯操作工一样,这些会被替代。因为火车司机一天只能工作八小时,但是无人驾驶的话一天24小时都可以工作的。从洛杉矶到纽约现在只需要两天,以前是需要四到五天,会需要花费更少的时间。而且我们需要的卡车,货车也没有那么多了。

经济学家经常会说有一些工作会消失,但是还会有一些工作。我和一些人谈到,我们现在会进入到一个时代,只有25%的劳动力需要满足我们所需要的一些商品和服务。如果说这样的话,人们可以每周工作20小时,并且可以在45岁退休了。而这些工作需要正规大学的教育,如果你的职业生涯是40年的话,这样的话劳动力的规模会额外的减少20%国外。现在我们需要思考一些关键的问题,就是这个多就会发生,以及有多少百分比的人找到工作,我们需要什么样的工作呢?可能需要大学教育,以及人类和社会每个人都有基本的生存的资源。如果我们在45岁退休,接下来做什么?我们如何来举行有意义的活动。

人们说,世界只有两个国家从AI从收益,也就是中国和美国,因为其他的国家是没有基础设施的,而发展中国家在生产一些机械性的工具的时候,门槛是非常高的,而进入AI的门槛也是成本非常的高。工业革命我们是让许多的物理自动化,现在在信息中我们也能够把智力自动化。这其中重要的一件事是过去10到15年的机器学习,我们现在可以监督机器来学习,这个是非常令人振奋的技术,已经生产出很多的产品,而且其实机器也可以不停的监督在学习,包括图象识别,你进入商店的时候,这个商店就能够识别你,知道你过去买了什么东西,以及什么样的产品对你来说是有价值的。语音识别在你未来打电话给公司的时候,你不是和电台的接线员打交道了,还有自然语言处理技术。

我们看到一些电影,还有包括电影中的一些评论,有一些评论是假的,是由机器人所发的,所以说技术能够识别哪些是真的还是假的,是正面的还是负面的。政府的部门不需要像原来一样审阅这些言论了。亚马逊也开了一家杂货店,是不需要结账的,是自动的进行购物和扣款的。还有包括医疗的诊断以及助理等等,计算机能够比人类更好的诊断图像,还有包括教授也说到这一点了。这其中的驱动力就是人工智能,下面我向大家快速介绍一下深入学习。

2012年发行了一场非常深刻的变革和革命,这里是一共有120万张图片,一千个类别,大家可以看到这个内容,如果我们可以去培训这些程序的话,我们就可以知道这些程序的表现是怎么样的。到2012年的错误率是25%左右,人们希望能够提升,但是每年的进步很小。但是2012年很多 45 33811 45 15265 0 0 1784 0 0:00:18 0:00:08 0:00:10 2991司也开始使用深度学习,并且进行了广泛的应用。

再说一下重要的发展方向,首先是压缩生存的规模,现在我们的理解是没有那么的深入的,有10亿的关口,所以我们要压缩深层网络的关口。还有一点我将集成作为激活空间,现在是在非常高度的集成空间,这上面的关口,所有的这些图像,比如说猫的图像它们是在一个低层次的副本上了,如果把这个猫的图像改变一下,可以垂直的改变方向。

快速的说一下压缩,这个是我们可以培训这个系统,让它做的非常的好,我们也可以培训一个更好的网络来分类图片,但是是不成功的,现在人们所做的就是如下的事。我们能够更好的激活这个空间,培训这些系统来进行更好的激活,而并不是简单的分类,这个就是我们能够减少网络大小的一个方法,这可能以后再大家的苹果手机上实现了。

还有当地的一个最低的标准,现在的问题是局部的这些标准,哪个是最好的?我可以向大家展示一下整体的最小值,就是最尖的部分,而现在的这些数据大家可以看到坐标图上的曲线。这就是培训数据的错误率,大家可以看到这个是广域的最小值,曲线是可以移动的。我们的上升非常的缓慢,之后在错误率急速上升,之后是形成对立网络。人们在编写计算的代码会生成真实的图片,比如说,我向电脑中输入猫,我希望电脑中就生成猫的图片,但是电脑做得不是特别的好,有一些人想了一个方法,我们可以合成一个图像的编辑器,我们把这两个合并一下就可以有图像生成器,在生成之后我们可以使用合成的图像来区分真实的图像,而人们也发现这些机器可以生成真实的图像了。所以,这就是我刚才所说的对立空间的使用领域。

比如说,从一种语言翻译到另外种语言,在两种语言中我们都有很重要的任务来做,我们可以用鉴别器来合成一个翻译器,比如说,从英文翻译成德文,我们就直接从英文的语言,通过生成器来说一些德语,并且我们能够来确定德语的一些语序措词,这个是真实的而不是合成的。之后,再从德文翻成英文,我们也可以使用三个翻译的系统。还有生动娱乐性的学习,比如说,这个系统受到培训,它能够识别猫,但是我们稍微改变一下像素,它就可以识别汽车。因为我们是在垂直的距离上改变了关于猫的副本的参数,所以说它就像一个过滤器一样能够解决问题。

现在我们是对像素做一些处理,像素和相邻像素是没有关系,但是其实我们做的研究要更加的深入,我下面再说一下另外一个领域,我们在培训这些网络的时候,我们向他们展示一千多个图片。比如说,我女儿两岁的时候,我就和他一起在沙发上看图,我向她是车、猫、狗等等。我会告诉她这个是引擎等,之后上街看到救火车,我就跟她说,她就认识了。其实和书上的救火车是不一样的,我们要知道如何就一张单一的图片来培训这个网络。

我的女儿在生命的前两年看到了上万张的图片,人们经常问我AI是否是真实的?我想回答的是在当前的状态之下,人工智能只是高纬度空间当中的模式的识别,人工智能的程序不会提取对象的一些本质功能,它只是知道这个东西是看起来什么样的,从现在开始之后的四十年我们会有另外一场革命,人工智能会很好的理解功能。至少我们的生活也会发生翻天覆地的变化,距上一次的革命更短。

在此之后,我们的另外一场革命是四年之后,如果我们培训一些网络识别一些路上的汽车,无论是客车、货车、平板车等等,我们看到这张图,它就会告诉你这个是平板车,车上有一些货物或者说其他的车型。但是如果是人类的话,可能会发现轮子上有一些马达,所以我们就知道它可能是个远程操控的车。这不仅仅是关乎人工智能,还有计算的能力,有非常多的类似于人工智能的任务,都是利用AI来进行的。现在我们所处的时代会翻天覆地的改变我们的生活,再次感谢大家的聆听。谢谢!


往期精彩文章(单击就可查看):

南京大学教授:周志华——深度森林:探索深度神经网络以外的方法


斯坦福大学人工智能实验室主任:李飞飞——ImageNet之后,计算机视觉研究最新进展


清华大学:刘洋——基于深度学习的机器翻译


国防科技大学教授:殷建平——计算机科学理论的过去、现在与未来


清华大学软件学院院长——刘云浩:与高中生对话人工智能


【原创】|日本理化学研究所先进智能研究中心主任——Masashi Sugiyama:弱监督机器学习研究新进展


「人物特写」清华大学邓志东:“特征提取+推理”的小数据学习才是AI崛起的关键


明略讲堂 | 清华马少平教授详解“人工智能能做什么?”


【原创】|西安电子科大——焦李成:人工智能时代后深度学习的挑战与思考


Michael I. Jordan——计算思维、推断思维与数据科学


【原创】王飞跃:生成式对抗网络的机会与挑战


【原创】|微软亚洲研究院——刘铁岩:深度学习前沿


清华大学教授:孙富春——认知时代人工智能与机器人


清华大学:朱军博士——When Bayes meets Big Data


加州大学伯克利分校:马毅——低维结构和高维深模型(视觉)数据


加州大学伯克利分校计算机系教授:Dawn SONG——AI如何建立一个更强的防御系统


清华大学:刘知远——知识表示学习及其应用


李飞飞和ImageNet的洪荒之力


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存