分享 | 科大讯飞胡郁:机器不会替代人类,但会改变人类职业
5月27日,由机器之心举办的首届全球机器智能峰会(GMIS 2017)在北京898创新空间开幕,多位人工智能行业领域大咖轮番登台带来各自专注领域的前沿分享。5月28日上午,科大讯飞执行总裁、消费者BG总裁胡郁在GMIS 2017带来了《人工智能+ 共创新世界》的演讲。大会上,讯飞听见为嘉宾演讲提供了实时的语音转写。
”胡郁在现场发表演讲
讯飞听见为大会嘉宾演讲提供实时的语音转写
此次GMIS 2017大会邀请到了来自美国、欧洲、加拿大及国内的众多顶级专家参会,包括国内外各顶尖高校和研究机构的相关负责人,以及来自科大讯飞、微软、英特尔、英伟达、亚马逊、腾讯、今日头条、蚂蚁金服、第四范式等国内外行业产业专家。在机器之心「AI00」颁奖晚宴上,科大讯飞成为“语音和自然语言领域”获奖企业之一。
颁奖现场
以下为胡郁在GMIS 2017大会现场演讲的内容:
谢谢俞凯,非常高兴今天是俞凯主持,因为我跟俞凯我们原来都是做语音的,而且我们现场还有位非常有名的邓力老师,从语音到人工智能包括到前沿的我们看到一个新的词叫机器智能。前天在贵阳的数博会上,马云有一个题为《数据创造价值 创新驱动未来》的演讲,我当时对马总提问:“机器智能和人工智能到底区别在什么地方”,这个当时有一个理解,就是说人工智能还是模仿等等能力,但是机器能够超越人的能力,这东西当然有一点小小的角度的差别。
但今天我上午来的时候碰到赵云峰(注:机器之心创始人),大家都知道机器之心今天这个会也非常的棒。赵云峰告诉我说这个机器智能,他们很早之前就开始提了,所以我觉得从这个角度上来讲,其实我们对智能的一些理解和概念是在不断往前发展的,我觉得这是很好的事情。虽然数博会上的讨论当时在座的很多的人也没有搞清楚什么是机器智能和什么是人工智能,但是我相信随着技术不断进步,有一个趋势是不可改变的,就是什么呢?就是机器一定会有越来越多的惊喜带给我们。我们走在这个路上。今天我的演讲还是非常希望能够带一些新的观点给大家。
那么首先讲一下,我最近看了一本书,这本书里面就讲到了不管是机器智能还是人工智能是在什么样的环境中生长起来的。我们都知道在宇宙诞生以后,我们其实产生了一个叫做自然宇宙的东西,就是宇宙大爆炸,但这个自然宇宙一直很孤单,就里面只有星球这个宇宙,大家都知道自然宇宙里面经过很长时间的发展,我们讲到地球上,大概40亿年前地球形成,然后有了生命,生命慢慢进化到人类,其实产生了一个新的东西。当有动物和人类以后产生了一个精神世界,但是到这个时候其实跟我们讲的人工智能还没有任何的关系。在1946年人类第一台的数字计算机发明以后,就产生了一个新的宇宙,这个宇宙叫数字宇宙。因为我认为不管哪一种的智能也好,它要有一个生长的环境,而我们看到的人类的智能是在自然运动里面产生的,但是经过了这么多年,在数字与宇宙里面的人工智能,如果比较一下这个时间的话,你会发现实在是太短。
在这个过程中,大家都知道1956年达特茅斯会议,但是最早提出数字宇宙里面的生命可能产生智能的讨论,应该是冯诺依曼和图灵。但是非常可惜,他们两个都英年早逝,一个1954年就去世了,一个1958年就去世了。我们看到的图灵奖包括很多方面,是为了纪念他们设立的,包括我们现在的冯诺依曼计算机的体系结构。人工智能的发展是有规律的。刚出生的时候机器最擅长的就是什么呢?运算和存储。这两天虽然柯洁输给了我们的AlphaGo,但是就像刚才杨强老师说的,人类并不因为我们在围棋上输给了一个机器,就显得我们人类智能不行了,这是因为其实下围棋在机器看来纯粹是一个运算和存储的事情,虽然这中间用了很多新的技术,但是并不能改变这个事实。所以说从运算的角度,如果我把它叫做运算智能的话,一开始我们人类就是落后于机器的。
但是在另外两个方面,这是我最近在思考的一个问题,就是我们经常说的人类和动物都有的智能,在感知智能和运动智能上机器追赶人类还是比较快的。但是我今天特别想讲一下运动智能,我们很多人都非常关注感知智能,比如说语音的识别、图像的识别,但是可能大家没有想到的是我们在运动智能上其实离动物都还差得很远,为什么这么说呢?因为动物和人类的运动,我们的神经系统和我们的肌肉的控制系统其实是一个完美的整体,他们之间通过一种我们现在还不知道的工作方式进行有效的工作。
比如说我们人类,如果我们要抓住一个在空中飞行的网球或者篮球,我们根本不需要计算这个网球和篮球在空中飞行的位置和速度,通过一种反馈系统,通过在训练过程中得到的记忆,我们就能把这个球抓住。而现在机器人是怎么做的呢?机器人还是用运算智能的方法,机器人基本上都要算出它的速度和位置,所以说其实在运动智能上,我认为现在机器和人类差距还是很大的,而这一点是将来机器人产业发展的一个非常重要的点。现在大家都知道我们在机器人领域主要用的还是控制论,这些是原来在信息处理领域的方法;还比较少的是用深度神经网络,包括刚才杨强老师介绍的很多学习的方法,而这个是人类的方法,我认为在这一点在运动智能方面我们还有非常大的潜力。
我们讲认知智能是因为人类有了语言,帮我们区别于动物,估计大家都知道了。因为语言能够更好的描述世界,能够更好的帮助我们进行沟通,能够产生概念,那么有语言到后来的包括理解知识、表达逻辑推理成为我们现在认知智能攻克的一个重点。那么如果从这张图上来看,其实我们可以看到一个过程就是机器在运算智能上是天生的比人类强,但是在感知智能和运动智能上正在快速的追赶人类。我对运动智能其实是抱有很大的期望的,因为我认为如果运动智能不能够解决的话,大家所梦想的在家里面能够帮你打扫卫生,在外面能够在工地上直接盖楼的这种机器人,其实他们是很难被做出来、或者是被大规模低成本的推广的。当然了,我们最后需要的克服的是认知智能。
那么第二个方面我想讲一下,在什么样的情况下才能促进产业的发展。我们都知道整个智能发展的三次浪潮,我这边只想讲一个结论,就是我觉得中国确实非常幸运,在第一次浪潮的时候基本上跟中国没有什么太大的关系,为什么?因为那个时候国家还没有这样的条件和基础;在第二次浪潮的时候,中国通过863计划储备了一批技术人员和科研成果;第三次浪潮的时候我们都知道,中国的移动互联网大数据和现代通讯技术的行业技术已经建立了,保证了在人工智能领域、在全球只有中美同时具备了在科学技术和产业基础方面两大奠基的角色。
现在,人工智能在全球范围内的争夺在中美两国之间进行。在过去这一段时间中,我们看到了深度神经网络大数据和涟漪效应,就是利用互联网的方法不断的改进我们的系统,这地方我对杨强老师刚才讲的内容非常地赞同。
我记得在15年的时候,我跟杨强老师第一次登台,杨强老师就定义过什么叫弱人工智能、什么叫强人工智能。现在做的工业上的人工智能还都是弱人工智能,杨强老师讲的迁移学习,我觉得是从弱到强人工智能的逐步改进。但现在在工业界里面,我们现在主要用的还是这些弱人工智能学习的方法。今天大家看到的语音识别、自然语言理解取得了很快进展,是我们在深度神经网络方面的一系列进展。这个地方也非常感谢邓力教授,他是世界上最早将深度神经网络用于语音识别、以及各种各样模式识别的领路人,他在大会上也讲到当时全球只有两个公司吸收了它的成果、最早把它放在产品里面去,一个就是谷歌,一个就是科大讯飞。我这里再次对邓力老师表示最诚心的感谢。
在这个过程中,我们可以看到利用深度神经网络和大数据,特别是利用涟漪效应,一方面,随着用户的数量的增长,系统在不断的学习,连续五年每年有30%的增长,如果把这个东西叫做一种规律的话,我把它叫做人工智能系统基于互联网的自我成长学习的这么一个框架,在图像识别、语音识别、自然语言处理等很多方面都能看到它的身影。在这个过程中,我们将大数据能力与讯飞的现在人工智能计划“讯飞超脑”进行结合,每一个里面都有非常多的数据参数,要训练每一个参数,就需要很多的数据来进行训练,而每个数据需要迭代很多次,我们可以看到这样的结果。
那么目前的一些进展我也给大家分享一下,让机器从“能听会说”到“能理解会思考”是一段非常艰苦的过程。过去的一年里,在英文的识别方面我们已经做到了世界上最好的水平,这是美国去年召开的一个全球的英文语音识别的评测大赛,我们获得了第一名,并且我们比前年的结果应该又提升了将近百分之百。
另外在认知智能方面,知识图谱的构建和最新的比赛叫Winograd测试。业界很多的人希望这个测试能够代替图灵测试,为什么呢?因为图灵测试不太好进行评估,而这个叫Winograd的测试非常难,为什么这么说呢?因为它测的是人类的常识,人类的常识是非常难让机器来学习的,它不是用运算智能的方法就能搞定的。
比如说我们看到屏幕上这句话叫做“爸爸没有能力继续它的儿子,因为他太重了”;问谁重或者“爸爸没有办法举起它的儿子,因为他太虚弱了”,问谁虚弱。如果你只是从文字的上下文的角度,其实没有太多的信心帮你来得到这个答案;这完全基于我们人类的common sense,而这种common sense是认知智能一个非常基础的东西。我们在去年的Winograd测试中也获得第一名,不过这个第一名也没什么好说的,为什么因为第一名我们也只得了60分,人类可以轻松的得到90分。
在过去的三年当中,我们在应用方面的一个最深刻的认识,就是人工智能到底怎么样改变我们的生活?我觉得可以把它分成两个大的方面,一方面是人工智能可以改变我们和机器交互的方式,从而改变我们在消费者领域的各种产品的形态;另一方面,人工智能可以学习很多专家的稀缺的资源,就是专家知识部分的东西。我们来逐步地看一下,大家都知道人机交互的发展思路肯定是机器越来越聪明,而人越来越不用改变我们的操作习惯,从原来的纸带打孔到键盘、鼠标到后面的触摸,我们现在可以看到人机交互、语音交互的产品正在成为一个新的方式,为什么这么说呢?因为机器是带有显示屏的,而我们人类可以非常好地理解机器的显示屏里面显示的图像的含义,而我们人类没有显示屏,人类最快的输出信息的方法就是语音。而机器现在可以理解我们的语音,那么我们就可以用自然语音交互的方式来改变人类和机器交互,自然交互越来越进入我们的生活。
今天我想回答一个问题,人工智能除了语音交互以外还能做什么?人工智能在各行各业都能够发挥作用,为什么呢?因为在各行各业里面最稀缺的是资源行业的专家,在教育里面我们缺少最好的老师,在医疗里面我们缺少最好的医生。人工智能能不能改变这一点?其实在人工智能上一个浪潮,也就是上个世纪80年代的时候,我们都希望建立一个专家系统,但是因为当时的技术和产业发展水平还不够,当时没有做成;现在我们又在做新的专家系统。
我给大家举一个实际的例子,大家在学校里面,都希望每个学生最好有一个给他专门配置的老师,这个老师最好能够改了学生的作业以后,知道这个学生有什么样的弱点,他的哪些知识点强,哪些知识点弱,然后给学生专门的布置作业。就像现在的今日头条一样,每个人的喜好是不一样的,大家看到的新闻也是不同的。
我们希望给每个学生布置的作业是不一样的,从而提高它的效率,而现在整个的流程我们都已经实现了。这个是我们在合肥一中做的具体的工作,在合肥一中有五个班级,他们使用了我们的个性化教学推荐系统,经过一个学期的学习后,其中有两个班级从原来的第14名和第12名提升到第2名和第1名,其实我们利用人工智能的方法学习到老师的一些非常重要的技能。在北师大二附中里面270个学生的语文作文,他们成绩平均提高了15%,之前语文作文和英文作文,因为老师没有时间改,原来的作文分数是很低的,但是使用新的人工智能系统以后,我们的作文就可以比较高频率的来进行批改,让学生的信心能得到提升。
我们的技术应用在智慧城市、医疗、国家安全、金融等很多方面。很多人都担心人工智能是不是会取代我们的工作,但是其实人类的每一个工作都是由很多的技能构成的,比如说老师除了有改作业的技能,有上课的技能,还有关心学生的技能,让学生身心全面发展的技能;但是因为改作业、还有出题目这些的技能占用的时间太多,老师其实没有时间去做那些真正提升学生的素质的技能。而用人工智能我相信并不能替代老师所有的技能。现在我们人工智能的发展随着运算智能、感知智能、运动智能和认知智能的发展,能够替代老师的像布置作业、改作业这一方面的技能,但是对于关爱学生、对于提高学生的素质,对于启蒙学生,我认为这些事情就是里面列的叫information free、information complete、 Information incomplete,人工智能发展到一定阶段,也无法取代人类。
所以我认为随着人工智能的发展,人工智能能够取代我们很多的职业中的某些技能,但不会替代人类的职业,只是会改变人类的职业。人类职业中的某些技能已经可以用机器代替了,对人类社会和职业的发展将有着非常重大的影响,但是这个影响是需要有个时间的,也不是说今天我们这样,明天睡觉起来之后完全变成另外一回事了。
我想简单的说一下,我认为在将来的整个商业里面,每一个公司都会有自己的人工智能大数据和云计算。在这样的一个过程中,大家会相互支持,这里面有很多公司是做人工智能的,而很多的公司是使用人工智能的,但是最终重要的就像罗振宇说的一样,他能帮我们节省时间,能让我们人类的时间使用得更加有效,这是我设想的在人工智能环境下商业生态的特点。公司之间需要复杂的融合,这些融合的变化是需要我们通过人工智能和所有对人工智能理解的人,通过商业合作的模式来共同实现的,我也期待着这个过程中能够产生非常多的技术创新型的公司,我们一起来做这样的事情。
在人工智能的整个发展过程中,是需要两种不同的创业方式和风格的公司,一种叫登山型的公司,它是一段一段不停的往前发展,你必须脚踏实地的努力去做,这个我们叫做原始核心技术系统的创新;但是当你应用在一个具体的方面的时候,你需要抓住这个风口浪尖,做出有冲击力的创新型的产品。所以我期待着我们能够在这个过程中,通过我们自己的人工智能的发展和很多创新创业者的结合,把登山和冲浪这两个种好的公司的文化商业模式和技术的创新的精神结合在一起。
今天在座的各位,我相信有很多是创新创业的公司,那么我也希望在这个过程中大家能够享受创业的过程。就像我们小时候玩耍一样,做你想做的,喜欢做的事情跟你喜欢、或者想去跟他合作人一起去做。最重要的是享受过程,而当你享受这个过程以后,你想最终达到的目标也更加容易达到。所以我认为创业绝对不是一个痛苦的事情,还是我们讲的快乐并痛苦着最终达到目标,并在这个过程中享受你的快乐。我期待着在将来和大家、包括在我们今天GMIS这个平台上大家能够更多的合作,更多地分享,一起创造更好的未来。谢谢大家。
编 | 阿序 图 | 机器之心 责编 | 王十二