【科技评论】科大讯飞徐景明:人工智能的波浪式创新(2015中国计算机大会主报告22PPT)
本文由新智元(ID:AI_era)授权转载。更多关于人工智能的文章,请关注战略前沿技术后回复“智能”或“AI”查阅!
10月22日, 以“互联网催生新经济”为主题的2015年中国计算机大会(CNCC)在合肥盛大开幕。来自国际学术界、产业界、政府部门、媒体界等3500余人参加了本次盛会,参会人数创历史新高。作为中国智能语音及人工智能领导者,科大讯飞应邀参会,副总裁、董事会秘书徐景明在主论坛做了题为“让世界聆听我们的声音——科大讯飞人工智能最新进展及产业生态打造”的主题演讲。
在演讲中,徐景明先生介绍了科大讯飞的产品及生态链。科大讯飞在语音合成系统最关键的自然度综合指标上,现在已经达到了4.5自然度,科大讯飞也蝉联了 Blizzard Challenge 英文合成国际评测十连冠。在语音识别方面在车载等高噪声,复杂网络环境下有明显领先优势,已广泛应用于讯飞输入法、家电等社会生活各个领域。
爱奇艺:点击文末左下角“阅读原文”观看徐景明演讲视频
徐景明在会场上放了《舌尖上的中国》播音员的声音,并介绍说以后声音可以作为礼物了,如果以后没有时间给小孩子讲故事,可以把合成爸爸妈妈的声音来讲故事。
讯飞介绍了2014年8月开始做的讯飞超脑计划,目前已经了三大阶段性成果:
1、口语翻译达到了本科水平
2、口语作文评测机器可代替老师
3、开放式主观题评测取得突破
另外,省委常委、合肥市委书记吴存荣也来到讯飞的展位,停下脚步,认真听取了该企业智能语音技术的研发和营销情况,并频频点头表示肯定。
陈熙霖: 今天最后一位讲者是来自科大讯飞的副总裁、董事会秘书、科大管理学院的特聘教师,合肥市第十四、十五届人大代表徐景明先生,他还是安徽省无线电协会常务理事,他报告的题目是《讯飞在人工智能方面的进展以及生态链的打造》,掌声有请徐先生!
【徐景明】尊敬的各位嘉宾、各位朋友! 我今天主要是向大家汇报一下科大讯飞这么多年,我们在人工智能方面最新的进展,以及我们是如何通过平台的战略进行产业的集聚,实现生态链的打造。
这个图是摩根史丹利的报告,这是IT产业发展的五次浪潮,我通过这个图特别想跟大家提出的是什么呢?在这五次浪潮里面,其实人机交互的变革起着非常重要的引领作用,如果我们回顾一下大型机如何到小型机,小型机如何进入到家庭,家庭如何进入到我们每个人的身边。你会发现在这个过程当中,人机交互起着非常重要的主导作用。机器小型化进入到社区和学校,当它进入到我们身边的时候,这时候触摸屏广泛普及,使得它到我们每个人的身边和每个人手上,这是非常重要的人机交互进展的过程。
现在我们看到了什么呢?在这个阶段,我们看到PC机、手机,在这个过程手机已经进入成熟期阶段。我们看到更多的是穿戴式设备、智能家居、智能家电、机器人、汽车在快速蓬勃的发展,到了这个时候人和机器的交互会发生什么样的变化呢?接触式的交互不能满足需求,一定是非接触人机交互。
无论从2015年的CNCC大会的三大热点,可穿戴、智能家居、机器人,95%的开发者都认为智能交互是智能硬件交互、智能硬件产品所必备的。我们想象一下:你回到家里面,你的电视机是可以上网的,但是你怎么去操作它呢?你坐在沙发上用键盘操作电视机?家里面有机器人,你回家推开门你走到机器人的身边,在它身上指指点吗?肯定不是这样的。
我们看到语音合成技术里面的进展。从95年到现在,我们可以感受一下语音合成技术发展的情况。
我们简单听一下95年是什么效果,大家可以感受到是一个字一个字说出来的,我们可以想象一下把不同的词拼接到一起,它的时长、能量、音高要解决得很好,这个难度是非常大的。
我们听一下现在的语音合成效果,我们能感觉到技术的进步非常明显。用男生、女生、粤语合成一句话,这是我们合成效果技术的进步。
我们除了把中文语音技术做到世界最好以外——人家说讯飞做中文做世界第一是理所当然的,实际上不是这样的——我们在英文合成技术方面也取得了很大的突破。我们06年参加全球英文合成大赛,我们第一次希望进入前三名,结果获得综合指标第一名的成绩,外国人说你是一匹黑马,到底怎么样要看后面几年,自那以后我们每年都参加这个比赛,每次都获得综合指标第一名的成绩。我们感受一下英文的合成效果。
刚才我们听到的是通用的中文和英文的合成效果,很多人说我能不能有个性化的合成效果,现在我们在这个方面也取得了很大的突破。我们让特定人对着系统训练一段时间,我可以让系统模拟特定的发音风格。这里面其实已经有了很多的应用。
大家可能用的是最多的,是我们给高德导航做的,这里面有林志玲的声音。我们到了台湾专门采集了林志玲的语料,我们提供了合成的技术给高德做的。我们后面做了一个郭德纲的声音。
我们也跟运营商,跟中国移动在阅读基地里面进行了合作。现在有大量的电子书,这些电子书说实话,人的视觉已经根本不够用了,非常的疲劳。所以他们提出来我想听这些书,当然又来不及做。我们现在通过故事录音,可以形成故事风格的语音合成。这里面合成了一段声音,大家可以简单感受一下。其实这个声音是《舌尖上的中国》播音员的声音。以后我们每个人都可以有个性化的合成系统,你可以把它作为你的礼物送给你的爸爸妈妈;或者你以后有小孩了,小孩听故事你没有时间给他讲,但是他听到的合成的声音(可以)是爸爸妈妈声音合成的。
刚才是语音的合成。在语音识别方面,其实大家用的比较多的讯飞的输入法,现在已经有2.7亿的用户,而且是互联网上口碑和评分最高的输入法。除了内容的识别之外,我们在说话识别,声纹识别、语种识别都取得了非常不错的进步。在声纹评测里面,我们都是处于国际前三的领先地位。
大家知道语音识别非常重要的场景是在高噪声环境下,复杂网络环境下,这些领域的应用是真正的挑战。我们今年在宝马全球中文语音测试里面——实际上今年是在宝马,去年是在奔驰、通用全球测试里面——我们都是第一名。而且比第二名遥遥领先。现在国内基本上主流的车长和国际上主流的车长都在跟讯飞进行合作,这是我们典型的示范应用。
刚才我介绍的是语音技术。现在我们正在做的是让机器从听会说,到从理解到思考。
这是孙正义在今年年初的时候,当时放了一个豪言,现在的GDP是美国第一,可见几年以后一定是中国第一,他说2050年以后日本一定是第一。劳动力的价格日本非常高,也是中国的很多倍。他做了一个方程式,他说生产性乘以劳动人口等于竞争力。他说我将来要用机器人替代劳动力,如果有三千万台可以24小时工作的机器人,相当于给我增加了9000万制造业劳动人口,所以不会输于中国和美国,他这个豪言在业界引起了非常大的震惊。这个豪言真的不可实现吗?其实很难说,而且我们越来越觉得这个可能性是非常大的,如果我们不进步的话。
所以我们可以看到从能听会说,到从理解到思考。在人工智能理解领域,可以看到美国的大脑计划,欧盟的人类大脑项目。包括我们国家,也在筹划中国的脑计划。在这之前科技部已经启动了中国的人工智能首个重大项目,就是类人答题机器人项目,这也是美国、日本、欧盟国际上通用对人工智能水平的衡量项目。简单来说,希望通过三五年的时间,让机器人参加高考,能够达到前20%的水平。因为我们知道机器对于计算、存储这些能力非常强。但是它对于逻辑推理、知识表示有非常大的挑战。
所以在这个项目的基础上,以及我们在传统的人工智能,也就是我们说的人机交互的感知智能,我们推出了讯飞的超脑计划,在语言的理解、知识描述方面希望取得相应的突破。在去年的八月份,我们正式发布了讯飞的计划。
经过这一年的时间,我们也取得了很多阶段性的成果,一个是我们的口语翻译达到了本科水平,我们在2014年国际口语机器翻译评测大赛里面我们取得了第一名的成绩。
2015年NIST国际机器翻译评测大赛里面,也是人工评价第一名。现在如果大家用讯飞的输入法,会发现我们把它(机器翻译)作为一个特性集成到讯飞输入法里面去。如果我出国,我直接说中文,它直接显示成英文出来。作为一个非常重要的特色,受到大家的欢迎,而且在很多领域解决了大家的问题。现在我们出国直接带讯飞的翻译就可以了,可以解决日常生活问题。包括合肥火车站,站长跟我说,很多国际友人、要怎么跟他交流,我跟他说直接把这个东西装上就可以用了,确实解决了很多的问题。
第二个成果非常有价值,我们让机器对于口语作文评价,机器可以替代老师。我们国家有全国性的普通话等级考试,以前全是人工评测,现在我们通过机器全部做了,现在全部是机器在评普通话考试。此外我们在英语的口语考试上也取得突破,广东的高考,江苏的中考,都已经通过机器在进行评价。现在全国十几个地方都已经进去了。
第三,我们在开放式的主观评测里面也取得了非常大的突破。大家知道,我们老师改卷子、改作业,都是人工评阅,这个工作量太大了。后来对大型考试我们用2B铅笔涂黑,那个解决了(选择题),但是对于开放式的主观题是无法解决的,还是人工评。现在我们做到了机器对作文的自动评分,已经超过了人工的评阅。一篇语文作文或者是英文作文,机器比老师评的还要准,因为你想想它里面肯定跟很多词汇相关,跟语法和短语都是相关的,机器评比老师又认真、又准确。大家都是专家,一说就明白了。
但是如果用机器评分,要做到什么呢?你要把学生手写体可以变成机器理解的语言。传统的OCR技术能做到70-80%就很不错了,我们用人工智能相关的技术。我们在这里面,把它做到95%以上,突破非常大。这里面不仅仅是作文,现在我们还做简答题和选择题,所以我们以后会颠覆掉传统老师阅卷的方式。
我们基于我们的核心能力构建我们的生态链,这涉及到我们对创新的理解。创新必须是大波浪加小波浪的创新。我们可以看到,在上一个wintel时代的时候,基于这样的大波浪,出现了众多的小波浪创新;现在我们在什么时代?我们现在在安卓、IOS、ARM时代,在这样一个平台的时代下,我们看到了很多创新创业;我们未来将要进入什么样的时代,我们要进入人工智能的时代,只有找准了大波浪,我们才能做小波浪的创新,只有这样才能有价值,真正对社会有意义。如果我们只做微创新,只是在做价值链的打散组合,这个对个体有意义,但是对社会发展,对我们的经济总量,对国家竞争力真的有那么大的意义吗?这块可以引起我们的思考。
我们把我们的核心能力的平台向创新创业者开放出来,让他们在讯飞的平台上进行产品的开发,免费地进行创业。
现在我们的开发平台,用户数累计安装量已经超过10亿,语音日在线访问次数是1.8亿,离线是7.5亿,第三方创业项目现在已经接近10万个,涌现了一批发展的态势。
每天新增APP型应用是197个,新增创业型的应用是42个。
我们看到,在智能家居是独占鳌头的。
这是我们智能硬件分布的情况:(主要是)北京、深圳、上海、广洲、合肥。
基于我们的核心能力,讯飞超脑应用是非常广泛的,包括智能教学考评、智能家居、智能城市、智能客服,在这个基础上我们自己搭建了我们投资平台,也会推动相关工作的发展。
最后,我们非常感谢大家花时间听我的介绍,希望我们大家一起来合作,共同让世界听到我们的人工智能,听到我们在计算机领域的声音,谢谢。