小米崔宝秋:用设备和场景倒推 AI 技术进步,智能手机+IoT 是 AI 的无限生态 | WARE 2018
在 AI 领域,小米有着硬件、大数据获取能力以及产品广深度布局的三大优势。在未来十年甚至二十年,AI 都将是小米的核心战略。
- shenzhenware -
小米是一家什么公司?随着小米的产品线越铺越广,我们似乎已经很难用简单的一句话来定义。在「WARE 2018 新硬件峰会」的现场,小米人工智能与云平台副总裁崔宝秋给出了他的定义——小米不仅仅是一家智能手机公司,更是一家移动互联网公司、一家智能设备公司,是一家大数据和 AI 公司。
崔宝秋认为,在 AI 领域,小米有着硬件、大数据获取能力以及产品广深度布局的三大优势。在未来十年甚至二十年,AI 都将是小米的核心战略。
与其他同样发力 AI 的巨头相比,小米的 AI 化道路有着自己特有的硬件基因和大数据基因。从小米手机到小米生态链企业,凭借在品牌、市场、供应链管理等方面的优势,小米构建起了一个庞大的「小米系」IoT 产品池和用户群。
在这样的背景下出生的小爱同学,有着别人无法企及的先天优势——在别人还在为硬件设备接入跑断腿时,小米丰富的产品线都在等着小爱同学的赋能;庞大的用户基数持续性地为小爱同学的 AI 模型训练输出大数据支持,让小爱同学得以越来越「聪明」。
作为小米在 AI 布局上的重要一环,在小米的定位中,小爱同学远远不只是一个语音助手,也不仅仅是存在在智能音箱上,小爱同学是一个无处不在的语音交互平台,它为智能硬件提供了全新的操作方式,提供了内容与服务,同时也提供更多新的技能应用。
上个月,小爱同学新增了两款硬件设备,小米旗舰手机 MIX 2S 和小爱音箱 mini,分别对应了目前活跃度最大的两个 IoT 体系——智能手机和智能家居。
迷你音箱之于智能家居的意义在深圳湾的多篇文章中已有阐述,作为主音箱的补充,起到设备联动、将智能语音服务尽可能覆盖到全屋的作用。而「智能手机是目前 AI 的最大平台,几乎所有的 AI 能力都可以在手机上得以呈现。」
目前,小爱同学已有内容、知识、工具、控制、帮助、生活服务、娱乐、闲聊、App 等 9 大类服务,整合了语音、显示屏、触控屏等多种交互形式。而在未来,小爱同学将会渗透到越来越多的场景中去。
以下是崔宝秋在「WARE 2018 新硬件峰会」的演讲实录,内容略有删减:
演讲嘉宾:崔宝秋 / 小米人工智能与云平台副总裁
演讲主题:从 IoT 到 AI,小米的语音智能生态发展之路
尊敬的各位嘉宾,各位朋友,大家上午好!我叫崔宝秋,非常感谢深圳湾的邀请,第一次来参加硬件的大会。
我今天跟大家分享的题目是「从 IoT 到 AI,小米的智能语音生态发展之路」。很巧,跟上一位分享嘉宾(Saleel Awsare / Synaptics)的内容非常贴合,我从小米的角度讲一下我们在语音交互、在 AI 上走的一小段路。
小米人工智能与云平台的技术主线: 云计算、大数据、人工智能
提起小米,大家会说,小米是一家手机公司。实际上,小米不仅仅是一家手机公司,更是一家移动互联网公司、一家智能设备公司。在我看来,更多是一家大数据公司和一家 AI 公司。
我六年前加入小米,加入的第一天就说小米是一家大数据公司,而且必须是一家大数据公司。今天 AI 火了,大家都说「大数据过时了」。我想讲,大数据仍然不过时,今天 AI 的背后还是大数据的功劳,大数据不是虚的东西。很多公司有几台服务器,有几个集群和数据库就称之为大数据公司,那是不对的,小米是真正的大数据公司。
我刚加入小米,就成立了小米云平台团队,覆盖了从 C 到 B 的历程。2016 年我们进入 AI 时代,当然不是有了 AlphaGo 小米才开始做 AI,其实 AI 技术、机器学习技术,围绕大数据早就在小米用起来了。
AI 在小米早就无处不在了
AI 在小米早就无处不在了,有两个原因:第一个原因,小米是一家手机公司,同时也是一家智能设备公司。在小米品牌下,我们有自己的手机、电视、路由器、音箱等等。四年多前,小米开始了生态链布局,我们花了四年左右的时间投资了 100 多家生态链企业,为大家推出形形色色的智能家居、智能穿戴设备和各种 IoT 设备。
我们的 IoT 战略短短几年非常奏效,这是截止至去年 11 月底的一个数字,全球联网的 MIOT 设备超过了 8500 万台,所以小米的 IoT 平台是全球最大的 MIOT 平台。不知不觉中,我们小米的产品和小米生态链的产品已经遍布全球,密密麻麻。有一些我们还没有真正进去,但是用户已经通过各种手段把当地点亮了。
小米的 AI 之路很早就开始了,我来小米做的第一个项目就是做个人的推荐系统,后面用到机器学习。对一家搜索公司来讲,AI 的第一款产品就是搜索,对一家电商平台公司来说,AI 的第一款应用就是电商。对游戏或社交公司来说,主要应用产品就是游戏或者社交。我们用很小的团队一统小米十多个搜索产品。
小米是一家内容公司,有各种各样的内容推荐,文字、图片、视频等等。在小米电视上面,我的团队跟小米电视团队联合推出了「千人千面」的拼图墙,让每一个家庭甚至每个人看到电视节目的界面是跟其他人不一样的。「千人千面」的功能一经推出,电视的开机频率和观看时长就翻了好几倍,说明了 AI 能力和大数据能力发挥的作用。
小米也是一家电商公司,小米也是一家互联网金融公司,这背后都是大数据和 AI 在推动。
今天,AI 在小米无处不在,未来我们的小爱同学也会做到无处不在、无所不能。几乎所有的AI能力在小米都有落地,包括应用场景,不仅在各种设备和软件产品上,还有各种智能场景。前面的分享嘉宾讲了很多家庭场景、车载场景,这也是小米未来会特别关注的一些领域。
小米做 AI 的优势是什么?
两年前,我们开始加大对AI的投入,雷总和我们整个管理团队都对外讲,「未来十年甚至二十年,AI 将是小米的核心战略。」
小米三大优势:硬件、大数据和生态广深布局
我们做 AI 的优势在哪儿呢?小米真真切切做 AI 的三大优势:
第一个优势,小米的硬件优势,我们可以做很漂亮的,高性价比、高颜值、用户体验好、非常贴合用户需求的硬件;第二个优势,最重要的是小米有各种大数据获取能力。新的 AI 时代后面确确实实离不开大数据,没有大数据,空谈 AI。第三个优势,生态链产品的广深布局。小爱同学刚刚诞生,后面已经有很多等它的兄弟伙伴。
AI 无处不在,AI 能力在小米会大大应用到。我对内外都会讲,小米在 AI 投入再多都不为过。
这是小米的 AI 能力图谱,最底层的基础能力包括大数据、云计算、深度学习。今天离开这三个层面的基础能力都是空谈。上面的感知层、认知层、应用层、平台和业务,我们要打造这样一个生态。应用层可以看到小米 AI 现在的应用场景。
小米 AI 团队:AI 实验室 + AI 平台 + 小爱同学
我们的团队叫做小米云平台,去年我们团队更名为小米人工智能与云平台,我们把人工智能放在最前面,体现了「AI First」的理念,我觉得大家的思路都挺像的。
在 AI 领域,我们组建了三个团队,其他团队的搜索、推荐、大数据都是泛 AI 的。
小米的 AI 实验室负责算法和前沿技术研发,负责各个领域,视觉、知识图谱、自然语言、智能问答、深度学习算法等等;AI 平台是把 AI 实验室的算法和技术落地到产品上,也负责把 AI 能力云服务化,也负责提供设备端和云的框架;小爱同学,估计大家都听说过或者用过,小爱同学是一个专门的团队,有点像亚马逊的 Alexa。
小米 AI 战略技术落地:小爱同学
今天主要的话题就是小爱同学这个语音操作系统。我们的口号是「小爱同学让复杂操作变成一句话的事儿」。最早,我们在电视上面推出小爱同学的时候喊了这样一句话,现在我越来越强调这句话,不仅在电视上,还在音箱上,还在手机上,让所有的操作、所有内容与服务的获取都变成短短一句话的事儿。
为什么第一款 AI 战略技术产品是音箱?
2016 年我们选择要做一款 AI 战略技术产品,思考很多,最终选择小米 AI 音箱。有很多原因,其中有这么两个原因:
一个是小米有做音箱的能力与历史,我们已经推出过大大小小数款 WiFi 音箱、蓝牙音箱等等,但不是真正的智能音箱,我们可以做音质特别好的音箱,做AI音箱是水到渠成的;
第二个原因,我们想通过打造这款产品,整体提升小米在 AI 上的技术储备与能力提升。如果大家清楚的话,一个音箱后面几乎可以串起所有的能力,当然除了视觉、无人驾驶以外,其他所有的 AI 能力都可以呈现和融入,包括语音识别、唤醒、自然语音处理、自然语言理解、推荐、搜索、深度学习、语音输出、个性化推荐等等,这些都需要。
我们 2016 年底开始立项,2017 年发布,发布到现在为止热度只增不减。我们几乎所有的产品都是供不应求的。我认为小米 AI 音箱创了历史,现在已经 8 个多月了,这个越来越火。「小爱同学」这个唤醒词几乎成了中国智能音箱的代名词。
去年我们发布的小爱音箱 mini 版。原来大的音箱(小米 AI 音箱)放在客厅里面,因为它的体积比较大,mini 版具有同样的功能,可以把它放在卧室里面,一个卧室里面放一个。
围绕大音箱、小音箱,我们有自己独到的专利技术,可以做到分布式拾音。当家中同时拥有多台小爱音箱时,小爱能通过精准的空间感知能力,根据说话人的朝向、距离、语音相关性、唤醒置信度等多维度判决条件,来智能地选择最合适的小爱进行应答。
3 月 27 号的发布会,我们也把小爱同学搬到了手机上。大家可以感受一下,我们在 MIX 2S 这款手机上可以做到熄屏唤醒,你呼唤「小爱同学」,它就会回答「我在」。
「小爱同学」这个几乎成了中国智能音箱的代名词
小爱同学一经发布,它的收欢迎度远远超出我的预期,我是做技术的,对 NLP 如何满足各种用户的需求,在去年发布之前心里就很忐忑,最担心小爱同学不能够满足大家的期望,让用户失望。一波一波的用户反馈告诉我,我的担心有点多余。当然,小爱同学的知识、能力在一天天地成长,越来越受欢迎,也可能是它甜美的声音获取了用户的心,也可能是它的唤醒词获取了用户的心。
我们想了很久为什么选「小爱」,「爱」就是「AI」,我们公司的名字是小米,跟小爱的调性是一样的,当时唤醒我们选择了「小爱同学」,让每个人喊起它来很亲切、很自然,小孩子可以喊同学,老爷爷、老奶奶也可以喊小爱同学。我们不管从硬件还是软件体验的层面上、还是从交互层面上,可以供你调侃,帮你数羊,各种原因让小爱同学的热度只增不减。
小爱同学的 AI 能力
我们一直强调,小爱同学或者小爱远远不只是一个语音助理,不仅仅是音箱上的小爱同学,更多是一个无处不在的语音交互平台,它是一个生态,它可以控制很多智能硬件、智能设备,可以提供很多服务于内容,未来是一个很强大的信息分发平台。这是我们的数据,这个数字每天都在往上增长。
今天围绕着小米的生态链产品,我们已经接入了这些大类的智能设备,未来小爱的生态会越来越大,我们会向第三方开放。刚才这位先生分享的家居场景、车载场景,随着手机会 24 小时随着你无处不在,小爱也会无处不在,一句话可以帮助你解决很多问题。
小爱同学的底层技术
简单讲一下小爱后面有什么 AI 能力(底层技术)。
远场增强,在降噪方面,在嘈杂的人群和各种噪音环境中,如何让小爱听得更清楚,我们就有噪音处理和降噪。
分布式拾音,家里各种声音,包括墙上、桌上的,能够听动你的拾音设备都在家里面,我们可以想象得到,未来小米在各位家里面不只是一款,可能有很多,你喊「小爱同学」哪个设备来回答你,哪个设备更好的满足你的需求,分布式识音可以满足你。
唤醒、语音识别、声纹识别,比如说你是家庭成员中的爸爸、孩子还是爷爷,对不同人小爱未来会以不同的方式回答你,小孩子唤醒可以用小孩子的模式对话,爷爷奶奶来交流会用老年人的模式来交流。
为打造小爱同学,我们投入很多。这是一个例子,小米已建成业内首家全自动化远场声学实验室,配备全球领先的声学测量仪器,可模拟多种家居声学场景,同时我们联合多家业内最优秀的语音技术合作伙伴,推出了适用于智能语音交互产品的远场语音测评规范,旨在从用户体验角度建立一套科学完善的系统性能测评标准,推动行业发展。
大数据助力小爱同学快速成长
举个例子,去年小米成立AI团队,我们的语音识别团队没有人,1 月份招了第一个人,2 月份才招了第二个人,到 11 月份,我们自己的语音识别能力已经在电视上可以达到准确率 98.53%,这个非常惊人。我们去年推出小爱音箱的时候,借助第三方的语音识别能力,今天我们已经赶上或者超过第三方的语音识别能力。
后面的原因是什么?原因就是我们要感谢小爱音箱的硬件能力、软件能力,我们获取了很多用户,也感谢热情的小爱音箱的爱好者,每天跟小爱音箱对话几十次,有一些新用户进来,每天不停的交流,3岁、5岁、10几岁的孩子跟小爱同学交流,有一些让小爱帮助完成作业,不断跟小爱交流,这些语料我们会拿来训练。所以,在先进的深度学习算法的前提下,通过大量的语料,我们不停地提升小爱的识别能力。
今天语音交互时代到来了,其中一个主要的原因是 ASR 的识别能力,准确率已经达到一个很高的地步。今天你随便拿出小爱同学出来问很多东西,几乎可以识别的准准确确,不用重复三遍、五遍,错误理解的现象越来越少。
小爱同学会日新月异的变得更加聪明、更加懂事、更加懂你,背后就是它的知识,从2岁、3岁到4、5岁,小爱同学像一个小学生一样每天在成长,未来我们希望它很快成为一个高中生、大学生,未来成为某个领域的专家,博士级别都有可能。我们希望小爱同学不仅成为你的个人助理,还成为你的技术助理和智能家居的管家,以后可以给你提供专业级的服务,比如医疗健康等服务。
后面还有智能问答的技术,小爱同学接入各种百科知识,会各种专业技能。我们的智能问答的技术会有智能客服,小米之家店员的培训等等,这都是背后的技术。我们还有一个闲聊团队,负责让小爱能够可以聊天。小爱同学赋能的设备有很多。
多场景应用,就如刚才这位先生讲的,有一些产品跟我们想做的东西非常贴合。这是几大类服务,这是我们聚焦的几个,中间有交互的形式,小爱同学在音箱上是一个形态,在手机上是另外一个形态,在电视上面也是一个形态。
我认为小爱同学在这三个硬件产品上,实际上这是三个完全不同的产品,我们需要好好打磨,有一些是语音,有的是语音+显示屏,有的是语音+触控屏。应用场景包括音箱、手机、手表和电视。应用场景不只是这几个,包括了很多,不只是硬件的应用场景。什么叫场景?场景是一种围绕硬件、围绕上下文、围绕环境的一些应用。
小爱的技能,现在有 200 多个,未来我们希望快速成长到 1000 个。我们内部排了序,大家最喜欢用小爱的音箱控制、音乐、闲聊、开放平台、默认回复等等很多种。
智能手机+IoT,我认为是 AI 的无限生态
刚才我讲到小爱同学是一个生态,这个生态就是语音交互生态。
这里面包括三个部分,第一是智能硬件,声控设备、数控设备,未来声控设备和数控设备在家里面可能无处不在了;第二是内容与服务;第三是技能开发。围绕这三大块,我们会打造小爱同学的生态。
小米是一家生态公司,手机是核心业务。我的说法多种行业的人是认同的,智能手机是目前 AI 的最大平台,几乎所有的 AI 能力都会在手机上得以呈现。智能手机+IoT,我认为是 AI 的无限生态,所以小米上在 AI 上投入再多都不为过,这是有背后原因的。
在新的 AI 时代,中国有一个机会,以小米为代表的一系列智能设备公司和互联网公司也有一个机会,我相信在未来十年,我们人类将迎来历史上技术创新最辉煌的十年,因为 AI。我也希望 AI 能够帮助我们小米更快地实现我们的愿景,让每个人都能享受科技的乐趣。
这就是我今天要跟大家分享的内容。谢谢大家!■
整理、编辑:大树 / 深圳湾
● ● ●
「WARE 2018 新硬件第 II 季」即将重磅开启!我们将邀请国内外极具代表性领域的前沿嘉宾,分享他们在技术、产品、商业方面的见解!
长按图片二维码,即刻锁定!
< 快到湾里来 >
深圳湾招人啦!!!深圳湾正在招聘「真知灼见的科技记者」、「四通八达的运营编辑」、「才华横溢的市场策划」、「技能爆表的活动运营」、「热情四射的社区达人」,如果你对科技领域有满满的热情、想把玩最新最酷的科技产品、喜欢分享一切有趣科技成果,那就快到「湾」里来吧!
简历传输门👉 s@shenzhenware.com
深圳湾(公众号 ID:shenzhenware)连接全球硬件创新者,连接硬件生态链上下游,连接跨界产品的设计、技术、生产、渠道、商业、创新。深圳湾持续关注「AI+硬件」带来的场景和交互创新,以及与平台和应用相连的全产业链升级,欢迎相关团队与我们联系,微信私人客服:小炫(ID:warexx)。