从无聊到有得聊,看 Google Assistant 如何让人机交互更自然 | Google I/O
Google Assistant 长大了,也将面临更多的挑战。
- shenzhenware -
北京时间 5 月 9 日凌晨,Google I/O 2018 在山景城如期召开。
虽然是 Google 将 AI 定义为公司未来发展战略以来的第二个年头,但这次的 I/O 大会却远不如以前那般令人兴奋。「无处不在」的 AI 挑起了本次 I/O 大会大梁,涵盖语音、图像、自动驾驶各个方面。
而在看完整场戏份最足的 Google Assistant 更新之后,我湾编辑就十分放心的去睡觉了……因为,把过去深圳湾(微信 ID:shenzhenware)几个月的报道整理起来,基本就是这一次 Google Assistant 的更新了。
首先,我们来回顾下 Google Assistant 从诞生至今所取得的成绩:服务已经覆盖全球超过 25 个国家和地区;目前可控制 5 亿台智能设备(包括手机、家居、汽车等);Actions 数量超过 100 万个。
Google 表示,Google Assistant 计划年底支持 30 种语言,并进入 80 个国家和地区。
然后,我们来看看关于 Google Assistant 的重要更新信息:
帮你打电话预约餐馆、理发店等:
这大概是 Google Assistant 本轮更新的最大亮点。在记录、提醒日程的基础上,Google Assistant 的执行能力已经上升了一个新的层次,它能代替你亲自打电话给理发店、餐厅等进行时间、座位预约。
https://v.qq.com/txp/iframe/player.html?vid=h064861w5ou&width=500&height=375&auto=0
即便客服说话语句不够连贯,AI 也能听懂对方的意思,甚至还能通过即兴反应和提问达到最终目的。如理想时间预约已满,Google Assistant 会另外退而求其次的约定另外的合适时间点。过程是如此流畅、衔接是那么的自然,以至于对方客服觉得不是在跟一个机器讲话。
另外,在完成打电话的任务后,Google Assistant 会把结果标记在日程上,并给用户发送提醒。
接下来,介绍一些我们「似曾相识」的 Google Assistant 新功能:
新增 6 种不同的人声:
就像手机 APP 往往会提供不同颜色、主题的皮肤给用户选择,Google 也在原有一男一女的声音选择基础上,给 Google Assistant 带来 6 种不同男女声。其中就有一种来自于曾经在《爱乐之城》里出演过的美国歌手约翰·传奇 (John Legend)。
值得注意的是,这些声音背后用到的技术是基于 WaveNet 神经网络的 DeepMind。而相关的 AI 语音 TTS 服务「Cloud Text-to-Speech」已经向个人开发者及企业开放购买(具体可移步 Google 博客官网查看)。在三月份的一篇报道中,深圳湾就曾系统介绍了这一服务。(点击前往了解 WaveNet 发展历程及其详细的工作原理)
多轮对话能力:
在过去,用户每向 Google Assistant 提出一个请求之前都要喊一遍「Ok,Google」,流程繁琐且又显得不够自然(我们大概不会跟家人、朋友每说一句话之前都喊一遍对方的名字),这其实也是许多语音智能交互的一个通病。
而如今,这种情况将得到改变,Google Assistant 新增了多轮对话能力,并能辨别出用户是在跟它对话还是跟别人对话。因多次喊唤醒词而口干舌燥的时代即将过去。
一次性处理两个指令的多任务处理功能:
在自然对话过程中,人们的一句话往往包含多个信息点。为了适应这个情况,Google Assistant 如今能在用户的一句话中同时 get 到两个指令。例如「帮我打开客厅的灯然后播放音乐」、「查找到去餐馆的路线后发给 Lisa」等。而 Google 在去年底就公布这一功能。
Kid-friendly:
在人员构成复杂的家庭场景中,语音智能产品(如智能音箱)必定要迎合不同家庭用户的使用习惯。
针对儿童用户,Google Assistant 先已经接入 13 万小时的儿童故事音频内容。
另外,通过人机交互,Google Assistant 还能从日常生活中让孩子从小培养注意礼节的好习惯。当儿童跟 Google Assistant 对话中用到「please」这个词时,Google Assistant 也会给予更亲切的回应,比如夸赞小孩「有礼貌」等。
更自然的声音+屏幕互动模式:
智能音箱时代过去强调「voice only」的情况已经发生改变,声屏互动成为当下的主流。而除了提供声音上更智能、更流畅的反馈,Google Assistant 在视觉表达方面也得到了不少改进。
以 Smart Display 为例,Google 演示了联想带屏智能音箱的功能:包括视频菜谱、视频通话、摄像监控、Google Map 导航等。「智能音箱里的语音助手只会告诉你这个餐馆在 2 公里以外,那还不如地图显示来得直接」Google 似乎意在表达「带屏幕的智能音箱更有发展前景」的观点。
而以手机为例,Google Assistant 拥有更高度符合场景的表现力,如开车使用 Google Map 时,Google Assistant 可很好的融合在地图页面,为用户提供音乐播放、天气、新闻等语音服务。
其中,Smart Display 基于 Google IoT 平台 Android Things,是 Google 于今年 1 月份的 CES 期间推出的产物。在本次 I/O 大会,Google 还公布了一则其首批合作伙伴的最新消息: 联想,LG,JBL 分别搭载 Smart Display 的产品将于今年 7 月份陆续上市。
登陆 Wear OS
今年 3 月份,Google 宣布 Android Wear 正式更名为 Wear OS By Google 的消息。在这次 Google I/O 大会前,最新版本的 Wear OS 也已经上线,同时 Google Assistant 的更多功能也已经登陆该系统,包括日程日通、智能推荐、家居控制、100 万个的 Actions 应用等。(具体可阅读本次推送的第二篇文章)
在这场盛大的开发者大会现场上,我们可以看到,Google 正通过各种方式的努力让语音人机交互变得更自然,Google Assistant 也离「Her」越来越近。随着所连接设备种类、数量的增长,服务覆盖到各个垂直细分场景和人群,Google Assistant 正身经百战。■
主笔:莱恩 / 深圳湾
< Google 语音智能生态 >
// 年度盘点 //
// 智能音箱//
// Google Assistant //
CES 2018:深度体验无处不在的「Hey Google」
深度解读 Google Assistant 生态基金:首批投资四家无一硬件公司
Google I/O 2017 更新:比 Alexa 发力要晚但后劲十足
打通语音购物与电商渠道: 推出 Shopping Actions 计划
功能更新:将支持 30 种语言、一次可处理两个指令
海外拓展:印度开卖、支持「印度特供」功能手机
● ● ●
深圳湾(公众号 ID:shenzhenware)连接全球硬件创新者,连接硬件生态链上下游,连接跨界产品的设计、技术、生产、渠道、商业、创新。深圳湾持续关注「AI+硬件」带来的场景和交互创新,以及与平台和应用相连的全产业链升级,欢迎相关团队与我们联系,微信私人客服:小炫(ID:warexx)。