查看原文
其他

从无聊到有得聊,看 Google Assistant 如何让人机交互更自然 | Google I/O

shenzhenware 深圳湾 2018-11-02

Google Assistant 长大了,也将面临更多的挑战。


- shenzhenware -


北京时间 5 月 9 日凌晨,Google I/O 2018 在山景城如期召开。


虽然是 Google 将 AI 定义为公司未来发展战略以来的第二个年头,但这次的 I/O 大会却远不如以前那般令人兴奋。「无处不在」的 AI 挑起了本次 I/O 大会大梁,涵盖语音、图像、自动驾驶各个方面。


而在看完整场戏份最足的 Google Assistant 更新之后,我湾编辑就十分放心的去睡觉了……因为,把过去深圳湾(微信 ID:shenzhenware)几个月的报道整理起来,基本就是这一次  Google Assistant 的更新了。


首先,我们来回顾下 Google Assistant 从诞生至今所取得的成绩:服务已经覆盖全球超过 25 个国家和地区;目前可控制 5 亿台智能设备(包括手机、家居、汽车等);Actions 数量超过 100 万个。



Google 表示,Google Assistant 计划年底支持 30 种语言,并进入 80 个国家和地区。


然后,我们来看看关于 Google Assistant  的重要更新信息:


帮你打电话预约餐馆、理发店等


这大概是 Google Assistant 本轮更新的最大亮点。在记录、提醒日程的基础上,Google Assistant 的执行能力已经上升了一个新的层次,它能代替你亲自打电话给理发店、餐厅等进行时间、座位预约。


https://v.qq.com/txp/iframe/player.html?vid=h064861w5ou&width=500&height=375&auto=0


即便客服说话语句不够连贯,AI 也能听懂对方的意思,甚至还能通过即兴反应和提问达到最终目的。如理想时间预约已满,Google Assistant 会另外退而求其次的约定另外的合适时间点。过程是如此流畅、衔接是那么的自然,以至于对方客服觉得不是在跟一个机器讲话。


另外,在完成打电话的任务后,Google Assistant 会把结果标记在日程上,并给用户发送提醒。




接下来,介绍一些我们「似曾相识」的 Google Assistant 新功能:


新增 6 种不同的人声:


就像手机 APP 往往会提供不同颜色、主题的皮肤给用户选择,Google 也在原有一男一女的声音选择基础上,给 Google Assistant 带来 6 种不同男女声。其中就有一种来自于曾经在《爱乐之城》里出演过的美国歌手约翰·传奇 (John Legend)。



值得注意的是,这些声音背后用到的技术是基于 WaveNet 神经网络的 DeepMind。而相关的 AI 语音 TTS 服务「Cloud Text-to-Speech」已经向个人开发者及企业开放购买(具体可移步 Google 博客官网查看)。在三月份的一篇报道中,深圳湾就曾系统介绍了这一服务。(点击前往了解 WaveNet 发展历程及其详细的工作原理)


多轮对话能力:


在过去,用户每向 Google Assistant 提出一个请求之前都要喊一遍「Ok,Google」,流程繁琐且又显得不够自然(我们大概不会跟家人、朋友每说一句话之前都喊一遍对方的名字),这其实也是许多语音智能交互的一个通病。


而如今,这种情况将得到改变,Google Assistant 新增了多轮对话能力,并能辨别出用户是在跟它对话还是跟别人对话。因多次喊唤醒词而口干舌燥的时代即将过去。



一次性处理两个指令的多任务处理功能:


在自然对话过程中,人们的一句话往往包含多个信息点。为了适应这个情况,Google Assistant 如今能在用户的一句话中同时 get 到两个指令。例如「帮我打开客厅的灯然后播放音乐」、「查找到去餐馆的路线后发给 Lisa」等。而 Google 在去年底就公布这一功能。


Kid-friendly:


在人员构成复杂的家庭场景中,语音智能产品(如智能音箱)必定要迎合不同家庭用户的使用习惯。


针对儿童用户,Google Assistant 先已经接入 13 万小时的儿童故事音频内容。



另外,通过人机交互,Google Assistant 还能从日常生活中让孩子从小培养注意礼节的好习惯。当儿童跟 Google Assistant 对话中用到「please」这个词时,Google Assistant 也会给予更亲切的回应,比如夸赞小孩「有礼貌」等。


更自然的声音+屏幕互动模式:


智能音箱时代过去强调「voice only」的情况已经发生改变,声屏互动成为当下的主流。而除了提供声音上更智能、更流畅的反馈,Google Assistant 在视觉表达方面也得到了不少改进。


以 Smart Display 为例,Google 演示了联想带屏智能音箱的功能:包括视频菜谱、视频通话、摄像监控、Google Map 导航等。「智能音箱里的语音助手只会告诉你这个餐馆在 2 公里以外,那还不如地图显示来得直接」Google 似乎意在表达「带屏幕的智能音箱更有发展前景」的观点。




而以手机为例,Google Assistant 拥有更高度符合场景的表现力,如开车使用 Google Map 时,Google Assistant 可很好的融合在地图页面,为用户提供音乐播放、天气、新闻等语音服务。



其中,Smart Display 基于 Google IoT 平台 Android Things,是 Google 于今年 1 月份的 CES 期间推出的产物。在本次 I/O 大会,Google 还公布了一则其首批合作伙伴的最新消息: 联想,LG,JBL 分别搭载 Smart Display 的产品将于今年 7 月份陆续上市。


登陆 Wear OS


今年 3 月份,Google 宣布 Android Wear 正式更名为 Wear OS By Google 的消息。在这次 Google I/O 大会前,最新版本的 Wear OS 也已经上线,同时 Google Assistant 的更多功能也已经登陆该系统,包括日程日通、智能推荐、家居控制、100 万个的 Actions 应用等。(具体可阅读本次推送的第二篇文章)



在这场盛大的开发者大会现场上,我们可以看到,Google 正通过各种方式的努力让语音人机交互变得更自然,Google Assistant 也离「Her」越来越近。随着所连接设备种类、数量的增长,服务覆盖到各个垂直细分场景和人群,Google Assistant 正身经百战。


主笔:莱恩 / 深圳湾

 < Google 语音智能生态 > 


// 年度盘点 //

2017 Google 十大智能硬件盘点


// 智能音箱//

Google Home mini

Google Home Max

Google Assistant 第三方智能音箱名单


// Google Assistant //

Google at WARE 2018:三年成长轨迹和规划

CES 2018:深度体验无处不在的「Hey Google」

深度解读 Google Assistant 生态基金:首批投资四家无一硬件公司

Google I/O 2017 更新:比 Alexa 发力要晚但后劲十足

打通语音购物与电商渠道: 推出 Shopping Actions 计划

带屏幕智能音箱系统:Smart Display

功能更新:将支持 30 种语言、一次可处理两个指令

海外拓展:印度开卖支持「印度特供」功能手机


● ● ●


深圳湾(公众号 ID:shenzhenware)连接全球硬件创新者,连接硬件生态链上下游,连接跨界产品的设计、技术、生产、渠道、商业、创新。深圳湾持续关注「AI+硬件」带来的场景和交互创新,以及与平台和应用相连的全产业链升级,欢迎相关团队与我们联系,微信私人客服:小炫(ID:warexx)


    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存