从无聊到有得聊，看 Google Assistant 如何让人机交互更自然 | Google I/O | 自由微信

从无聊到有得聊，看 Google Assistant 如何让人机交互更自然 | Google I/O

原创： shenzhenware 深圳湾 2018-11-02

Google Assistant 长大了，也将面临更多的挑战。

- shenzhenware -

北京时间 5 月 9 日凌晨，Google I/O 2018 在山景城如期召开。

虽然是 Google 将 AI 定义为公司未来发展战略以来的第二个年头，但这次的 I/O 大会却远不如以前那般令人兴奋。「无处不在」的 AI 挑起了本次 I/O 大会大梁，涵盖语音、图像、自动驾驶各个方面。

而在看完整场戏份最足的 Google Assistant 更新之后，我湾编辑就十分放心的去睡觉了……因为，把过去深圳湾（微信 ID：shenzhenware）几个月的报道整理起来，基本就是这一次 Google Assistant 的更新了。

首先，我们来回顾下 Google Assistant 从诞生至今所取得的成绩：服务已经覆盖全球超过 25 个国家和地区；目前可控制 5 亿台智能设备（包括手机、家居、汽车等）；Actions 数量超过 100 万个。

Google 表示，Google Assistant 计划年底支持 30 种语言，并进入 80 个国家和地区。

然后，我们来看看关于 Google Assistant 的重要更新信息：

帮你打电话预约餐馆、理发店等：

这大概是 Google Assistant 本轮更新的最大亮点。在记录、提醒日程的基础上，Google Assistant 的执行能力已经上升了一个新的层次，它能代替你亲自打电话给理发店、餐厅等进行时间、座位预约。

https://v.qq.com/txp/iframe/player.html?vid=h064861w5ou&width=500&height=375&auto=0

即便客服说话语句不够连贯，AI 也能听懂对方的意思，甚至还能通过即兴反应和提问达到最终目的。如理想时间预约已满，Google Assistant 会另外退而求其次的约定另外的合适时间点。过程是如此流畅、衔接是那么的自然，以至于对方客服觉得不是在跟一个机器讲话。

另外，在完成打电话的任务后，Google Assistant 会把结果标记在日程上，并给用户发送提醒。

接下来，介绍一些我们「似曾相识」的 Google Assistant 新功能：

新增 6 种不同的人声：

就像手机 APP 往往会提供不同颜色、主题的皮肤给用户选择，Google 也在原有一男一女的声音选择基础上，给 Google Assistant 带来 6 种不同男女声。其中就有一种来自于曾经在《爱乐之城》里出演过的美国歌手约翰·传奇 (John Legend)。

值得注意的是，这些声音背后用到的技术是基于 WaveNet 神经网络的 DeepMind。而相关的 AI 语音 TTS 服务「Cloud Text-to-Speech」已经向个人开发者及企业开放购买（具体可移步 Google 博客官网查看）。在三月份的一篇报道中，深圳湾就曾系统介绍了这一服务。（点击前往了解 WaveNet 发展历程及其详细的工作原理）

多轮对话能力：

在过去，用户每向 Google Assistant 提出一个请求之前都要喊一遍「Ok，Google」，流程繁琐且又显得不够自然（我们大概不会跟家人、朋友每说一句话之前都喊一遍对方的名字），这其实也是许多语音智能交互的一个通病。

而如今，这种情况将得到改变，Google Assistant 新增了多轮对话能力，并能辨别出用户是在跟它对话还是跟别人对话。因多次喊唤醒词而口干舌燥的时代即将过去。

一次性处理两个指令的多任务处理功能：

在自然对话过程中，人们的一句话往往包含多个信息点。为了适应这个情况，Google Assistant 如今能在用户的一句话中同时 get 到两个指令。例如「帮我打开客厅的灯然后播放音乐」、「查找到去餐馆的路线后发给 Lisa」等。而 Google 在去年底就公布这一功能。

Kid-friendly：

在人员构成复杂的家庭场景中，语音智能产品（如智能音箱）必定要迎合不同家庭用户的使用习惯。

针对儿童用户，Google Assistant 先已经接入 13 万小时的儿童故事音频内容。

另外，通过人机交互，Google Assistant 还能从日常生活中让孩子从小培养注意礼节的好习惯。当儿童跟 Google Assistant 对话中用到「please」这个词时，Google Assistant 也会给予更亲切的回应，比如夸赞小孩「有礼貌」等。

更自然的声音+屏幕互动模式：

智能音箱时代过去强调「voice only」的情况已经发生改变，声屏互动成为当下的主流。而除了提供声音上更智能、更流畅的反馈，Google Assistant 在视觉表达方面也得到了不少改进。

以 Smart Display 为例，Google 演示了联想带屏智能音箱的功能：包括视频菜谱、视频通话、摄像监控、Google Map 导航等。「智能音箱里的语音助手只会告诉你这个餐馆在 2 公里以外，那还不如地图显示来得直接」Google 似乎意在表达「带屏幕的智能音箱更有发展前景」的观点。

而以手机为例，Google Assistant 拥有更高度符合场景的表现力，如开车使用 Google Map 时，Google Assistant 可很好的融合在地图页面，为用户提供音乐播放、天气、新闻等语音服务。

其中，Smart Display 基于 Google IoT 平台 Android Things，是 Google 于今年 1 月份的 CES 期间推出的产物。在本次 I/O 大会，Google 还公布了一则其首批合作伙伴的最新消息: 联想，LG，JBL 分别搭载 Smart Display 的产品将于今年 7 月份陆续上市。

登陆 Wear OS

今年 3 月份，Google 宣布 Android Wear 正式更名为 Wear OS By Google 的消息。在这次 Google I/O 大会前，最新版本的 Wear OS 也已经上线，同时 Google Assistant 的更多功能也已经登陆该系统，包括日程日通、智能推荐、家居控制、100 万个的 Actions 应用等。（具体可阅读本次推送的第二篇文章）

在这场盛大的开发者大会现场上，我们可以看到，Google 正通过各种方式的努力让语音人机交互变得更自然，Google Assistant 也离「Her」越来越近。随着所连接设备种类、数量的增长，服务覆盖到各个垂直细分场景和人群，Google Assistant 正身经百战。■

主笔：莱恩 / 深圳湾

< Google 语音智能生态 >

// 年度盘点 //

2017 Google 十大智能硬件盘点

// 智能音箱//

Google Home mini

Google Home Max

Google Assistant 第三方智能音箱名单

// Google Assistant //

Google at WARE 2018：三年成长轨迹和规划

CES 2018：深度体验无处不在的「Hey Google」