查看原文
其他

下一代语音助理的进化方向,颠覆的不止是音箱和手机

shenzhenware 深圳湾 2023-11-28

响应速度、理解和服务能力、交互体验优化,提升不止这些


- shenzhenware -


语音,是移动互联网之后最重要的交互入口。而语音助理,则是这一入口背后计算能力、服务能力的人格化体现。


在过去,语音助理总是承诺提供超出它们能够提供的服务,以至于那些搭载它们的智能设备,看起来总有些「智障」,比如响应速度慢、听不懂、给出莫名其妙的对话回复、不能提供想要的服务,等等。这些问题,新一代 Google Assistant 试图给出解决方案。


在 5 月 8 日举行的 Google I/O 2019 大会上,Google 提出了「Next Generation Assistant」的概念,并展示了 Google Assistant 在响应速度、跨 APP 处理多个任务、以及在对话理解和反馈上的能力。



Google Assistant 所展示的自然、流畅的对话能力,有多厉害,国内的用户可能感受不深。毕竟,语音助理是与其背后的内容和服务深度绑定的,Google 的服务生态都不在国内。并且,Google Assistant 不支持中文,国内的用户有一大把中文语音助理可以选择。同时,新版 Assistant 要到今年下半年才能登陆 Pixel 手机,而最新发布的 Nest Hub Max 也要到今年晚些时候才能面世。


然而,能够支撑 Google Assistant 成为下一代语音助手的信心,来自于其背后 Google 在语音领域「我有你没有」的优势,我们将其总结为以下几个方面:


1、语音搜索和对话式 AI 能力:随着用户使用语音查询的次数与日俱增,Google 通过 AI 可以理解用户搜索的内容,并确定用户的意图,从而提升用户搜索和任务请求的准确性。


2、安卓智能手机操作系统:让 Google Assistant 成为系统层的应用,并快速抢占语音数据最大的入口。


3、内容和服务生态:邮件、搜索、地图、YouTube 视频,这些都可以与语音助理进行深度绑定,从而相应更多的用户请求。



尽管 Google 意图是在兜售自家的语音助理——目前,Google Assistant 的装机量已经累计超过了 10 亿台,但 Google 展现的这些能力,也给我们指明了方向。


以下我们整理了一些能直观体现「下一代语音助理」的功能演示,并逐个进行了介绍和解读,借此与大家一起感受一下语音助理的进化方向。


1秒级响应

请求-响应完全本地处理



在舞台演示中,Google 展示了使用下一代语音助理操控手机应用的能力。演示人员分别向 Pixel 手机连续做了以下语音请求:打开日历、打开计算器、打开相册、插入倒计时 5 分钟的任务、询问今天的天气、连续询问明天的、打开某人的 twitter 信息、打开/关闭闪光灯、打开自拍模式。


全程值得点评的是:


1、一共 10 句语音请求,只用了一次唤醒词「Hey Google」。


2、Google Assistant 的响应时间大大缩短,几乎是秒级响应。


Google Assistant 的响应迅速,被很多媒体毫不吝啬的歌颂——Crazy Fast,其原因则是 Google 通过深度学习把以往 100G 的语音识别模型压缩到了 500MB,这意味着它将能装载进手机中,能够完全不借助云端在本地处理语音识别,这也呼应了 Google 强调的隐私与安全。


2零延迟操作

跨 APP 处理多个任务体验流畅


Google Assistant 可以实现在多个任务之间切换,交互过程中语音助手持续保持监听,无需重复唤醒,即可轻松地从一个任务切换到另一个任务。



视频中演示了用户回复短消息、查找图片、AI 协助筛选图片、插图和发送图片等一系列动作。


近年来,手机语音助理的发展之快超出预期,目前已经成为各大手机厂商的标配。抛开上闹钟、打电话等基本功能性的需求外,通过语音助手调用 APP,并实现跨 APP 之前的多任务处理,更大的意义在于:


人机交互,不再以 APP 为中心,而是以用户使用场景为中心。


如果你早上起来,呼唤语音助手,帮你打开窗帘、播放音乐、播报当日新闻、查看当天日历;用户在发信息的时候,需要调用图片库,挑选图片,期间电话进入,接听电话......这一系列的操作,将会被捆绑成为一个个功能集,赋予到特定的用户使用场景。


3全语音操作

语音转文字,同时穿插语音指令


Google 还展示了一个实用功能:写邮件,语音转文字,调用收件人,填充邮件题目,发送邮件。整个过程是全语音操作的无缝体验,只需要一句「Hey Google」做唤醒,并且 Google Assistant 可以读取和调用通讯录信息。



4记住你是谁

个性化推荐


Google 还展示了一个名为「Picks for you」的个性化推荐的能力。不同的人向 Google Assistant 请求,会获得不同的推荐结果。


这一功能将在今年夏天上线 Google 新发布的智能屏 Nest Hub Max 上,届时可以实现,通过摄像头识别不同的用户,然后再提供用户符合他喜好的内容,如菜谱、广播、活动。



同时,个性化推荐也代表着,Google Assistant 可以清晰的理解用户的请求,如用户发出导航去「Mom's House」的请求时,Google 可以根据用户身份和使用场景,分析出「Mom's House」指代是妈妈家、还是一家餐厅的名字、或者其他,并给出相应的推荐结果。



Google Assistant 可以响应个性化的请求,并给出个性化的回复。如「给我看我儿子的照片」「带过去预定的餐厅」「提醒我在结婚纪念日买巧克力」这些无需明确说明是谁的语句。


要实现这一功能,还需要在设置里的「You」一项,填写个人相关信息即可。



基于过去在对话 AI 和知识图谱的积累,Google Assistant 能够更快、更准确的理解用户的意图和需求,以及所说的特定词语代表着什么,提供精准的个性化推荐。


这或许将带来新的个性化推荐革命,在文字之外的语音界面。


5不用动手

AI 自动完成订单填写



去年 Google I/O 首次亮相的 Duplex AI 能够模仿人声给自动给餐厅打电话订餐。在惊艳过后,现在已经能够接听来电骚扰,并且在美国的 43 个州为个人用户提供预定餐厅的服务。


时隔一年,Duplex AI 再次迎来更新:在手机 web 端,直接帮助用户完成一系列的筛选、匹配、预定的操作。只要你告知 Google 你的需求,如网上租车、买电影票、或餐厅定位,并说出预定哪个商家的某个服务,剩下的就交给 Assistant 自动帮你填充个人信息和完成预定操作。


能够自动实现这一操作的基础,是 Google 可以读取你的个人信息、日历、邮件、甚至信用卡。此外 Google 还能对你的喜好进行收集和分析,从而给出接近你需求的搜索结果,并协助你完成预定。


Duplex AI 并不是一个简单的 chatbot,理论上讲,它能够在任何人机交互界面上,扮演助理的角色。


6驾驶模式

一句话进入驾驶模式


在车载场景,我们已经可以看到 Google 的新版 Android Auto 带着 Google Assistant 在大约 50 多个汽车品牌 500 种型号上推出。而场景化的「驾驶模式」,则是新一代 Google Assistant 在驾驶场景的探索。


用户无需拥有 Android Auto,而只要有一部 Pixel 手机,就可以通过「Hey Google, let’s drive」的语音指令,让 Google Assistant 打开「信息仪表盘」,切换到驾驶模式。



在这个「精心设计的仪表盘」界面,我们可以看到,所有的功能和信息都是以信息流的方式展现的,而非我们通常看到的、更适合触屏交互的 APP 界面(下方菜单栏一般都有多个页面入口供用户切换)。


在这个信息流里,一些驾驶中常用的功能被突出显示。如果你有餐厅预订或电影票,Google Assistant 的驾驶模式将显示导航到该目的地的快捷方式。



结合个性化推荐功能,Google Assistant 可以实现来电告知联系人信息、询问是否接听、恢复上回暂停的音频内容、根据日历上的餐厅预定信息自行导航到目的地,等一系列的操作。


7 小结

离真正的「助手」更近了


快——这是 Google Assistant 给我们最大的感受。


然而,这次 Google Assistant 展示的每一个功能,其实并不新鲜,甚至很多都是几年前国产手机就已经「实现」的功能。


但正如我们开篇所述,语音助手并不缺各种「智能能力」的畅想,相反,语音助手沦为「人工智障」都是因为这些畅想——在很长一段时间里,语音助理总是承诺提供超出它们能够提供的服务,一次一次地消耗我们的期待和耐心。


在这场没有黑科技的 Google I/O 上,我们更多的看到的是,Google 正试图把前面几年语音助手吹下的「牛皮」,一一落地。


在与 Google AI、Google 的服务生态进行高度融合后,Google 带给了我们一个「流畅」的语音助手——10 倍提升的响应速度、横跨多个 APP 的任务执行、跑在用户前头的预备操作……Google Assistant 盘活了 Google 背后的技术能力和服务生态,为用户带来一种流畅、高效率的人机交互体验



在今年早些时候的 MWC 上,Google 曾宣布一项新计划:部分合作伙伴的新手机将配备 Google Assistant 的实体专用实体按键,让它真正成为手机里的一部分。这个「部分合作伙伴的新手机」,是一个上亿级的设备量。


凭借 Android 的原生优势,Google Assistant 正以一种爆发式的迅速覆盖到用户。作为回报,Google Assistant,正在努力成为一个颠覆现有 Android 手机操作体验的工具。


△ Pixel 3a | 图片来源:Julian Chokkattu/Digital Trends


今年已经是 Google 落实「AI First」的第三个年头,Google CEO Sundar Pichai 说:Google 将从一家「帮你找到答案」的企业,变成一家「帮你完成任务」的企业。Google Assistant 也将帮你「get things done」。


这离真正的「助手」,更近了。


微信号:shenzhenware

主笔:陳壹零 / 深圳湾

编辑:欧大树 / 深圳湾


Google I/O 2019



/////////////


7 月,深圳湾将迎来旗下「WARE 2019」今年的第二场峰会。我们将邀请行业大咖和产业链资深人士,为大家分享最新最热门的 AI 前沿技术与产业应用。


主题演讲嘉宾邀请中!

最佳解决方案征集中!

参会参展企业招募中!


合作请添加客服微信「warexx」或给我们留言。



快到「湾」里来

深圳湾正在招聘:

真知灼见的科技记者

四通八达的运营编辑

才华横溢的市场策划

技能爆表的活动运营

热情四射的社区达人


简历传送门:

Lynn@shenzhenware.com



●  


深圳湾(公众号 ID:shenzhenware)连接全球硬件创新者,连接硬件生态链上下游,连接跨界产品的设计、技术、生产、渠道、商业、创新。深圳湾持续关注「AI+硬件」带来的场景和交互创新,以及与平台和应用相连的全产业链升级,欢迎相关团队与我们联系,微信私人客服:小炫(ID:warexx)


继续滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存