查看原文
其他

Google I/O 2019:AI 往实用性的道路前行,少了黑科技依旧精彩

shenzhenware 深圳湾 2023-11-28

AI 让世界充满爱


- shenzhenware -


北京时间 5 月 8 日凌晨 1 点,Google I/O 大会在美国山景城海岸线圆形剧场(The Shoreline Amphitheatre)举行。


今年已经是 Google 落实「AI  First」的第三个年头,在这个标志性大会上,Google CEO Sundar Pichai 例行登台开场,他表示,一直以来,Google 的目标是组织来自全世界的信息,帮助全球用户都能轻松的访问。



而接下来,Google 将从一家「帮你找到答案」的企业,变成一家「帮你完成任务」的企业,为大家创建一个对每个人都更能有帮助的 Google。



整场  I/O 大会下来,没有「黑科技」多少让人有些失望。不过,整场大会的格调也十分契合 Sundar Pichai  开场白,AI 在 Assistant、Android Q、AR、硬件等 Google 的重要业务上,都起到了润滑的作用,并向着「实用性」的道路靠拢。

1AI

视觉、语音


AI  作为例行的重头戏,贯穿在 I/O 的始终。


搜索:视觉搜索引入 AR 功能


首先在 Google 的立身之本——搜索方面,在 AI 的帮助下也迎来重要更新:视觉搜索引入 AR 功能,将搜索到的结果以 AR  的形式直接展示在现实当中。


在会场上,Google  就将搜索到的大鲨鱼「投射」到现实场景。



Google 该项功能已与 NASA,New Balance,Target,Visible Body,Volvo,Wayfair 等达成合作,在搜索或者实物扫描中支持建立 AR 模型。


例如,在 Google 搜索中查看来自 Visible Body 的解剖学 3D 模型,可提供学习参考。



Google Lens:机器视觉技术新进展


以上以及 Google Lens  其实都体现了 Google 在机器视觉技术方面的进展。此次 Google Lens  有了如下的更新:


更强的菜单识别:扫描一家餐馆的菜单,Google Lens 能自动用符号凸显其中最受欢迎的菜肴,用户点击后还会显示其他用户对这道菜的评价以及评分,帮点单选择困难户做出选择。



实时拍照翻译。相当于把 Google 翻译应用上拍照功能搬到相机上,将镜头置于车票或者菜单上,翻译结果将自动覆盖之上。


将数字化信息与物理世界中的事物联系起来。例如,在 Google 合作的 Bon Appetit 上,用相机指向杂志的菜谱,手机便会演示这道菜的制作过程。又或者应用在博物馆当中,相机指向画作便能显示相应的历史故事。


文字识别转语音朗读。例如,在对准报纸、宣传页,手机可支持逐句标注,并且以你熟悉的母语朗读上面的内容。


Google 计划让该功能已支持英语、日语、中文等数十种语言,同时,它的代码容量仅 100KB 左右,因此使用门槛很低,低至 35 美元的终端设备也能使用。



以上 Google Lens 更新的功能都能在最新的 Android Q 中应用。


Google Assistant:引领下一代语音助理


作为 Google 的语音助手,Google Assistant  不管是在安卓智能手机,还是在智能音箱以及其赋能的第三方硬件中扮演着重要角色。目前,Google Assistant 的装机量已经累计超过了 10 亿台,与全球合作的智能设备覆盖了 3500 多个品牌的 30000 个种类,在 80 个国家/地区提供 30 多种语言。


在此次大会上,Google 表示,他们打造出了「next-generation Assistant」,而经过内部的努力,Google Assistant  在响应速度、处理多个任务等方面的能力取得了重大进展。



基于 Google 的神经网络和机器学习算法,Google Assistant  的 100GB 语音识别模型在运行中所占据的字节不到 0.5 GB,使得在理解语音和提供结果的速度比前代的速度快了 10 倍,并且可在手机本地运行。Google Assistant 的未来愿景是实现无网络化(本地处理)、零延时。



新一代 Google Assistant 具备连续快速处理多个任务的能力。在现场演示环节,Google 发言人连续利用手机上的 Google Assistant 执行浏览照片、设置计时器、打开手电筒、预定网约车等多可任务,期间表现非常流畅、一点也不卡顿,并且不需要用「hey Google」唤醒助手。


还有就是,以后 Google Home 闹钟到点叫床的时候,你只要喊一句「Stop」就能制止闹铃。



另外一项演示中,发言人通过语音命令的方式用 Google Assistant 完成一封邮件的撰写和发送,又快又准,并且 AI 在根据语音转写邮件的过程中能自觉预测下一个词句。



「Picks for you」个性化推荐的能力。基于过去对话知识图谱,Google Assistant 能够更快、更准确的理解用户的意图和需求,以及所说的特定词语代表着什么,提供精准的个性化推荐。今年晚些,该功能将会在食谱、博客、活动等应用得到体现。



场景化的「驾驶模式」,这是新一代 Google Assistant 在驾驶场景的探索。通过「Hey Google, let’s drive」的语音指令后,Google Assistant 带来全新的信息仪表盘和个性化功能,包括来电告知联系人信息、询问是否接听,恢复上回暂停的博客、根据日历上的餐厅预定信息,自行导航到目的地等。



Duplex AI:搬上 web 端


去年首次亮相的 Duplex AI 在惊艳过后,现已经能够接听来电骚扰,并且在美国的 43 个州为个人用户提供预定餐厅的服务。


时隔一年,Duplex AI  再迎来更新:把打电话业务能力转移到网页 web 端。比如网上租车、买电影票,只要你告知需要预定哪个商家的某个服务,剩下的交给 Assistant 来自动帮你到网页上自动填充个人信息即可。



Project Euphonia:让 AI 理解每个人


目前,大量语音识别技术的训练只针对语音表达正常的人,而对许多特殊群体,比如失语者(渐冻症 ALS)的理解是欠缺的。Google 此次发起了 Project Euphonia 的新项目,想在这方面做一些努力。



Project Euphonia 的项目旨在获得这类特殊人群的机器学习模型,训练出更具包容性的语音理解模型。Google 希望让所有语音互动设备都能理解和服务每一个人。 


△ 部分项目参与者(语言障碍患者)提供的语料训练模型


2Android Q


Android Q 在本次大会如期而至。


在会上,Google 宣布,目前搭载 Android 系统的活跃设备数量超过了 25 亿台,并强调了 Android 的三大核心主题——创新、安全与隐私、数字健康。


如此前爆料,Android Q 正式提供黑暗模式(Dark Mode),更省电。



隐私方面,Android Q  新增 50 个隐私和安全设定,用户可设置应用在使用期间是否能够访问位置等信息,以及允许访问的时间段。同时,系统也会主动通知用户哪些应用正在后台收集资料等。



另外,为了隐私考虑,Google 将 Chrome 过去一直使用的隐身模式 Incognito mode 应用到了 Google Maps 和 YouTube 上。



伴随新一代操作系统,Google 在去年演示的 Google Maps  实景+AR 导航的功能终于上线。



基于 On-Device 机器学习,Google 推出了 Live Caption 功能,该功能够在视频中根据音频转化为文字实时显示在屏幕上。有了这一功能,尤其对于听障用户来说,观看视频变得方便多了,而且重点是它还能够离线使用。Google 官方还表示,即使关掉视频声音,文字照转不误。



另外,Google 还推出了 Live Relay 的功能,该功能支持离线情况下将对方语音实时转成文字,帮助听障用户打电话。



新增专注模式(Focus Mode)。去年,Android P 首次加入了防沉迷系统,这次的专注模式则避免了前者「一刀切」的情况,为用户提供更智能、灵活的屏蔽管理。在你认真工作的时候,你可以选择屏幕一些容易让你分心的 APP。



迎合折叠手机和 5G 的未来趋势,Google 还展示了 Android 的折叠交互体验。


最后,Google 公布了  Android Q 的首批合作厂商,国内的华为、小米、一加、OV 均在名单页上。



3硬件

带摄像头的智能音箱

低价的手机

在会上,此前爆料的两款硬件 Home 智能音箱、Pixel 3a 系列中端手机正式发布。


Nest Hub Max:广角镜头、人脸手势识别、立体声


此次新推出的带屏智能音箱名称为 Nest Hub Max,顾名思义,Google 将 Nest  搬上了音箱,弥补去年 Home  Hub 没有摄像头的遗憾,并且增大了屏幕尺寸。Google 表示,让房屋成为一个「helpful home」是他们打造这一新产品的主要推动力。



Nest Hub Max 的外观完整的继承了上一代产品,相当于一个大号的  Home  Hub,拥有更大的显示屏(10 英寸)、更好的音质(立体声)、配备广角摄像头,能实现视频通话、安全监控、拍照、菜谱、家居控制等其他同类产品相同的功能,已经具备对标亚马逊 Echo Show 以及 Facebook  Portal 的完整能力。


为了体现 Nest Hub Max 这款产品的独特性,Google 的演讲重点也同样放在了其 AI 能力上:


  • Face Match 功能识别人脸能进行身份认证

  • 127° 广角镜头支持跟踪用户,使得视频通话中用户保持在画面正中间

  • 手势识别暂停音乐、视频播放。



对此,Google  再次强调,Face Match 人脸识别功能并不依赖云端,而是在本地运行,以消除大家对隐私保护方面的顾虑。 


Nest Hub Max  售价 229 美元,预计今年夏季率先在美国上市。(产品详细介绍可查看本次推文二篇)



Pixel  3a 系列:低价的好相机


传闻中的 Google Pixel 系列的中端机型 Pixel  3a 也在本次大会上亮相,售价 399 美元起,相当于去年 Pixel 3/ 3 XL 价格的一半。官方表示,Google 拥有那么多强大的 AI 技术,也更希望能让更多人以更低的价格享受到这些 AI 带来的便利。



Pixel  3a/ 3a XL 完整延续了 Pixel 3 系列的设计风格,提供黑、白、紫三种颜色,保留了 3.5mm 耳机插孔、Active Edge。另外,Pixel 3 依托 AI 的夜拍增强功能、人像模式景深调整均在这部机上得到了保留。



Pixel 3a/3a XL 分别配备容量为 3000 mAh 和 3700 mA 的电池。得益于的 Google 的机器学习,Pixel  3a/ 3a XL 的续航得到了有效的管理,充电 1 小时续航长达 30 小时,15 分钟快充能获得 7 小时的使用时长。


其他配置、功能方面:


  • 芯片:高通骁龙 670

  • 系统:Android Q

  • 屏幕:Pixel 3a 配备 5.6 英寸 OLED 屏,2,220 x 1,080 分辨率,441 ppi;Pixel 3a XL 配备 6 英寸 OLED 屏,2,160 x 1,080分辨率,401 ppi

  • 摄像:前置 800 万像素,后置 1220 像素摄像头;支持 Top Shot,Motion Auto Focus,Super Res Zoom,Night Sight 和 Photobooth 模式 

  • 运存、存储:4GB、64GB,不支持外部扩展。

  • 价格:399 美元/479 美元


过去 Pixel 3 只在 Verizon上独家销售,这次的 Pixel 3a 系列则进一步拓展了 T-Mobile,Sprint 和 US Cellular 等运营商的销售渠道。目前,Pixel 3a  支持在美国等 13 个国家和地区销售。



4小结


或许是因为事前的一堆爆料,又或许是新奇成分真的太少,今年 I/O 上的软件(Android Q)、硬件(手机、音箱)的戏份都显得不那么的精彩。


但好在,每一轮的介绍环节过后,都有 AI  将全场观众引入到兴奋、高潮的氛围当中。


让人感慨的是,在这次 I/O 当中,Google 所呈现的 AI 完全褪去了「炫技」的影子,并且真正落到实处,尽可能的造福人类,给生活带来便利。


微信号:shenzhenware

主笔、编辑:大林 / 深圳湾



快到「湾」里来

深圳湾正在招聘:

真知灼见的科技记者

四通八达的运营编辑

才华横溢的市场策划

技能爆表的活动运营

热情四射的社区达人


简历传送门:

Lynn@shenzhenware.com



●  


深圳湾(公众号 ID:shenzhenware)连接全球硬件创新者,连接硬件生态链上下游,连接跨界产品的设计、技术、生产、渠道、商业、创新。深圳湾持续关注「AI+硬件」带来的场景和交互创新,以及与平台和应用相连的全产业链升级,欢迎相关团队与我们联系,微信私人客服:小炫(ID:warexx)


继续滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存