其他

深入挖掘:2017年谷歌设备阵容的AI创新

2017-12-13 AI前线

今年,Google 咬了“苹果”一口

作者|Paul Thurrott
译者|马卓奇
编辑|Emily
AI 前线导读: 我之前曾提出 AI 是谷歌在硬件上取胜的关键,现在让我们更具体地分析一下这个观点。

或许你还记得,谷歌在 2017 年秋季新品发布会上带来了一系列全新的设备阵容,包括智能手机、Chromebooks、智能音箱,和其他设备。许多人批评新产品只是对市场竞争的回应,或者认为它们平淡无奇。然而这种观点是错误的。实际上,这位搜索巨头对这些设备共同的、基于人工智能的优势进行了十分坦率的介绍。我觉得这种区别才是关键:谷歌将利用 AI 赢得个人计算的下一个浪潮。

更多干货内容请关注微信公众号“AI 前线”,(ID:ai-front)

我知道这是一个很不寻常的断言。我们需要观望谷歌的各种产品和服务在市场上的表现,然后才能知道这一观点的真实性。但在此期间,我们可以仔细看看谷歌是如何将 AI 应用到每一个新发布的设备上的。我认为这有助于理解谷歌致力于在云计算中使用核心力量来帮助客户实现目标的决心,并且扩大自身和苹果,以及其他旧日的竞争对手之间的差距。

这其中包含着巨大的信息量。

“我们正在从根本上重新思考计算机应该如何工作,”谷歌首席执行官桑达尔·皮查伊在开场时说:“在人工智能先行的世界里,计算机将适应人们的生活方式,而不是人去适应电脑。”

(当然,谷歌也正在使用人工智能和机器学习来推进其核心网络服务和移动应用程序。谷歌的许多进展将通过 Android 进入第三方解决方案。然而在这里,我主要关注公司刚刚发布的“谷歌制造”的设备。)

“AI 先行”允许人们以自然无缝的方式与计算机和其他设备使用对话、手势和视觉进行交互。AI 先行也是一种环境,在过去的一年里你可能听到我使用这个词很多次。这意味着你可以在任何地方,而不仅仅是在某个设备上使用它。它也是与语境相关的,所以它可以通过理解你、你的位置,和你的环境来给你当前所需要的信息。并且它可以随着时间的推移自适应、学习并改进自己。

下面将介绍谷歌如何在新发布的产品中应用这些技术,谷歌将其描述为“完全有帮助”。

Google Home 智能家居设备、Google Assistant 个人助理

2017、Google Home 设备阵容扩大了过去原有的设备,包括一个小巧可爱的 Google Home Mini 以及更大的 Google Home Max,极大提高了音质。这两个新产品的目的是填补产品线,并分别创造了价格新低和最卓越的音频性能。它们的设计元素是时尚而且温暖的。

因此,单就新的家居设备来说,除了 Max 的智能调音功能,可以根据自己在房间中的位置对声音进行优化,甚至是根据你正在听的内容,除此之外,没有什么独特的人工智能功能。(苹果的产品 Homepod 也是这样做的。)但是考虑到本产品系列的性质,这里还是融合了许多人工智能方面的技术。

事实上,谷歌一直在大力推出的 Google Assistant 个人助理和 Google Home 智能语音设备,也许是这个公司如何利用它的人工智能专业知识来改善真实世界产品的最明显的例子。而在 Google Home 刚刚上市的第一年,其智能技术也在以几乎令人费解的速度不断提高:它现在可以回答 1 亿多个问题。

与这个设备或个人助理的交互通常都是很自然的:你只需要正常地说话,很多情况下是与人进行交谈。并且现在你可以在更多的地方这样做:谷歌在过去的一年中致力于把 Google Assistant 和 Google Home 带给更多的国家,使其有更多的语言环境。

“现在,将个人助理带给全世界的人并不是一项容易的任务,”谷歌的 Rishi Chandra 在介绍公司在该领域的长期工作时说:“我们必须确保我们能理解不同年龄段、性别和口音的人。因此,我们训练个人助理的数据规模只有谷歌可以达到,我们用了来自数百个不同的环境中的超过 5000 万的语音样本。”

Google Assistant 现在拥有市场上最好的语音识别功能。在这一领域的产品中,它是独一无二的,因为它能识别个人的声音。所以当我问 Google Home 我的时间表时,它给我的是我的时间表,而不会是我妻子的。而当我妻子向 Google Home 寻问她的提醒事项时,她得到的是她自己的,不是我的。这个功能也适用于语音免费通话——另一个 Google Home 首次推出的功能:当你要让它给“Paul”打电话时,它会打给你的电话簿中保存的“Paul”。

Chandra 说:“一个个人助理只有在知道你是谁的情况下才能真正发挥作用。”谷歌是唯一一个能够提供这种非常重要的功能的个人助理。这与其他产品有着天壤之别。

而 Google Assistant 和它所驱动的设备并不是静止不动的:随着时间的推移,它们也会不断改进。前不久刚刚实现的两个关键变化是日程挂钩:可以通过一项指令让助手执行多项行动,或者说任务。

所以 Google Assistant 现在支持更多的日程,包括晚上回家、睡觉和更多的活动。

在 Chandra 提供的一个示例中,你可以创建一个名为“早安”的行动,可以打开灯,启动咖啡机,并且激活你所选扬声器的每日简报。Google Home 也有一个“查找我的手机”的功能,如果你找不到手机,它会给你的智能手机打电话。只要说,“Google,找到我的电话。”(是的,它可以与语音识别功能配合工作,确保它会给你手机打电话,而不是你妻子的。)

Google Assistant 还改进了对智能家居设备的支持:目前它支持来自 100 多家不同公司的超过 1000 种不同的产品。它还可以更智能地与这些设备进行交互,让你使用更简单、更自然的语言命令,比如“暖和点儿”(而不是将一个特定的恒温器设置为特定的温度)。谷歌也在活动中讨论了旗下 Nest 品牌的智能家居产品,详情见下文。

Google Home 也集成了一个新的功能叫做广播,你可以给家里的每台 Google Home 设备发送语音信息。例如,“谷歌,广播一下现在该去学校了。”为了进一步增强其对家庭的适用性,谷歌为 13 岁以下的孩子与 Google Home 建立联系账户。它改进了助手的语音识别功能,增加了儿童的数据,使它也能理解孩子们。

Chandra 先生解释说:“我们将向 Google Assistant 中加入 50 多种新的经验,帮助孩子们学习新东西。探索新的兴趣,故事时间畅想,与家人分享欢笑。”他随后分享了一些他自己家庭的例子:“谷歌,玩抢椅子游戏”,“谷歌,给我表演一段 beat-box”,“谷歌,让我们玩空间填词游戏”“谷歌,给我讲一个故事”,等等。

是的,总会有人抱怨,谷歌的技术越过了有用和可怕之间的界线,但这就是重点。这是一个苹果因为太胆小而不敢涉足的领域,而且也没有足够的技术知识来实现它。它是谷歌的实际技术不断取得成功的贡献者之一。

但在这项技术的特殊情况下,人们可以想象大家会如何评价谷歌培养我们的孩子或其他任何荒谬的事情。然而,正如 Chandra 所指出的,这些经历让孩子们不再依赖于屏幕上的单独体验,而是让他们在一个群体中与他人与父母互动。它比直接给孩子一个 iPhone 更健康。

谷歌正与迪士尼合作,将他们的许多娱乐故事,如米老鼠和星战,带到 Google Home 中。更广泛地说,它开放了 Google Assistant 的行动平台,让任何第三方都可以把自己的家庭和孩子的经验加入平台中。

Nest

Google 收购的 Nest 公司无疑在 Google Assistant 业务整合中增强了其竞争力。Nest 最近发布了六款新的硬件产品,每一个都结合了机器学习和现代的、精细的硬件设计。

Nest 的 Yoky Matsuoka 提供了一些示例。

例如,将 Nest Cam 与 Google Home 和 Chromecast 一起使用,你就可以只用声音来监视家里的安全。像“Google,给我看下入口”这样的一句命令会被 Google Home 接收,然后 Nest Cam 的视频将通过 Chromecast 传输到你的电视上。(你也可以用“Google,保存这个片段”或类似的指令来保存 Nest Cam 的片段。)

Nest Hello 视频门铃,同样使用 Google 的面部识别技术来识别门口的人物身份。所以当门铃响时,它会通过任意 Google Home 设备进行广播,并告诉你来者是谁(如果能识别出来其身份):“Suzie 阿姨来访。”

最后,通过上面提到的 Google Assistant 的日程改进,现在也可以加入对 Nest 产品的操作。所以,当你创建一个像“晚安”这样的程序时,除了关掉灯,设置温控器,设定闹钟,提醒你第二天的第一个预约,它还可以打开家庭安全系统,打开家庭监控摄像机,以及其他的事情,令人印象十分深刻。

Pixelbook 笔记本

谷歌最新的 Chromebook 笔记本电脑,Pixelbook,是“四合一”,或者说在 Windows 系统下我们称它是一个可以转换的电脑。而且它在很多层面上都很有意思。但从 AI 的角度来讲,Pixelbook 相比于所有的笔记本来说向前跨了一大步:它是第一个内置 Google Assistant 的 Chromebook。它甚至第一次为 Chrome 操作系统键盘添加了一个专用的 Assistant 键。这样,你可以通过打字而不仅仅是说话来访问你的个人助手,在笔记本电脑的生产力状况下,这样可能更容易为人接受。

这些都是显而易见的。但 Pixelbook 还通过可选的 Pixelbook Pen 提供了独特的与个人助手的交互方式。

“按住笔的按钮,然后圈出屏幕上的图像或文字,个人助手就会产生反应。”谷歌的 Matt Vokoun 解释道。“当你浏览一个博客,发现一个新的音乐家,你可以圈出他们的照片,你的个人助手会给你更多关于他们的信息。从那里,你可以访问他们的 Instagram 主页,他们的 YouTube 频道,听他们的歌曲,以及做更多的事情。”

就像很少使用的微软助手 Cortana 在 Windows10 集成在 Microsoft Edge 浏览器中,谷歌的个人助理也可以用来做调查:圈出一个词,可以获得其定义和其他信息。

Pixel、Pixel XL 智能手机

谷歌最新推出的智能手机本周备受关注。但最大的新闻当然是搜索巨头会如何使用人工智能来区别自己与苹果、三星和其他公司的产品。

“硬件组件的竞争一直处于平稳状态,”谷歌的 Rick Osterloh 解释说。“智能手机都有非常类似的配置规格:百万像素的摄像头、处理器速度、调制解调器吞吐量、电池寿命、显示质量。这些核心特征现在已经是“上桌的筹码”。摩尔定律和丹纳德法则已经是过去的想法。对于公司来说,每年都要开发出令人兴奋的新产品将越来越困难,因为这不再是单纯靠硬件实现巨大飞跃的时代了。这也是为什么我们在谷歌采取了一种非常不同的方法。”

他随后复述了公司的准则:“下一个重大创新将发生在人工智能、软件和硬件的交叉点上。”因此,虽然智能手机可以在配置规格上达到平等,但谷歌的设备将永远拥有优势,因为它可以在一定规模上向用户交付基于 AI 的独特进展。

第一代 Pixel 手机是第一款包含谷歌个人助手的智能手机。但他们也彻底改变了用户端到端的照片体验,这得益于一个高级的(事实上,是市场上最好的)摄像机,它具有自动 HDR 和视频平滑、基于云的免费存储空间,可以存储该手机拍摄的全尺寸照片,以及简单而优雅的照片应用程序、即时搜索服务,以及还在不断增长的功能列表。

对于 Pixel2,谷歌已经做了它所做的一切,使之成为一个有竞争力的设备。然而这篇文章中,我关心的只是基于人工智能的创新。当然,Google Assistant 还有一些项目,如广播,以及以前提到的新的日程和操作,都有明显的进步。

首先是与 Google Assistant 相关的:对于 Pixel2,你拿着它的时候可以挤压它,就可以更容易地(也是更自然地)召唤助手。没有必要说“OK,谷歌”。

新的 Pixel 智能手机集成了一个类似 Shazam 的应用,叫做“现在播放”,可以从一直打开的屏幕上看到:只要看一眼屏幕,你会看到艺术家的名字和当前播放的歌曲。有趣的是,这个应用使用的是设备上的机器学习,而不是云服务,这是一种有趣的类似苹果的做事方式。如果你点击显示的歌曲名,谷歌助手就会启动,让你可以了解更多,把歌曲添加到你喜欢的音乐服务的播放列表中,或者在 YouTube 上观看视频。

谷歌也将一目了然的功能集成到 Pixel 2 的主屏幕,从日历数据开始。通勤和交通信息、飞行状态等等也即将到来。

但与新 Pixel2 相关的最令人吃惊的 AI 方面进步是一个名为谷歌镜头(Google Lens)的应用程序。它将在今秋以预览形式发布在 Pixel 上,将来可以被其他的 Android 设备使用。

“谷歌镜头可以对你所看到的内容进行更多的操作,”谷歌的 Aparna Chennapragada 在进行设备演示时说。

在基本层面上,谷歌镜头就像其他应用程序一样,试着通过智能手机的摄像头来了解现实世界场景。(例如,你可以使用谷歌翻译(Google Translate)来查看菜单,比如说日语,然后在增强现实的视图中看到一个现场翻译。)当然,谷歌镜头更进一步。

在演示中,Chennapragada 展示了谷歌镜头能读传单的电话号码和电子邮件地址。但是它也可以用来给那个号码打电话,或者发邮件给读取到的电子邮件地址。它也适用于映射到物理地址。

在另一个演示中,谷歌镜头被用来识别墙上挂着的艺术品出自哪位艺术家。“现在你可以用镜头了,”Chennapragada 说。然后,谷歌镜头识别并理解出了一部电影、一本书、一张专辑,以及最令人难忘的,从 5 年前的一次旅行的个人照片中看到的一个日本寺庙。

“有很多发生在内部的东西,现在都结合到了一起”,Chennapragada 说。

由于在深度学习和视觉系统方面的重大突破,谷歌镜头可以与谷歌搜索存储的数以百万计的词条协同工作,来了解你在看什么。谷歌的知识图,有几十亿的关于人、地方和事物的事实,但仍需要更多的信息。这类事情正是只有谷歌才能有效地做到的。虽然在视觉识别方面还处于初级阶段,但谷歌在一般搜索和语音识别方面已经建立了良好的基础。

谷歌也使用人工智能来帮助改进 Pixel2 相机,就像帮助改进上一代设备一样。这一代,公司增加一个了肖像模式功能,只需要一个单一的镜头——大多数智能手机需要两个——就能主体从背景中分离出来,创建一个漂亮的背景虚化效果。谷歌的 Mario Queiroz 说,公司使用了一百万多张照片来训练机器学习算法,使这种功能成为可能。而且,与其他智能手机不同,肖像模式在两个镜头上都适用。

其他: Pixel Buds 无线耳机, Clips 小型摄像机

虽然谷歌在过去几年许多产品的发布都由于信息泄露被毁了,但其中两个却没有。两者都是用于 Pixel 或其他基于 Android 的智能手机配件的设备。

第一个是一对新的无线耳机,称为 Google Pixel Buds。当然,它和其他许多无线耳机工作原理一样,但它有两个巧妙之处。

“当你把 Pixel Buds 耳机和 Pixel 2 手机配对时,你可以即时访问谷歌助手,”谷歌的 Juston Payne 说。这实现了用语音控制的各种功能,如播放音乐,发送文本,或获得步行的方向。“手机放在口袋里时这些都可以进行,”他补充道。“它还可以提醒你新的通知,并阅读你的消息。”

然后他扔下一枚重磅炸弹。毫无疑问,这是谷歌发布会当天让人印象最深刻的一件事。

他说:“谷歌 Pixel Buds 耳机甚至可以让你获得一种新的实时语言翻译体验,这是一个绝妙的谷歌翻译的应用,由机器学习驱动。就像你身边有位私人翻译。”

这个功能的现场演示令人难以置信:Payne 对着一个戴着 Pixel Buds 耳机的瑞典人讲英语。耳机把他的话翻译成瑞典语,这样她就能听懂了,然后她用瑞典语回答。她的 Pixel 2 智能手机对把她的话翻译成英语,传达给 Payne。就像《银河系漫游指南》里的“Babel fish”(“Babel fish”是《银河系漫游指南》中虚构的一种动物。如果把这种鱼放进一个人的耳朵里,这个人就能听懂天上地下所有语言。),而那可是科幻小说,而现在,一个真实自然的对话就可以发生。真是太神奇了!

Pixel Buds 提供 40 种不同语言的实时语言翻译功能。

最后,谷歌还展示了一款名为 Google Clips 的新相机配件。它基本上是一个迷你的 GoPro(一款运动相机)型装置,你可以放置在一个房间或空地上,或夹在孩子或宠物身上,为你自动记录下自然场景。现在,你可以成为故事的一部分,而不仅仅是一个旁观者或给别人讲述家庭故事的人。

Google Clips 看起来很有意思。但是大新闻是它对 AI 的使用。

Payne 解释说:“Google Clips 以摄像头核心的 AI 引擎入手。”当你在摄像机后面时,你会寻找你所关心的人。你寻找微笑。你寻找狗狗开始追逐自己尾巴的那一刻。Clips 可以为你做这一切。打开它,它抓住了瞬间...... 而且随着时间的推移,它会变得更聪明。”

从隐私的角度来看,所有的机器学习都发生在设备本身(再次如苹果所做的那样)。在你决定共享之前,没有东西会离开你的设备。

让我印象深刻的是,谷歌能够将这种表面上如此强大的机器学习能力集成到这样一个小型设备中。Payne 把它描述成一台“超级计算机”。

但简而言之,那就是谷歌:在一个满是普通电脑的房间里的超级计算机。

虽然我确信苹果、亚马逊、微软以及其他一些公司能够与谷歌所做的某些部分水平相当,但我不清楚他们中的任何一方是否都能做到以上所有。事实上,我确定他们不能。这就是为什么这一切都如此令人印象深刻:不是任何一个单独的发布,而是它整体的重量和所涉及的范围。

查看英文原文:

https://www.thurrott.com/mobile/141037/deep-dive-ai-innovations-across-googles-2017-devices-lineup

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存