查看原文
其他

Google I/O全记录:王者归来!AI 产品全线出击,要吃掉整个行业

FP&凌梓郡 Founder Park 2023-05-17

今年的 Google I/O 太夸张了。

模型、产品、功能、平台、硬件,一个接一个 demo,一个接一个 trailer,掌声和欢呼一刻也没有停下,Google 在它所有擅长的领域,都接上了 AI。

如果没有 OpenAI 和微软带来的竞争,我们永远看到不到这样一场,超负荷的 Google I/O 发布会。

在这两个半小时里,山景城的海滨露天剧场,渴望成为世界中心。


这是一个生成式人工智能实验。

音乐家丹·迪肯使用谷歌的 MusicLM、Phenaki 和 Bard Al 制作。

「在制作这个节目的过程中,没有鸭子受到伤害。」

Sundar Pichai 登台,「机会终于来了,」他说,「这是 AI 的好年」。

三碟前菜。

Gmail 发布新功能「帮我写」(Help Me Write),根据邮件内容,用自然语言命令 AI 撰写对应的回复。

比如,航班取消的邮件,航空公司表示会补偿代金券,这时候你可以让 AI 帮你写一个全额退款的回复邮件,它就会结合航空公司来信内容,撰写全文。

Google Maps 将街景与导航结合,发布新功能「沉浸式路线视图」(Immersive View for routes)。

用户可以在导航时,直接提前看到整个路线的动态街景视角。

在这一视图中,用户还能查看路线中的交通、天气情况。

Google Photos 推出「魔法编辑器」(Magic Editor)。

仅仅使用拖拽和一键优化,孩子的位置移动了,天空变得更蓝了。


Bard 卷土重来

外加一个 Search Lab

之前为了应对 new Bing 的挑战,谷歌匆匆上线了对话机器人 Bard。但是从各种用户反馈来看,许多人都觉得作为搜索助手的 Bard 不如 new Bing 好用。

对话与生成将更新搜索体验,已经成为新的共识,但是具体的产品形态依旧在探索的路上。

谷歌也不想用 Bard 这个产品完全定义自己未来的搜索产品形态,因此关于搜索功能的升级,keynote 中分为两个部分来展示:Bard 产品升级,Search Lab 的新功能测试。这些都由这次发布会上升级的大模型 PalM 2 提供支持。

Bard 的基本功能点升级比如支持更多语言,能够识别图像信息,都属于规定动作,并无意外。让人感到惊喜的地方是,Bard 将接通谷歌自己的应用程序,以及一些外部的应用,来实现更强大的功能。

比如,有着惊艳语言生成图像能力的 Adobe firefly,在未来几个月将直接集成到 Bard 中。这样在和 Bard 的对话中,就能够直接设计图片。


谷歌地图、图表能力也能够直接在 Bard 中调用。现场演示给了一个例子,用户通过提问得到了几所符合自己报考目的大学名单,让 Bard 在地图中将这几个学校的地址标出来,再让 Bard 根据学习的专业、排名、地址等相关信息生成对比表格。

关于复杂问题的搜索,则在 Search Lab 的环节中进行演示。

Search Lab 是一个探索性的产品,目前还没有全部开放,需要申请 Waitlist 才能使用。

新的搜索体验试图帮助人们更好地分析一个复杂、或者有些模糊的问题。

在人们开始搜索的时候,往往问题并不明确,而是知道一个大致的方向,又或者是问题能够再被拆分为子问题。

现场演示了对比景点、购买电动自行车两个例子。搜索即是决策过程,AI 生成要点提供了思考的框架,并提供相关链接,用户可以通过对话深挖信息

有 3 岁以下的孩子和狗狗的家庭,Bryce Canyon 和 National Parks 哪个更适合?在这个案例演示中,Generative AI 汇总提炼了两个景点的优劣,并且提供了几篇参考链接,如果用户有需求,可以打开参考链接阅读,而且链接文章也会根据不同的内容重点进行分类。

在另外一个演示案例中,用户需要选购一辆支持通勤 5 英里和山路的 ebike,AI 会提炼设计、电池、减震装置等关键的选购因素。

对话模式下,AI 会记住用户之前的一些选择,对信息做进一步的处理。比如用户想要「红色的 Ebike」,AI 会继续基于「通勤 5 英里、支持山路」等条件继续进行筛选。


PaLM 2 大升级

对标 GPT-4

如今谈 AI 技术,必须先量出大模型,谷歌也不例外。强大的模型是一切产品、服务、功能的基础。

在 I/O 之前,关于谷歌最新模型的消息就陆续传出。此前支持 Bard 的模型是一个轻量级的对话模型 LamDA,Pichai 在三月份采访中就表示,将把背后的模型升级为更大规模的 PaLM 模型。

I/O 2023 上,最新最强的 PaLM 2 终于露出了庐山真面目。PaLM 2 是 PaLM 的升级版。PaLM 2 在数学、编码、推理、多语言翻译和自然语言生成上的表现都更加出色。

Pichai 现场展示了一个修改 Bug 后,用韩语对代码进行解释的例子.

PaLM 2 使用谷歌自主研发的 TPU 进行计算,具体使用了多少算力计算 PaLM 2 目前尚未公布,但可以参考训练 PaLM 的数据,使用了 6144 块 TPU。

使用谷歌最新的 TPU 架构来训练模型,意味着在基础工程上,谷歌进行了整合计算、优化缩放、改善数据集组合和模型架构等各项工作,这些也能够使得模型能力灵活被调用进各种产品、服务中。谷歌能够将模型的能力按照需求进行蒸馏和提炼。

为了让模型的能力更灵活地服务于产品,Pichai 特地强调,PalM 2 有四种不同的尺寸,分别以动物的名称命名:壁虎、水獭、野牛和独角兽。其中壁虎(Gecko)最轻量级的版本。

最轻的模型可以在移动设备上运行交互应用程序,而在最新的三星 Galaxy 上,它能够每秒处理 16 个 token

此外,pathway 架构的设置,也利于在特定领域对模型进行微调。健康研究团队在此基础上进一步发展,创建了 Med-PaLM 2,它可以检索医学知识、回答问题、生成有用的模板,解码医学行话。

在上一代 AI 视觉技术中,AI 已经被训练能够看懂 X 光片等图像,现在结合语言生成能力,模型能够根据提供的 X 光片,写出病例分析。


别人都叫 Copilot

Google 叫 Duet AI

不出意外,有了新模型,对内,能升级的产品升级;对外,向企业提供服务,帮助他们更好地用上模型能力。

Google Workspace 是谷歌推出的多人协作软件,现在无论是写作文案、故事写作、制作幻灯片、制作表格,都可以用上 AI 了。

形式类似于微软的 Copilot,在工作的主界面右侧有一个边栏,谷歌将其称为「帮手」(sidekick)。AI 会在这里提出文章的修改意见、建议生成配图、表格的样式,用户选择合适的结果,就可以将 AI 生成的内容移入主界面。

阅读室、豌豆荚创始人,同时也是谷歌前员工的王俊煜对此吐槽:「Google Workplace 沿用了 Microsoft 的 copilot 思路(真巧),但他们又不好意思叫 Copilot,于是起了个新名字叫 Duet。难为市场部了。」

想听他更多的吐槽,今晚 20 时来 Founder Park 直播间,看他们怎么聊 Google I/O。


投资合作做平台

还要做超算

谷歌面向企业的 AI 平台叫做 Vertex AI,企业用户可以在这个平台上调用需要的模型、按照需求对模型的参数权重进行微调、根据内部数据建立企业版本的搜索引擎。

除了语言模型,谷歌还提供了其它三个专业能力模型供选用:图像生成模型、代码生成模型、以及文本转语音模型 Chirp。

在现场展示的合作伙伴中,Replit、Character AI、Canvas 等明星公司都在其中,当然还有谷歌自己投资的 Antropic,也在使用谷歌提供的模型云服务。

现场还公布了一个基础设施层面的消息,谷歌和英伟达合作,搭建了基于 H100 的下一代 A3 图形处理器超级计算机。

基于 H100 的 A3 虚拟机,网络带宽比上一代 A2 虚拟机多 10 倍。

当然,PaLM 的 API 也将在不久开放。

可以说,在对外输出模型能力上,谷歌确实拿出了实力雄厚的大厂做派,从开发工具平台、到基础模型、到基础设施、开放 API,一整个做了全套。

大模型的竞争壁垒不在技术领先,而是围绕技术能否实现开发者生态、产品是否会被用户真正接纳。从这次发布来看,谷歌把能圈的地盘都圈好了,接下来是不是能真的形成壁垒和优势,所有人将拭目以待。


三款新硬件

Android 14 未登场

聊完 AI,这次 I/O 大会上 Google 也发布了一系列的硬件,除了常规的 Pixel 手机外,早已被预告的平板和折叠机也都跟大家见面了。

Google 自己的折叠机终于来了——Pixel Fold

今年 5 月 4 日星战日,Google 的一段视频泄露了这款机器的存在,这次也在 I/O 上正式发布。

一些配置参数:

  • 5.8 英寸外屏,内屏展开后的尺寸为 7.6 英寸,
  • 两个屏幕都是具有 120Hz 刷新率的 OLED 面板,
  • 配备 Google Tensor G2 处理器,
  • 12G+256G/512G,
  • 重量约 283g,IPX8 防水等级
  • 不支持手写输入
  • 支持 Qi 无线充电,
  • 左右两侧分列了两块不同尺寸的电池,共同组成了支持 30W 有线充电速率的 4800mAh 电池

对标三星的 Galaxy Z Fold 系列,目前有黑白两种配色,官方价格 1799 美元,已同步上架,预定送 Pixel Watch,6 月开始配送,默认不包含充电器。

为了实现折叠的形态,谷歌重新设计了长焦镜头模组、电池组件等等,使其保持相对的轻薄,官方号称是最薄的折叠屏手机。

双屏除了我们常见的桌面模式和悬停模式之外,谷歌考虑的「内外屏」同时显示功能是『实时翻译』,内外屏显示两种翻译的语言(感觉并不是什么有用的功能,语音翻译不是更实用?)。此外,Pixel Fold 基于 Android 13 系统,自然也拥有 Google AI 的所有功能特性,官方宣布将于今年晚些时候更新到 Android 14 系统。

Pixel 平板「又」来了

在 Nexus7、Nexus 9、Nexus 10、Nexus 11、Pixel C 之后,Google 又发新平板了,在 2022 I/O 上预告的 Android 平板这次终于发布。

具体参数如下:

  • Google Tenser 2 处理器

  • 11 英寸、16:10、2560 x 1600 像素的 LCD 显示屏

  • 三种颜色:白色、深绿色和浅粉色

  • 8G+128G/256G

  • 四个扬声器、三个降噪麦克风、

  • USB Type-C 接口

谷歌为 Pixel Tablet 设计了一款可以充电的底座扬声器,平板连接底座后,它会进入到「中控模式」,主页面会显示电子相框,还能作为智能家居的中控台,基于全新设计的 Google Home App,支持超过八万个智能设备。

配备 Android 13 系统,并将于今年晚些时候更新至 Android 14,官方宣布超过 50 个谷歌应用适配平板,内置 Chromecast,手机上的音乐和视频可以直接投到平板上进行播放。

499 美元起售,官方配件中没有键盘或者手写笔,支持第三方手写笔。扬声器底座直接附送,不需要额外购买。今日可预定,6 月 20 日开始发货。

Pixel 新手机——Pixel 7a

Pixel 7a 在过去几个月已经被曝光得差不多了,有人甚至在 3 月份就拿到了实机。本次新增了蓝色和珊瑚红配色,而性能参数上,Google Tensor G2 处理器、90Hz 高刷新率屏幕、6400 万像素主摄同时支持无线充电,相比过往的 a 系列手机增加了无线充电和 90Hz 高刷屏。不过代价是,价格比 Pixel 6a 涨了 50 美元。

至于会在下半年发布的 Pixel 8 和 Pixel 8 Pro,本次 I/O 大会上未透露任何消息。

没有 Android 14,只有 Android AI

本以为会在本次大会上介绍的 Android 14 并没有登场,Google 重点介绍了现有 Android 系统与 AI 的一些结合和新特性。

Magic Compose:消息自动回复

Android Message 推出新功能——Magic Compose,可让用户使用「基于消息内容」的自动建议回复来回复文本,测试版将于今天夏天推出,国内能不能使用尚不确定。

AI 生成壁纸

作为 Pixel 设备即将发布的独家功能,用户可以使用 emoji 或者一段简短的 prompt 生成专属的手机壁纸,还有一种新风格的「电影壁纸」,「使用设备上的机器学习能力将喜欢的照片转换成令人惊叹的 3D 图像」。


虽然,看起来都不是让人能 WOW 的功能。

One More Thing:Wear OS 4

在去年 9 月份发布 Wear OS 3 之后,这次大会上谷歌发布了 Wear OS 4,并计划将云备份引入平台,以及进一步增加电池待机时间,Wear OS 将同时支持 Gmail 和 Google 日历,WhatsApp 也将在未来几周登陆 Wear OS 平台。

开发人员预览版本今日发布,但要到今年晚些时候才能向消费者提供,目前还不清楚哪些硬件能够运行或升级到 Wear OS 4。

才一年时间,但是感觉好像已经过去了一个时代。ChatGPT 横空出世改变了 Google 产业 AI 半壁江山的地位。

这也许是 Google 历史上最重要的一场 I/O。

5 月 11 日(今晚) 8 点,来 Founder Park 直播间,与猎豹移动董事长兼 CEO、猎户星空董事长傅盛,阅览室创始人、前豌豆荚创始人王俊煜,OPPO 小布助手首席架构师万玉龙,极客公园创始人&总裁张鹏一起,聊聊 Google I/O 的一切。



关注 Founder Park,我们将持续推出更全面更深度的大模型相关讨论与报道。

Founder Park 正在搭建大模型相关话题的交流社群,群内聚集着致力于在大模型相关领域创业的创业者、产品经理、研发工程师、对大模型技术和场景应用开发进展感兴趣的学者及投资人。

在这里,你肯定可以获得大模型相关领域的最新动态资讯、或许可以进行高质量的行业对话交流,还可能连接更多有价值的行业认知。

如果你关注大模型领域,欢迎扫码加入我们的大模型交流群,来一起探讨大模型时代的共识和认知,跟上大模型时代的这股浪潮。




更多阅读
AI 教父 Hinton & MIT 万字访谈: 人类可能只是 AI 演化过程中的一个过渡阶段
OpenAI发布炸裂研究:让AI解释AI黑箱,人类无法理解,语言无法描述
马斯克聊年轻人教育、社区管理和人生幸福,巴菲特强烈推荐观看
OpenAI 和 Google 会输给谁?
美国人真的开始害怕AI了

转载原创文章请添加微信:geekparker

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存