查看原文
其他

Google I/O观后感:AGI时代,Google廉颇未老,尚能食肉

AIGC 飞哥说AI 2023-11-09

撰文 | 高佳  徐顺利‍‍
创意 | 李志飞

今日凌晨,山景城,一年一度的Google I/O开发者大会如期举行。这也许是谷歌历史上最重要的一场发布会,在OpenAI和微软等多重压力之下,谷歌唯有背水一战。
首先,飞哥点评!
纵观这次Google I/O,几点感受:
首先,谷歌廉颇未老,尚能食肉。
无论是大模型本身,还是各种应用(搜索、移动、办公等)落地层出不穷,炫技满满。
客观来说,如果没有前几个月OpenAI、微软以及其他玩家的轮番轰炸,谷歌此次发布AI的密度和强度堪称「炸裂」,但可惜只是“如果”。
虽然谷歌诚意满满,但还是给人一种 me all too 的感觉。当然,除此之外,我也想不出Google能搞出别人没有的石破天惊之物了。
所以,只能是诚意交卷,证明自己还是AI霸主最强候选人。

其次,从发布结果来看,Google的能力让人刮目相看,依然是大模型时代的最强玩家。
如果AI将演化为一个互联网操作系统,那Google是最有实力打造OS的。因为Google具有打造OS需要的最全面的能力,无论是AI算法、云计算、数据库、网络、芯片、应用、生态建设能力。这些能力在AI时代仍然至关重要,只不过它们都得为AI OS重新适配和定位。
由于OS涉及到最底层的革新和优化,是否有最顶级的人才至关重要。Google拥有最全面的人才储备,如果把Google比作一个计算机系,那他可能是十个Stanford+MIT+Berkeley (当然,并非指学术创新和深度,而是领域广度、工程能力和高素质人才的数量)。
这些人才能编代码、能调参数、搞新算法也随手拈来,在通往互联网AI OS都会是至关重要的。与Google相比,OpenAI的人才储备就相当稚嫩和单薄了。

第三,从竞争来说,Google巨龙初醒,各层面优势显赫。
大模型层面,OpenAI此前一骑绝尘的领先基本宣告结束。反观Google,这条睡龙惊醒了,OpenAI有的Google必定有,且实力至少是OpenAI的10倍以上,接下来的军备竞赛将让OpenAI+微软联盟倍受压力。
应用层面,Google各方面依然优势显赫。搜索方面,Bing基本无法撼动Google的搜索霸主地位;移动方面,虽然Android的研发慢如牛毛(别问我怎么知道的,wear os的战略和执行力让人绝望),但是微软根本手中无牌;Office和云方面,Google可以作为搅屎棍打微软(比如免费等常见套路)。
AI生态层面,AI霸主地位或取决于开源。Google现状是趋向封闭,但如果接下来能获得更多市场的正反馈,重拾对AI的超强信心,也许Google会重新思考开源。如果真能大气地搞开源,那将还是AI生态的霸主,否则堪忧。为何?请见 AGI时代,Google必须开源,封闭不是壁垒

第四,历史总是惊人的相似,这次AI竞争也不例外。
Google这次发布,让我再次想起2010年前后,为了应对Facebook的挑战而搞Google+的套路和阵势。
当年的Facebook也是那个气势如虹的屠龙少年,只不过这次换成了OpenAI。
当年,集成和整合Google+ 是各个部门的政治任务,连我所在的Google Translate也硬凑了几个分享的按钮以表决心。公司还搞了个social bonus,整合了Google+ 的才能领到。显然,这次应该和当年一样,Google动员了内部所有产品和研究部门(有朋友跟我说一半的人都在做把大模型整合到自己产品的事情)。
当然,最后的结果是Facebook没有击溃Google,而Google+ 今天也早就烟消云散。移动时代开启后,各自找到自己定位便相安无事了。那么这次OpenAI对Google的挑战也将是历史的押韵,还是会你死我亡呢?
以上纯粹是吃瓜群众不嫌事大的评论,没有事实基础,只为娱乐自己和观众。希望Google和OpenAI,以及所有玩家们都能找到自己定位,和平共存,共同为人类跨入AGI时代做出贡献。


以下纵览本次Google发布会现场👇


本次发布会Google全面重拳人工智能,带来多项AI技术和产品,包括PaLM 2、Bard、Gmail的Help me write等。智能硬件方面,发布了折叠屏手机 Pixel Fold、全新的Pixel 7A 系列手机以及平板电脑Google Pixel Tablet三款产品。此外,还推出AI加持的Android 14和Wear OS两个升级后的操作系统。

基础大语言模型 PaLM 2
谷歌带来了全新的大语言模型 PaLM 2,借助这个大模型,谷歌对旗下25个应用进行了升级。PaLM 2接受了上百种语言文本训练,相比于2022年公布的PaLM模型有着更好的语言能力,语言理解、生成和翻译文本的能力均有显著提高。
PaLM 2数据集拥有大量包含数学表达式的科学论文和网页。因此,它的逻辑、推理和数学能力也有了大幅提升。PaLM 2 预先训练了大量公开可用的源代码数据集,这使得它在Python和JavaScript等流行的编程语言的生成上表现也很出色,还能帮助用户在多种编程环境中编写代码。
作为一个多功能模型,升级之后的PaLM 2比以前的更快、更高效,并且具有多种规格,可以轻松部署在广泛的应用场景中。从最小的Gecko到最大的Unicorn,谷歌将提供四种规格的PaLM 2。Gecko非常轻巧,可以在移动设备上运行,并且足够快,即使在离线状态下也可以进行出色的交互式应用程序。在最新的三星 Galaxy 上,它能够每秒处理 16 个 token。
在PaLM 2的基础上,谷歌已经开始了下一代大模型Gemini研发,旨打造一个具备多模态能力,高效地集成工具和API的全新大模型。

一个更聪明的AI聊天机器人Bard


而此前首秀翻车的Bard也迎来了升级。升级后的Bard取消了排队试用,将面向全球180多个国家和地区全面开放,并在对话中增加了对韩语、日语的支持,日韩地区的用户可以直接用母语与Bard交流,未来将支持包括中文在内的40种语言。
在功能方面,在新Bard中,用户可以通过上传图片来输出文本,也可以对图片的内容进行识别和分析,识别功能由 Google Lens 提供支持。谷歌还打通了Bard与其他自家应用的连接,可以将Bard生成的文本导出到 Gmail 等应用中,并保留相应的格式。谷歌还计划在 Bard中推出扩展程序,帮助用户实现更多功能。

对话搜索,千呼万唤始出来
在New Bing对话搜索上线一个多月之后,谷歌终于推出了自己的对话搜索。新的搜索试图帮助人们更好地分析复杂、或者有些模糊的问题。
“一家带有一个不到3岁孩子和一只狗的家庭来说,去布莱斯峡谷还是拱门国家公园游玩更好?”
对于这个问题,谷歌搜索没有简单地搬运搜出来的答案,而是将孩子和狗这两个因素都考虑进去给出整理后的回答,它会反馈:
布莱斯峡谷有两条狗能进入的环路,对婴儿车也十分友好;拱门国家公园则大部分路段都不允许宠物进入;两个地方都要求宠物拴上皮带等。
每句话都有具体的依据链接供查看,除此之外,它还会显示了来自不同网站网友发布的攻略链接。
你还可以点击“ask for a follow up”,对它的回答以对话方式进一步提问。
用新的谷歌搜索进行购物也非常有趣,当你想要一辆“适合5英里山地通勤的自行车”,它会先告诉你挑选之前需要考虑的重要因素,比如:
一看设计:电动自行车、公路自行车和混合动力自行车等适合通勤;
二看电机和电池,三看减震用的悬架,有山路的通勤需要应对裂纹和颠簸带来的冲击等。
然后再给你推荐合适的车,推荐时还会给出具体产品说明、最新评价、价格和图片等全面信息。
你也可以进行进一步提问,比如只要红色电动自行车,它会根据要求推荐相关产品。
这个功能由谷歌的购物比价产品Shopping Graph提供支持,它可以搜集并不断更新来自全世界的产品列表。目前,这个新功能还只能在谷歌Search Labs中申请试用,且仅限美国地区的用户体验。


AI赋能GMail和Google Maps


作为大会上第一个出场的产品,谷歌更新了 Gmail 的智能写作助手,新的“Help me write”除了可以按照用户需求自动输出符合要求的邮件,还可以根据用户的需求调整邮件内容的语气。
比如,收到了航班取消的邮件,航空公司表示会补偿代金券。这时候你可以让 AI 帮你写一个全额退款的回复邮件,它就会结合航空公司来信内容,撰写全文。
Google Maps通过将街景与导航结合实现了沉浸式视图(Immersive View for Routes )体验,它能够为用户提供目的地的3D 视图,并显示天气、交通状况等信息。用户还可以通过鸟瞰图查看目的地附近的建筑情况。这项功能将会在几个月后更新,首批上线柏林、伦敦、东京、纽约等15座城市。
谷歌Photo也会加入新的功能 Magic Editor 。利用Magic Editor,用户可以在谷歌Photo中对照片的细节进行处理,包括调整服装褶皱、调整光线,改变背景天气等。


Duet AI:Google版CoPilot


谷歌还推出了 AI 工具 Duet AI for Workspace,它将为 WorkSpace 的各个应用提供更多 AI 功能。谷歌将在Gmail、Google Docs 等应用中加入一个名为 Sidekick 的侧边板,它可以帮助用户查看和总结不同应用中的文档问题。
在 google Slides 中,用户能为每张幻灯片生成相应的演讲备注,还可以通过文本生成合适的图片,并选择不同的图片风格。在Google Sheets 中,用户可以利用 AI 自动整理相应的表格,而在 Google Meet 中,AI 能帮助用户创建背景图片。


Project Tailwind:用户培养文档


此外,谷歌还带来 AI 笔记应用“Project Tailwind”,它可以从用户上传的文档中提取信息,帮助整理自己的笔记。用户向 AI 提出问题之后,“Project Tailwind”将会根据用户上传的内容帮助用户提供测试、要点总结等功能,还可以为用户提供新的想法。
“Project Tailwind”现已开放用户测试申请,不过谷歌表示,这款应用仍然处于早期阶段。

智能硬件,AI附体‍‍‍‍


硬件产品一直是谷歌 I/O 大会不可或缺的内容,虽然本次大会AI是重头戏,但谷歌依旧给自家的硬件留足了时间,共发布了三款产品。包括对标三星 Galaxy Z Fold 系列的折叠机 Pixel Fold,配备了充电底座扬声器的平板产品 Pixel Tablet,新增了蓝色和珊瑚红配色的手机 Pixel 7a。


相关阅读:
AGI时代,Google必须开源,封闭不是壁垒
新的Google DeepMind成立,看好,祝Google在AGI时代重振雄风
四面楚歌的 Google 如何应战大模型?
OpenAI 何以掀翻 Google 布局多年的AI大棋?


继续滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存