查看原文
其他

挑战GPT-4!谷歌官宣大模型PaLM 2,AI全家桶应用升级!

头号AI玩家 头号AI玩家 2023-07-10


作者丨卷毛 卡子
编辑丨卷毛 卡子
图源:谷歌


谷歌在生成式AI领域发起了全方位反击。
 
5月11日凌晨,在一年一度的谷歌I/O开发者大会上,谷歌发布了全新的大语言模型PaLM 2、搭载PaLM 2的Bard、AI应用Duet AI以及一系列产品升级,涵盖搜索、办公、云服务、安卓系统等场景。
 
 
面对OpenAI和微软的步步紧逼,谷歌不再像以往那样采取谨慎策略,而是大胆拥抱新趋势,让生成式AI技术全面渗透至“谷歌全家桶”,“重新塑造包括搜索在内的所有核心产品”。
 
这意味着,数十亿用户的生活、工作会因此改变。

大模型PaLM 2首次亮相,可在移动端使用

 
在本次大会上,谷歌宣布正式推出全新一代的大语言模型PaLM 2,对标GPT-4。
 
据介绍,PaLM 2提供四种size的模型,以动物大小来形容的话,从最小到最大分别为:壁虎、水獭、野牛和独角兽。
 
 
其中壁虎版本非常轻巧,它可以在移动设备上工作,即使在离线时也能运行,并且速度足够快,每秒可处理20个token。
 
谷歌并未透露其参数规模,但相比前一代,PaLM 2体积虽小,在多语言、推理和编码功能上却有了大幅提升。
 
多语言性:PaLM 2在多语言文本方面接受了更多的训练,涵盖100多种语言。这显着提高了它在多种语言中理解、生成和翻译细微差别文本(包括成语、诗歌和谜语)的能力。PaLM 2还通过了“精通”级别的高级语言能力考试。

推理能力:PaLM 2的广泛数据集包括科学论文和包含数学表达式的网页。因此,它在逻辑、常识推理和数学方面有所改进。

编码能力:PaLM 2在大量公开可用的源代码数据集上进行了预训练。这意味着它擅长Python和JavaScript等流行的编程语言,但也可以生成Prolog、Fortran和Verilog等语言的专用代码。
 
除此之外,PaLM 2还支持多模态理解,可以在医疗专业领域发挥作用。谷歌展示了Med-PaLM 2,一个专注医疗领域的微调模型,能看懂和分析X光照片,据说是第一个在美国医疗执照考试类问题上表现出“专家”水平的大语言模型。
 
 
目前,PaLM 2已经开放预览。本次大会提到的大多数产品也是在PaLM 2基础上实现更新的。
 
另外,谷歌CEO桑德尔·皮查伊还剧透了谷歌下一代大模型Gemini的信息,他称Gemini旨在实现多模态、高效和为未来创新而构建。
 

Bard开放使用,与Adobe合作生成图片

 
 
谷歌旗下AI聊天产品Bard,首先借助PaLM 2大模型进行了升级。
 
在编码功能方面,现在的Bard支持20多种编程语言,可以生成、解释和调试代码,并轻松导出至Google Colab。
 
输入“此代码无效,请修复”,Bard就能进行调试
 
值得注意的是,Bard升级后支持多模态对话,在回答中会附带图片;

提问“新奥尔良有哪些必看景点”
同时Bard也能读懂图片,比如上传两只狗的照片要求它写一个有趣的标题,Bard会结合Google Lens的能力,一步步分析照片、检测狗的品种并起草一些创意说明。
 
Bard还能接入来自整个网络的各种服务,比如Adobe创意生成AI工具Firefly、音乐流媒体网站Spotify、视频网站Youtube等等。
 
这意味着虽然Bard本身暂时不能直接生成图片,但可以与外部工具合作生成。据现场演示,向Bard输入指令“在儿童派对上制作独角兽和蛋糕的图像”,Adobe Firefly的创意图片生成功能就会联动反应,在几秒钟内生成对应图像。

目前Bard已取消候补名单,向180多个国家和地区开放使用,但暂时仅提供英语、日语和韩语版本,未来将支持40种语言,包括中文。
 
 

搜索、办公、地图等产品全面融入AI

 

SGE:全新的谷歌搜索引擎

 
谷歌的王牌产品搜索引擎在生成式AI技术加持下,推出了全新的SGE(Search Generative Experience)。
 
对于品牌广告商来说,借助SGE,搜索广告将继续出现在整个页面的专用广告位中,仍有机会接触到潜在客户。
 
比如当用户使用谷歌SGE搜索一款自行车时,AI会给出多款产品描述、评论、价格和展示图。
 
 

Duet AI:谷歌版的微软Copilot协同办公


对标微软的Copilot协同办公服务,谷歌推出了新品牌Duet AI,涵盖一系列适用于谷歌生产力应用程序的生成式AI工具。
 
Duet AI+Gmail邮箱:支持移动端,在手机上,只需几句话作为提示,就可以起草完整的邮件回复。
 
 
Duet AI+Docs文档:只需输入想撰写的主题,Docs就会立即生成草稿,其中包括提供位置和状态等信息。

Duet AI+PPT演示文稿:可以直接在谷歌幻灯片中从文本创建原始图像。
 
Duet AI+表格:帮助分析和处理表格中的数据。 
 
不过,要访问这些新工具,用户需要注 Workspace Labs并加入候补名单。谷歌表示,该产品会在“在未来几周内将服务扩展到更多的用户和国家”。
 

Google maps:沉浸式路线地图

 
谷歌地图结合AI功能推出全新的沉浸式路线视图,使用Aerial View API和3D Tiles构建身临其境的体验,用户将以新的交互方式查看空气质量、天气和交通情况。谷歌称该功能将在今年夏天推出,并在年底前向15个城市推出。
 
 

Google photos:Magic Editor魔法编辑

 
Google photos宣布将上线全新图片编辑功能Magic Editor,通过AI技术感知图片内的内容,检测并移动物体,同时还可以用生成的视觉效果补全空白。
 
 
——


除了以上主要的AI更新之外,谷歌还宣布了专为安卓系统开发的AI编码机器人Studio Bot,AI学习工具Project Tailwind,面向企业的AI平台VertexAI。在基础设施方面,谷歌还宣布将和英伟达合作,搭建基于H100的下一代A3图形处理器超级计算机,以及基于它的虚拟机,并且PaLM模型的API也将在不久开放。


可以预见,谷歌此番更新将影响数十亿用户,人工智能正在愈加渗透进我们的日常生活。正如谷歌在大会上多次提到的关键词“大胆而负责任(bold and responsible)”,我们在大胆拥抱AI的同时,如何承担起社会责任也是需要各方深思和共同探索的。


参考链接:

[1]:https://cloud.google.com/blog/products/maps-platform/google-io-preview-introducing-new-3d-imagery-map-customization-and-routing-products/

[2]:https://workspace.google.com/blog/product-announcements/duet-ai?utm_source=twitter&utm_medium=unpaidsoc&utm_campaign=FY23-Q2-googleworkspace_workspaceblog_Product-Education&utm_content=-&utm_term=-

[3]:https://blog.google/technology/ai/google-bard-updates-io-2023/

[4]:https://www.theverge.com/2023/5/10/23718301/google-ai-workspace-features-duet-docs-gmail-io

[5]:https://www.thesun.co.uk/tech/22317762/google-new-ai-button-gmail-artificial-intelligence/utm_medium=Social&utm_campaign=suntechtwitter&utm_source=Twitter





本文由「头号AI玩家」(ID:AIGCplayer)原创发布,而非AI生成。欢迎留言与我们交流,如需转载请留言。
后台发送关键词“头号AI玩家”进AIGC交流群,与我们一起玩耍,共同学习、探索、见证AI的进化。
 也欢迎你分享、点赞、在看
 一起研究AI 

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存