查看原文
其他

一文看懂谷歌I/O大会及其AI全家桶

GenAI Gen AI Hub 2023-05-15

本次I/O大会(开发者大会)主题:Making AI helpful for everyone

大模型

Palm2

一个多功能的人工智能模型,擅长处理各种类型的数据,包括 Python 和 JavaScript 代码,甚至可以处理 Prolog、Fortran 和 Verilog 等编程语言。

  • 练集

  • 在 100 多种语言中“接受了更多的多语言文本训练”,导致理解、生成和翻译细微差别的文本(如成语、诗歌和谜语)的能力“显著提高”。

  • 数据集包括科学论文和带有数学表达式的网页,进一步提高逻辑、常识推理和数学能力。

  • 在“大量”公共源代码数据集上进行了预训练。除了 Python 和 JavaScript,这还包括在 Prolog、Fortran 和 Verilog 中生成专用代码。


  • 模型尺寸

  • 壁虎(Gecko):每秒可以处理20个令牌,小刀可以在手机上运行

  • 水獭(Otter)

  • 野牛(Bison)

  • 独角兽(Unicorn)

  • 垂直模型
  • Sec-PaLM:针对安全支持
  • Med-PaLM 2:针对医疗知识

  • 论文地址

  • https://9to5google.com/2023/05/10/google-palm-2/

Gemini

多模态大模型,在工具和API集成方面非常高效,双子座仍在训练中,但它已经展示了以前的模型从未见过的多模态功能。

产品矩阵

Bard

  • 产品形态

  • 对话机器人

  • 新增功能

  • 接入网络,能够引用网站数据,生成问答

  • 支持将Bard的回答导出到Gmail和Google Docs

  • 可以用图像来给Bard做prompt,根据图像给出回答

  • 引入Google Lens的功能,支持问答中使用图像

  • 很快将支持第三方应用程序集成,对标chatgpt plugin

  • 产品地址

  • https://bard.google.com/


Duet AI

  • 产品形态

  • Workspace 办公套件,对标微软Copilot

  • 应用场景

  • 包括Gmail:自动识别邮件主题,并给出不同的撰写方案

  • 谷歌Docs(文档):点击“help me write”,帮忙自动生成完整文本

  • Sheets(表格):自然语言自动生成表格

  • Slides(幻灯片):能直接基于幻灯片中的文本生成图片

  • 产品地址

  • https://workspace.google.com(需要注册workspace,加入后补名单)


搜索引擎

  • 产品形态

  • 由Palm2驱动的全新搜索引擎,对标New Bing

  • 产品亮点:

  • 基于自然语言搜索并直接给出对话式的答案摘要

  • 答案摘要依据相关的搜索链接生成,并给出相关的链接

  • 可根据上下文持续进行搜索问答来探索主题的更多信息

  • AI搜索界面植入的广告会在专有广告位中展示,不会混进搜索结果


Magic Editor

  • 产品形态

  • 智能修图应用

  • 产品亮点

  • 改变照片的光线

  • 替换人所处的环境背景

  • 修复照片中被遮挡物品的残缺部分


MusicLM

  • 产品形态

  • 文本转化为音乐的工具

  • 产品亮点

  • 输入提示,一键生成多个版本的歌曲

  • 可以指定“电子”或“古典”等乐器,以及想要的“氛围、情绪或情感”


Vertex AI

  • 产品形态

  • 帮助用户搭建生成式应用程序的AI工具平台

  • 产品亮点

  • 依托谷歌云,涵盖模型训练、微调、托管等全方位的AI服务

  • 提供聊天、文本和图像三种模态的基础模型,用户可进行微调

  • 支持私有化部署,用户的数据安全可以得到保证

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存