查看原文
其他

汪星人不能输!Google I/O 大会发布“AI全家桶”,10大亮点总结!

鲸哥 AI鲸选社
2024-11-25

图片来源:Google I/O

作者:鲸哥

如果不是OpenAI的前一天的刻意阻击,Google或许才是2024年科技春晚的主角,如今却活成了AI界的汪峰。

但汪星人不能输!在 2024 年的 Google I/O 大会上,Google 展示了许多令人兴奋的创新和更新,涵盖了视频生成、音乐生成、AI搜索等多个关键领域。尽管很多领域并没有足够惊艳,但是对于用户来说,很多产品都比较贴近日常使用。

以AI生成图片应用Imagen 3来说,他没有Midjourney专业,也没有Chat.GPT Dall 理解文本能力更强,但却比Midjourney写提示词更容易,比Dall生成的图片好看。

Google AI很多时候顺手就能用,更多场景都是如此,百度目前看也是这条路发展AI。以下是Google I/O 10大亮点总结:

1. Google Srarch大更新,竞价排名和广告和广告“没了”

传统搜索是展示多个含有关键词的网页,用户自己负责从一堆网页中找结果。竞价高的排名靠前,广告内容靠前。

Google搜索现在内置了一个Agents来执行复杂的搜索——从研究到计划再到头脑风暴——谷歌会根据问题逻辑来查找最终的结果,而且结果是根据你的习惯和喜好,通过卡片形式显示,这点来说很有用。

2. Astra,被GPT4o截胡的最大亮点

Astra可以通过接收信息、记住它所看到的、处理这些信息和理解上下文细节来与周围的世界互动。这个产品本是Google I/O 大会最大的亮点,意味着google的大模型也具有听说、看懂的能力,现在被GPT4o截胡。

3.Veo,一个对标Sora的 AI 视频生成器

在Google的Project Astra中,包含很多最新的多模态 AI 项目。Veo是其中的视频生成产品,生成的视频时长超过1分钟。文本ta视频生成器,允许电影制作人编写提示来构建电影镜头。

4. 文生图Imagen 3,更容易上手
Project Astra中,效果更好的文本到图像生成模型。它产生的视觉效果具有Imagen 3能生成更多细节、光影丰富,且干扰伪影更少的图像,更关键的是,它的提示词可以用人工书写的方式描绘,这样大大降低了学习Prompt的工程量。

5.  MusicFX 生成音乐,哼曲成歌

MusicFX 让您释放内心的 DJ 并制作新的节拍,通过组合流派、乐器等来帮助您混合节拍,使音乐故事栩栩如生。这是一个激发新音乐灵感的游乐场,你现在可以尝试一下。

6. Gemini 1.5 Pro ,Google大模型底座
google将上下文窗口增加到 200 万个token。这相当于 15 本书,150 万字。据皮查伊介绍,目前有超过 150 万开发人员使用 Gemini 模型,用户数量已经达到 20 亿,如今皮查伊再提「Gemini 时代」,目标是将其集成到所有产品中。

7. Gemini 1.5 Flash,更轻型的大模型 

一种更轻量级的模型,针对低延迟和成本最重要的任务进行了优化。开发人员可以在 Google AI Studio 和 Vertex AI 中将其与多达 100 万个token一起使用。

8. Trillium,第六代TPU芯片

谷歌称其为“迄今为止性能最强、能效最高的 TPU”,Trillium与上一代 TPU v5e 相比,每个芯片的计算性能提高了 4.7 倍。

9. 表格中使用 Gemini 分析
通过数据问答分析各项支出。据google介绍,在云端硬盘中整理附件、生成工作表和分析数据的功能,将于今年晚些时候在实验室推出。

10. Gemini 将集成到 Gmail 中
文档和日历已经很好地协同工作。这将使跨应用工作变得更加容易,例如,在 Gmail 中识别收据并在云端硬盘和表格中整理收据。

进入星球领取字节AI产品、AI音乐内测码

开源公司穷哭CEO,闭源11人赚2亿美金,这家AI公司舍命转向了


张楠带着AI化的剪映,踏入了一条超10亿元的赛道


继续滑动看下一个
AI鲸选社
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存