查看原文
其他

Imagen 3 - Google最高质量的文本生成图像模型

renee创业狗 Renee 创业随笔
2024-10-09

Imagen 3是Google最高质量的文本生成图像模型。今年 Google I/O 的时候发布的。

新的更新

更大的多样性和提示理解

Google设计了Imagen 3,使其能够在广泛的格式和风格中生成高质量的图像,从逼真的风景到丰富质感的油画或奇幻的粘土动画场景。Imagen 3也能够理解以自然、日常语言编写的提示,使得用户无需复杂的提示设计就能获得所需的输出。

为了帮助Imagen 3捕捉长而复杂的提示中的具体相机角度或构图等细微差别,Google在其训练数据的每张图像说明中添加了更丰富的细节。有了更好的信息来源,Imagen 3能够更准确地生成各种主题和风格的图像。

Prompt: Shot in the style of DSLR camera with the polarizing filter. A photo of two hot air balloons floating over the unique rock formations in Cappadocia, Turkey. The colors and patterns on these balloons contrast beautifully against the earthy tones of the landscape below. This shot captures the sense of adventure that comes with enjoying such an experience.

更高质量的图像

Imagen 3生成的图像视觉丰富,质量高,具有良好的光照和构图。它能够准确呈现细节,如人物手上的细小皱纹,以及复杂的纹理,如针织玩具大象的质地。

Prompt: A large, colorful bouquet of flowers in an old blue glass vase on the table. In front is one beautiful peony flower surrounded by various other blossoms like roses, lilies, daisies, orchids, fruits, berries, green leaves. The background is dark gray. Oil painting in the style of the Dutch Golden Age.

更好的文本渲染

Google还显著改进了其文本渲染能力,为个性化生日卡片、演示文稿等用例开辟了新的可能性。

Prompt: Elephant amigurumi walking in savanna, a professional photograph, blurry background

使用最新的安全和责任创新构建和部署

Imagen 3是由Google的最新安全和责任创新构建的,从数据和模型开发到生产。Google使用了广泛的过滤和数据标注来最小化数据集中的有害内容,并降低了有害输出的可能性。Google还进行了红队测试和评估,涵盖公平性、偏见和内容安全等主题。大家还记得黑皮肤的马斯克不。

Google使用最新的隐私、安全和保护技术部署了Imagen 3,包括创新的水印工具SynthID——它将数字水印直接嵌入图像像素中,使其可以被检测到但肉眼无法察觉。

在接下来的几个月里,Google将把Imagen 2中受欢迎的编辑功能(如修补和扩展)引入Imagen 3。Google还将扩大Imagen 3在各个产品中的应用,如Gemini应用和网页体验、Workspace、Ads等。

继续滑动看下一个
Renee 创业随笔
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存