查看原文
其他

新世界 AI 三皇 | Disco Diffusion, Dall-E2, Midjourney 全面战力对比!!

海辛 全民熊猫计划 2022-05-20

Hi, 我是海辛,是一名因为疫情原因已经被关在家里两个月了的导演。


其实这两个月,我本来应该在公司做数字人或者用 UE5 做虚拟制片项目,但自封闭日起,我只能每天对着一台上网本不知所措。年幼的我当时还不知道,AI 给我安排的路即将来临,而不知不觉间我竟然已经更新了这么多技术博fu文yin。


我现在是 AI 的使徒,我的名字是,圣海辛。




Disco Diffusion, Midjourney, Dall-E2 是时下最火的人工智能画画模型,给出任意一段描述性文字,AI 就会根据这段文字画出一幅作品。今天我准备测试一下他们到底谁更厉害。(*❦ω❦)

游戏规则是这样的:针对同一段文本描述测试 Disco Diffusion, Dall-E2, Midjourney 对文本的解读和表现能力。其中:

  • Dall-E2 的测试素材来源于 Dall-E2 的 reddit 话题 [1]
  • Disco Diffusion 和 Midjourney 则是根据 Dall-E2 素材的 Text prompt 进行生成的,均为默认设置,除了 text prompt 以外未进行任何参数调整。

(这样的规则多少有点偏向 Dall-E2. 因为通常只有比较好的生成结果,用户才会拿到论坛分享。不过既然我没排到 Dall-E2 的内测名额,就只有先到 Dall-E2 的主场啦。)

 9 轮测试的分类和题目如下:
  1. 图标:猫咪约会应用的图标设计
  2. 游戏:像素游戏的飞船资产设计
  3. 模仿艺术家手稿:达芬奇关于现代飞机的手稿
  4. 写实照片(想象类):独角兽的 X 光片
  5. 写实照片(风景照):斯凯岛上苏格兰湖的风景
  6. 角色设计:阿米达拉女王被蓝色光剑照亮的肖像
  7. 场景设计:一对情侣走在巨大蘑菇下
  8. 抽象画:一幅唤起紧张感的画
  9. 怪力乱神一把不像椅子的椅子

    1.  图标

  • 题目:猫咪约会的应用程序图标
  • Prompt: Dating for cats, app icon

 Disco Diffusion ↓

↓ Midjourney ↓

↓ Dall-E2 ↓
(震撼 Dall-E2 竟然还会讲冷笑话)

  1. 游戏素材

  • 题目:用于游戏的 24 pixel 的飞船资产
  • Prompt: Spaceships, 24 pixel art game assets

    ↓ Disco Diffusion ↓

↓ Midjourney ↓

↓ Dall-E2 ↓

  1. 模仿艺术家的手稿

  • 题目:达芬奇关于 F-35 的手稿
  • Prompt: lenardo da Vinci early sketches of the F-35

↓ Disco Diffusion ↓

↓ Midjourney ↓

↓ Dall-E2 ↓

  1. 写实照片(想象类)

  • 题目:独角兽的 X 光片

  • Prompt: an x-ray of a unicorn


↓ Disco Diffusion ↓

↓ Midjourney ↓

↓ Dall-E2 ↓

  1. 写实照片(风景照)

  • 题目:斯凯岛上苏格兰湖的风景
  • Prompt: A scenic view of a Scottish loch in the Isle of Skye

↓ Disco Diffusion ↓

↓ Midjourney ↓

↓ Dall-E2 ↓

  1. 角色设计

  • 题目:一幅 Padme Amidala 的渲染肖像,她的脸被蓝色的光剑照亮,卢卡斯电影质感,橙色和蓝色对比,在 artstation 上流行,幻想艺术。
  • Prompt: A beautiful render of Padme Amidala portrait with her face illuminated by a blue lightsaber, lucas films, orange and blue contrast, trending artstation, fantasy art

    ↓ Disco Diffusion ↓

↓ Midjourney ↓

↓ Dall-E2 ↓

  1. 场景设计

  • 题目:一对情侣在巨大的蘑菇下散步的超现实景观画,数字艺术

  • Prompt: surrealist landscape painting of lovers walking near a giant mushroom, digital art

↓ Disco Diffusion ↓

↓ Midjourney ↓

↓ Dall-E2 ↓

8. 抽象画

  • 文本描述:一幅唤起紧张感的抽象画
  • Prompt: An abstract painting evoking anxiety

    ↓ Disco Diffusion ↓

↓ Midjourney ↓

↓ Dall-E2 ↓

   9. 怪力乱神类

  • 题目:一把不像椅子的椅子
  • Prompt: A Chair that does not look like a chair.

↓ Disco Diffusion ↓

↓ Midjourney ↓

↓ Dall-E2 ↓

总结

目前这份小试牛刀的测试比较,可以帮助我们能得出怎样的结论呢?🤔

感觉 Disco Diffusion 就像一个三岁小孩,擅长于无意识作画,时不时激发天赋画出精彩的不需要逻辑的画作,但稍不留神就变出一团车祸。你让它随便玩玩的时候,就在泥巴坑里给你塑造出精彩作品,但稍微想指望一下,就会发现,指望不上。(也可以通过学习 DD 的语言,进行调参和炼丹,我总结过《上》《下》两篇 DD 参数效果大全,但有这时间,做点什么不好呢?)

DD 在画风景/抽象画时,其实效果常常还不错,但即使在还凑合的领域,也并没有明显优于 Midjourney 和 Dall-E2,单张跑的时间甚至是另外两个模型的数倍(在 Colab 充到每月 45 刀的会员,使用 V100 GPU 的情况,DD 默认设置下纯生成时间也有 5 分钟,如果再加上挂载 Google Drive, 安装模型包之类的时间,一张逼近 18 分钟;而 Midjourney, Dall-E2 平均 1 分钟 1 张,不需要装包,Midjourney 还天然带有社交社区)

所以还是让 DD 自己滴滴打车回去吧!

Disco Diffusion:

言归正传,Midjourney 还在内测,算法还在调试,不代表最终结果。DD 也在进化,要是赶上了还是会打车接她回来的。

在不远的未来,可能是下个月、下周、甚至可能是明天,Midjourney 和 Dall-E2 将会在平面、影视、广告、游戏等所有和视觉相关的领域全面开花,这个未来多久会来,仅取决于他们决定什么时候公测而已。

系好安全带吧朋友们,未来已来。



留言告诉我你觉得谁赢了(*^▽^*)

Reference
[1] https://www.reddit.com/r/dalle2/
[2] https://www.reddit.com/r/dalle2/comments/ul6qap/dating_for_cats_app_icon/
[3] https://www.reddit.com/r/dalle2/comments/ulh07q/spaceships_24_pixel_art_game_assets/
[4] https://www.reddit.com/r/dalle2/comments/ul5pnb/leonardo_da_vinci_early_sketches_of_the_f35/
[5] https://www.reddit.com/r/dalle2/comments/umbvic/an_xray_of_an_unicorn/
[6] https://medium.com/@nin_artificial/dall-e-2-vs-disco-diffusion-c6de6bfbacf9
[7] https://www.reddit.com/r/dalle2/comments/umc07i/a_beautiful_render_of_padme_amidala_portrait_with/
[8] https://www.reddit.com/r/dalle2/comments/umao4h/surrealist_landscape_painting_of_lovers_walking/
[9] https://www.reddit.com/r/dalle2/comments/uf4mcl/an_abstract_painting_evoking_anxiety/
[10] https://labs.openai.com/s/Jrkckp76odxBEdpQMeEdlkco

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存