Hi, 我是海辛,最近在学习 Disco Diffusion 的参数并进行 AI 创作。
昨晚 Weiwei 分享给了我 Midjourney 的内测邀请码,在初步使用了一个晚上后,可以毫不夸张地说 Midjourney 在直接生成的速度和完成度上可能完碾 Disco Diffusion.
Midjourney 是 Disco Diffusion 的原作者 Somnai 所加入的 AI 艺术项目实验室。目前已开放 Beta 测试版,每张图片生成平均用时 1 分钟,下面先看几张 Midjourney根据文字直接生成的图片:
@ancient chaos: youthful catpunk druid, by tite kubo [1]
@eyeseethru: Mystical african shaman using extra sensory perception to commune with elder spirits in a futuristic temple [2]
@mussiworks [3]
海辛:戴皇冠的章鱼
相较于 Disco Diffusion, Midjourney 界面更友好(不需要任何代码)生成时间更短(一张一分钟左右)细节更精细、完整度更高。如果 Disco Diffusion 基本等于初级原画师的能力,或者仅限于创作者进行头脑风暴;那 Midjourney 或许已经达到了可以直接生产工业级高质量成品的地步。Midjourney 搭载在 Discord 频道上,在对话框中输入 /imagine 的指令后,输入希望生成图片的英文描述。敲击回车后,机器人会在后台开始生成渲染图片,并在对话框中实时生成预览图,平均每张图片的生成时间在 1 分钟左右(而这个时间 Disco Diffusion 的安装代码都还没有运行完)。
Midjourney 有不同的子频道,其中包括角色创作、场景创作、每日主题、抽象画等。其角色设计能力让人尤为惊叹。为了测试,我在角色频道下输入了以下一段文字描述:panda combines monkey, by pixar. ↑ 1 分钟以内,Midjourney 就根据我的文字描述生成了 4 张设计方向的预览。
- U 是 upscale 的缩写,含义为放大像素提升细节,U1, U2, U3, U4 代表 upscale 第 1~4 图。
- V 是 variation 的缩写,含义为在此基础上发生变化,V1, V2, V3, V4 代表 variation 第1~4图。
- 刷新的图标是针对 text prompt 进行重新生成。
我觉得 V4 比较有趣,有一种恐怖片熊猫的渗人感,于是选择了 V4。很快 Midjourney 就生成了 4 张该风格的变形预览,都好适合恐怖游戏,立刻将 4 张图都 upscale. 通过 Midjourney 生成的图片都会保存在个人主页上,Midjourney 个人主页 [4] 需通过 Discord 直接登录,登录后右键即可下载原图。
另外,Midjourney 的主页还提供两个宝藏级别的数据资源库:Dictionary 文字对应的风格数据库:帮助创作者找到最适合的词汇
Styles & Artists 画家风格数据库:帮助创作者找到最适合的画家风格
值得一提的是,通过 Discord 的频道,你同时还可以看到其他人在生成的作品,从而观察其他人是如何进行文字描述的以及其对应的结果,可以在他人的作品上进行风格变换和继续创作。Midjourney 可以免费使用,但免费版用户每个月的生成张数有限制,且不能商用。
付费版用户每个月需支付 30 美元,生成的图片可用于商用,并且:- 若因 Midjourney 获利在每月 2 万美元及以下的,不用支付 Midjourney 分成。
- 若因 Midjourney 获利在每月 2 万美元以上的,需要支付 Midjourney 20% 的分成,或者和 Midjourney 商讨出其他分成协议。
另外,付费版用户每月可向 Midjourney 申请 10 个作品的完整所有权,并且这份权利不随时间的变化而改变。你也可以向 Midjourney 申请更多的额度。目前 Midjourney 还在 Beta 测试版,通过这个链接 https://o9q981dirmk.typeform.com/to/zZtF1mVc?typeform-source=t.co 可以申请测试名额。Midjourney 每个月会给已经通过内测的用户发放一些名额,如果你需要测试名额的话,也可以通过公众号后台向我留言,如果有新的名额 available 我会发给你,当然这个不能保证,因为我还没搞明白怎么邀请(对不起)希望大家都能早日用上 Midjourney! 之后如果有时间的话,会做 Midjourney, Disco Diffusion 和 DallE2 的详细对比。但介于 AI 发展得也太快了一点,所以这个不做保证。
最后想分享一下这个月使用 AI 进行艺术创作的感受。现在仿佛是 AI 艺术彻底爆发的前夜,昨晚我不断问自己:“我究竟是生活在一个怎样的时代?” 我只能听到自己的心脏在砰砰直跳,那是一种夹杂了激动、震撼和恐惧的感受。
人类或许已创造出超过自身创造力的生命形式,AI 艺术在每秒每瞬都在向我们展示世界上所有的可能性。在恐惧的同时,我感到了一丝感动,我们似乎一直在寻找可以完全让我忘记自己,可以超越自己的东西,而我们可能有幸见证到这个时代的来临。[1] https://twitter.com/Cha0S_AI/status/1520085512530276354[2] https://discord.com/channels/662267976984297473/938154212238430341/972864609079926784[3] https://twitter.com/mussiworks/status/1521441767278665730[4] https://www.midjourney.com/app/