查看原文
其他

AI绘画软件大比拼:StableDiffusion&Midjourney&DallE谁更胜一筹?

穿行者2049 今说新语 2024-04-15

我的专栏《AI绘画与AIGC实践之路!

已经开通,欢迎加入!

一夜之间,AI绘画领域抢过了ChatGPT的风头。各大公司分别宣布进入这个领域,Adobe、微软同日宣布了各自的产品,Stable Diffusion不甘落后踩着午夜钟声也宣布下一个版本的SDXL模型开测。目前,Adobe的产品需要排队等待名单,因此,本文将简单测试StableDiffusion、Midjourney、DallE三家AI绘画程序目前的表现。点击看大图

以下所有内容都没有进行参数调整,都是各个软件直接用同样的提示语完成,有的提示语简单,只有两个单词,有的稍微复杂些,但也没有专门针对不同的软件优化,没有特意使用类似相机参数、高清、杰作、各种光影材质一类的,都是随机复制了一些以往的提示语,所以不代表这些软件的最高水平。

SDXL
Midjourney V5
Image Creator(Dall-E)



整体来看,目前整个AI绘画水平都达到了一个很高的层次,互相之间的差距都在减小。但是Dall-E在复杂场景的绘制方面,理解力显得相对较弱,尤其是最后几张简直不能看。当然这些细节不足应该可以通过调整提示语来优化。但是,由于以往Dalle缺少大量用户的参与,在审美方面会有所欠缺。现在,微软Bing加入文本生成图像功能后可以收集大量用户数据,后续有望迅速进步。而SDXL版本的画面质量则肉眼可见地有了很大进步,其理解力、构图和色彩表现都非常不错。

未来,随着AI技术和计算能力的不断提升,AI绘画领域将会呈现出更加出色的表现。其中,我们可以期待以下几个方面的进展:

更高的图像分辨率:随着计算能力的提升,AI绘画软件可以生成更高分辨率的图像,这将使得生成的图像更加细腻、真实。目前MJ、Dall-e的默认分辨率都已经是1024x1024,下一代的模型在训练阶段就将使用更高的分辨率。

更丰富的场景和元素:未来的AI绘画软件将可以更加准确地理解图像中的语义信息,从而能够生成更加复杂、丰富的场景和元素,随着ChatGPT等其他大模型的共同发展,AI绘画软件也将享受整体语义理解能力的提升。

更好的创造性:AI绘画软件将会具备更高的创造性,能够从少量的提示中生成更加多样化的图像,提示语工程师不再是一个复杂高深的职业。

更智能的交互:未来,AI绘画软件将可以更加智能地与用户进行交互,能够理解用户的意图并快速生成满足需求的图像。
目前很多第三方软件都在模型基础上大力开发人机交互界面,各种图像编辑功能都在迅速发展,更垂直领域的图像生成和编辑需求也都在爆发。就我注意到的Playgroundai.com、Dreamlike.art、Krea.ai、Invoke.ai、Leonardo.ai、Mage.space这几家小的创业公司,前段时间都推出各自的自训练模型,近期则都在图像生成后的编辑方面研发一些功能,将最新的各项AI技术融入自家的产品之中,例如Instruct、ControlNet、Pix2Pix等。

不过在看到大公司直接下场后,类似Microsoft Desigher和Adobe Firefly这样的大公司软件,也将带着巨大的研发优势和用户规模挤压小公司的空间。如果不能找到一条能有别于大公司的长期发展方向,靠着一个自训练模型,或一些图像编辑功能,这些创业公司产品的生存期也都堪忧。

《2023 AIGC从入门到精通专栏》

欢迎您的加入!


根据你的喜好,推荐阅读以下内容:


喜欢请转发到朋友圈支持一下!

继续滑动看下一个
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存