查看原文
其他

“你已经是个成熟的AI,可以自己画画了”

星彡P BB姬 2022-07-24


星彡P丨文


这段时间,有个叫“DALL・E 2.0”的AI画画工具刷屏了我的推特主页,在外网非常火。


简单来说就是一种AI绘图程序,只要输入一些语言描述(最好是英文的),不管任何天马行空的句子都能变成真实图像。


(关键词:骑着马的宇航员)


这个最强的图像生成器来自马斯克参与创建的公司OpenAI。


Dota2玩家应该不会陌生,这些家伙们在三年前创造出了能和OG掰手腕的人工智能bot战队,一时间传为佳话。



这回他们又把目标放到了艺术领域,大致原理是——先拿网络上带描述的几亿张图像,训练CLIP模型,把图片的特征和对应的自然语言特征进行分析配对,学会语言和图像的相关性。基于扩散模型的概念,逆向推导生成结果图。(官网上的术语把我看晕了,因为我不是专业人员,这里就简单概括下)


而且这个“DALL・E 2.0”不只看文字画画那么简单,它还可以根据原图画风,在没有违和感的情况下,按要求往画面里添加额外的元素。



比如上面这张图,左上角是原图,在保持画风一致的情况下,分别往其他三张图里面加了只狗。对于如此逼真的图像造假手段,大家显然还没做好应对的准备,于是引起了轰动。


当然,也有不少人把“DALL・E 2.0”往搞笑的方向使用,试图了解AI如何理解都市传说里的虚构生物的,最后的出图效果也相当惊人。


(关键词:飞天意面神教,真实图片)


不过遗憾的是,“DALL・E 2.0”还没有开放API,不是人人都能使用的,需要向OpenAI申请内测资格。按他们的说法,在开放之前还要研究一下“安全措施”,防止被人用来生产色情、暴力或者政治相关的图像。


“你已经是个成熟的AI,可以自己画色图了”——这种想法直接被官方给毙掉了。


但没关系,不能画色图还有其他乐子。去年OpenAI已经开源了“DALL・E”,也就是一年前的版本,相当于是青春版(也有人叫它阴间版),网上现在就可以找到。尽管效果没有2.0的版本那么好,但好歹能简单体验下效果。


下面是DALL-E mini的地址:


https://huggingface.co/spaces/dalle-mini/dalle-mini


只需要输入文字,等待1~2分钟时间,就能得到一些啼笑皆非的风格图片,这里分享几个BB姬和网友用程序生成的结果:


(关键词:G胖与肯德基)


(关键词:来自LOL的亚索坐在轮椅里)


(关键词:蝙蝠侠骑着平衡车)


(关键词:P5与憨豆先生)


两个版本生成的图放在一起也很有意思。可以看到,DALL-E的画风还比较抽象,但仅仅过去一年时间,2.0版本就已经相当惊艳了。


↓↓左边是初版,右边是现在的2.0。


(关键词:一副以莫奈风格创作的画,主题是狐狸坐在太阳下的田野)


说实话,AI画画是个很有趣的东西。


人人都有表达欲,通过画画表达也是一种方式。LSP如我,也曾幻想过能到达自己“产粮”,让别人对着自己画的色图冲的境界。但绘画技巧要做到随心所欲展现思想的程度,那门槛可不是一般的高,很容易就把我这样的懒人阻拦在了门外。


我曾经试过学习画画,为此还花费“重金”在某宝上买了绘图板——工欲善其事,必先利其器嘛,这道理老祖宗教的。结果画画没学下去,倒是顺利地入了OSU的坑。(OSU是一个PC音游,玩法类似戳泡泡,对光标移动准确度需求很高,很多人选择用绘图板进行游戏)


(关键词:马克思在KFC LOGO里)


(关键词:飞天意面神的洞穴壁画)


有了AI绘画之后,好像一切都不一样了。或许未来会有那么一天,哪怕对绘画一窍不通的人,也可以创作出自己的作品。


我也试着了解过一些其他的主流AI作画工具,比如Midjournry、Disco Diffusion、谷歌的Imagen之类,网上有不少教程,需要注册各种云端账号,甚至是基础的编程知识。


如果你有幸搞到本地运行的版本,还有更多的麻烦接踵而至,本地运行所有这类AI创作工具都需要消耗惊人的GPU(显卡)资源,对电脑的性能要求极高。



(网上用Disco Diffusion创作的AI绘画)


就拿Disco Diffusion来说,假如你希望在本地部署,电脑起码要有10G以上的显存,而且是1080ti这个级别以上的Nvidia显卡,才可以以极慢的速度生成一副最大1024*1024 尺寸的作品。


显卡性能的提升能大大地缩短出图的时间。但如果是AMD显卡、或者好几年前的笔记本电脑的话,想都不用想,根本跑不起来。这么一想,高级的AI绘画所耗费的成本,说不定比报个班学画画还要高,普及之路还很长很长。


到最后,大多数网友可能也只是玩玩“阴间版”“青春版”的AI作图,体验一下效果而已。



-END-



往期推荐


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存