查看原文
其他

AI作画的现在与未来,以及艺术的终焉

retell retell 2022-08-29

写作这篇文章的起因是我在今年元旦发的这条朋友圈:

当时的我确实是被AI作画的精细程度震惊了,但是让我没有想到的是,在几个月的时间内,AI作画的完成度再次上了一个台阶。目前的几种前沿AI作画技术几乎达到了商业化程度,如disco diffusion,midjourney以及dall-e 2等。其中disco diffusion已经公布,而后两者则还在内部测试阶段。


AI作画的一个最基本的特征就是对于用户输入要求极少,一般只需要输入对于自己想要场景的描述即可,如“夕阳下的寺庙”,“没有尽头的花海”等等。当然也可以添加其他关键字帮助AI生成图像,如disco diffusion的输入示例:


“A beautiful painting of a singular lighthouse, shining its light across a tumultuous sea of blood

by greg rutkowskiand Thomas kinkade,Trending on artstation.”, “yellow color scheme”


不难发现我们可以加入艺术家的名字(by greg rutkowskiand Thomas kinkade),画作的风格(Trending on artstation,即artstation上流行的画风)以及想要的色调(yellow color scheme)等。而加入这些关键字之后我们会得到怎样的成品呢?这是disco diffusion给出的答案:



应该说这是一份令人非常满意的答卷了,而disco diffusion还支持自定义一些参量,如迭代次数,尺寸大小,还可以输出中间生成过程等。



我们还可以规定画布轮廓。只要在描述中输入“a beautiful oil painting of a cloud, trending  on artstation”,我们就可以得到如下结果:





应该说disco diffusion已经具备非常强大的作画功能了,但它也继承了先前AI作画的缺点:对于具体事物的描绘较差。如果试图用它来作人物画像,那么大概率会得到一些恐怖片里才会出现的场景。


但是,但是。


别忘了我们还有midjourney和dall-e 2这两项技术。


OPENAI于去年公布dall-e,应当被称为是AI作画历史性的突破,本文中的技术基本也都或多或少借鉴于它。而dall-e 2作为它的升级版,性能更是有了突飞猛进般的进步。midjourney则是可以视为dall-e的竞品,其性能也不遑多让。可以通过一些例子来体会其表现:











通过上述例子可以看出,dall-e 2和midjourney在作画方面已经达到了非常恐怖的水准,无论是抽象主题还是具象主题,甚至到app图标等特殊作品都能给出优秀的答卷。下面节选一些AI作画的例子以供参考(部分画作经过二次加工):












应该说,AI作画的时代已经到来了,只是传播还需要一定的时间而已。已经有大量画师选择使用AI来帮助其绘制或提供灵感,这样的趋势是无可避免的。而我也不禁重新提起这个问题:艺术究竟是什么?


2016年,一个名为deepbach的项目通过对巴赫曲目的分析,由AI自动生成曲目,而过半数受试的音乐行业从事人无法辨别AI作曲和巴赫本人曲目的区别。前几年也有大量的AI作诗网站涌现,其质量虽参差不齐,但也有一些几可以以假乱真。应该说人工智能早已经介入了艺术领域,但这究竟会对艺术的发展产生怎样的影响?


我不由得想起底特律变人里一本杂志上的信息,上面报道真人乐队联合抗议仿生人乐队,而后者在彼时已经占有了超过90%的市场。因为仿生人乐队可以连年无休地演出,且持续产出音乐作品。这在以前也许可以只拿来当一个有趣的想法来聊聊,但现在它似乎离我们越来越近了。


如果AI创作的文字、音乐、画作可以与人的创作一样,给予人同样的精神体验,且产出更块,产能更高,成本更低,那么艺术是死去了,还是重生了?


如果创作者们追求的灵感最终被发现为只是一种朴素的思维体验,可以通过AI量产从而给予读者共鸣,那么我们该悲哀,还是欢呼?


如果我们最终发现艺术只是人类历史上的一截弯路,人类所需的情感体验可以被更有效率的方式填补,从而导致艺术彻底被抛弃,那么我们将何去何从?


这都是一些很遥远的问题,但我相信未来的某一天,我们会开始慎重考虑它们的。


当我说“我们”的时候,我指的是每一个人。

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存