AI作画的现在与未来,以及艺术的终焉
写作这篇文章的起因是我在今年元旦发的这条朋友圈:
当时的我确实是被AI作画的精细程度震惊了,但是让我没有想到的是,在几个月的时间内,AI作画的完成度再次上了一个台阶。目前的几种前沿AI作画技术几乎达到了商业化程度,如disco diffusion,midjourney以及dall-e 2等。其中disco diffusion已经公布,而后两者则还在内部测试阶段。
AI作画的一个最基本的特征就是对于用户输入要求极少,一般只需要输入对于自己想要场景的描述即可,如“夕阳下的寺庙”,“没有尽头的花海”等等。当然也可以添加其他关键字帮助AI生成图像,如disco diffusion的输入示例:
“A beautiful painting of a singular lighthouse, shining its light across a tumultuous sea of blood
by greg rutkowskiand Thomas kinkade,Trending on artstation.”, “yellow color scheme”
不难发现我们可以加入艺术家的名字(by greg rutkowskiand Thomas kinkade),画作的风格(Trending on artstation,即artstation上流行的画风)以及想要的色调(yellow color scheme)等。而加入这些关键字之后我们会得到怎样的成品呢?这是disco diffusion给出的答案:
应该说这是一份令人非常满意的答卷了,而disco diffusion还支持自定义一些参量,如迭代次数,尺寸大小,还可以输出中间生成过程等。
我们还可以规定画布轮廓。只要在描述中输入“a beautiful oil painting of a cloud, trending on artstation”,我们就可以得到如下结果:
应该说disco diffusion已经具备非常强大的作画功能了,但它也继承了先前AI作画的缺点:对于具体事物的描绘较差。如果试图用它来作人物画像,那么大概率会得到一些恐怖片里才会出现的场景。
但是,但是。
别忘了我们还有midjourney和dall-e 2这两项技术。
OPENAI于去年公布dall-e,应当被称为是AI作画历史性的突破,本文中的技术基本也都或多或少借鉴于它。而dall-e 2作为它的升级版,性能更是有了突飞猛进般的进步。midjourney则是可以视为dall-e的竞品,其性能也不遑多让。可以通过一些例子来体会其表现:
通过上述例子可以看出,dall-e 2和midjourney在作画方面已经达到了非常恐怖的水准,无论是抽象主题还是具象主题,甚至到app图标等特殊作品都能给出优秀的答卷。下面节选一些AI作画的例子以供参考(部分画作经过二次加工):
应该说,AI作画的时代已经到来了,只是传播还需要一定的时间而已。已经有大量画师选择使用AI来帮助其绘制或提供灵感,这样的趋势是无可避免的。而我也不禁重新提起这个问题:艺术究竟是什么?
2016年,一个名为deepbach的项目通过对巴赫曲目的分析,由AI自动生成曲目,而过半数受试的音乐行业从事人无法辨别AI作曲和巴赫本人曲目的区别。前几年也有大量的AI作诗网站涌现,其质量虽参差不齐,但也有一些几可以以假乱真。应该说人工智能早已经介入了艺术领域,但这究竟会对艺术的发展产生怎样的影响?
我不由得想起底特律变人里一本杂志上的信息,上面报道真人乐队联合抗议仿生人乐队,而后者在彼时已经占有了超过90%的市场。因为仿生人乐队可以连年无休地演出,且持续产出音乐作品。这在以前也许可以只拿来当一个有趣的想法来聊聊,但现在它似乎离我们越来越近了。
如果AI创作的文字、音乐、画作可以与人的创作一样,给予人同样的精神体验,且产出更块,产能更高,成本更低,那么艺术是死去了,还是重生了?
如果创作者们追求的灵感最终被发现为只是一种朴素的思维体验,可以通过AI量产从而给予读者共鸣,那么我们该悲哀,还是欢呼?
如果我们最终发现艺术只是人类历史上的一截弯路,人类所需的情感体验可以被更有效率的方式填补,从而导致艺术彻底被抛弃,那么我们将何去何从?
这都是一些很遥远的问题,但我相信未来的某一天,我们会开始慎重考虑它们的。
当我说“我们”的时候,我指的是每一个人。