创作者与AI之争,最终赢家会是“会用AI的创作者”吗?
昨天,网易创作平台Lofter上线了“头像生成器”功能,允许用户通过输入文字作画要求生成图像。此事在社交媒体上引发了大量争议,不少曾在该平台发布作品的创作者纷纷注销账号,表示不愿意自己作品被AI吸收、使用;作为回应,Lofter昨今连发两条官方说明,声称该功能未使用用户作品作为训练数据,并承诺将推出一系列功能,以区分、保护非AI生成的原创作品。
Lofter“头像生成器”功能的内测版本,目前该功能已无法被搜索到(图片来源网络)
实际上,这并不是AI创作首次引发争议。今年二月初面世的文字型AI工具ChatGPT,以其在信息搜索、语言理解、内容总结中呈现出的高水平文本编辑能力震惊世界。相较此前面世的若干款AI绘图工具,处理文字的ChatGPT适用和影响范围更广,因此也在一时间成为了几乎所有媒体和平台讨论的热点。
AI根据“日本平面设计”一词生成的图像
在创意圈,早在去年以来,随着DALL-E、Midjourney等AI工具的面世及普及使用,AI绘图、设计已经成为了最为热议的话题之一。创意人们都在发问:AI会对创意工作产生怎样的影响?AI是否会取代插画师、设计师?如果把AI作为创作辅助工具,如何看待使用AI创作的伦理问题?
今年一月,日本设计评论者冢田优在JAGDA(日本平面设计协会)的“平面设计评论”线上专栏上发表了《图像生成 AI 会给设计和插画带来什么?》一文,从技术、社会、文化等多个角度分享其观察和见解。本篇将此文翻译、整理,或能在众说纷纭的当下,给大家提供新的思考和洞察。
>>
DALL-E、Midjourney、Stable Diffusion、NovelAI,2022年是AI图像生成元年
当下,图像生成AI作为一种“重新定义了创作”的方式而备受关注。2022年被称为“AI图像生成元年”——该技术被发表在互联网上,各类相关服务也纷纷被开发,变得容易被大众使用。下文将简单梳理图像生成的历史、浅谈最近的热议,讨论图像生成技术在设计和插画方面会引起哪些具体的变化,以及它对我们的文化会有什么影响。
“The Next Rembrandt”
←向左滑动查看更多
回顾历史,人类对人工智能生成图像的尝试已经进行了相当一段时期。比如,英国画家Harold Cohen在1979年就发布了程序“AARON”,该程序学习其本人的作品,通过重叠分支条件可成功自动生成“画作”。至于图像生成AI则是近年的热门话题,2016年“The Next Rembrandt”项目发布,分析巴洛克绘画大师伦勃朗的作品,提取他的风格生成新的图像,并在佳士得拍卖会上以高达432,500美元的价格拍出,引发了媒体大肆报道。
AI图像生成技术近年来通过结合深度学习技术取得了重大突破。深度学习技术通过构建包含多个处理层的计算模型,让机器逐渐获得接近人类的决策能力,同时又结合大数据进行学习。
由Stable Diffusion生成的图像,关键字为“日本版画浮世绘风景”
2022年,DALL-E、Midjourney、Stable Diffusion分别于1月、7月、8月接连面世,而以开源的Stable Diffusion为基础又开发出了擅长输出日本动漫风格画作的NovelAI,AI图像生成的基础在日益扩大。
时代已经到来,任何人都可以通过随便输入几个词,轻松地画出一幅画。图像生成AI技术现在正从基础研究阶段转向各个领域的应用,其中包括设计和插画。仿佛是印证了这一情况,2022年10 月,日本的图像发布网站pixiv开始支持在AI生成作品上显示“AI生成”标签。12 月,Adobe Stock图库也针对AI生成图片给出了供图指南。由此可见,市场对AI生成图片的响应已经开始了。
>>
AI生成图像和非AI生成图像的竞争已拉开帷幕,但前者还未能快速取代后者
在日本,编辑和设计师们在聘请插画师时,会参考pixiv;而Adobe Stock则会向用户提供插画图库——从这两个网站的性质可看出,AI生成图像和非AI生成图像的竞争也已拉开帷幕。
Adobe Stock上的AI生成图片
然而,在现阶段,图像生成AI不见得能快速接管插画师的工作。目前,生成图像的主流方法仍然是通过文本输入,CG导演兼艺术总监横原大和认为这种方法效率低下“就算多次尝试,也往往得不到想要的画面,与其花这么多时间,不如自己动手画或者去找参考。”他指出,目前AI图像生成只能反复试错,这一点是“低效的”。
如果图像是动态生成的,则很难进行诸如更改角度和位置之类的微调。此外,AI还有不少不擅长的细节,比如人类手臂和手指的数量不匹配,这让其生成的图像难以直接用于真实工作场景。在此基础上,对生成的图像进行选择和矫正的人工作业仍然是必须的。
AI根据“握手”一词生成的图像
哪怕不考虑设计问题,单把插画看作是一种图片材料,目前图库仍然比AI好用,因为当前AI基于自然语言生成的图像缺乏清晰的符号意义,这可能是由于它目前还在学习大量数据。大部分人对图库插画的预期是色彩明亮、简洁明快、传达的内容易于理解。但要AI做到这些要求,则需要输入很多文字描述。在未来,AI或许在不需要太多艺术家个性的领域会取代人工,但就目前而言,考虑到利用生成图像所需要的额外时间和精力,使用现有图库效率更高。
>>
AI生成相关的法律和伦理问题仍待案例积累和讨论
在法律方面,可以预见生成图像的使用会遇上各类麻烦。日本律师柿沼太一在其博客中介绍了如何在现行法律范围内处理可能出现的问题,但对于AI生成图像,仍然需要积累真实的解决案例和司法判例。
AI生成图像的伦理问题也仍待讨论。去年8月,一项名为“mimic”的AI生成服务面世,该服务通过让AI学习30张以上图片、从中提取艺术家的个性,再生成图像。mimic的发布一经媒体报道,就被批评为抄袭的温床。
“mimic”首页
另一方面,插画师之间对AI图像生成也抱有不同的看法,并非都持反对意见。日本资深漫画家/插画家七瀬葵自1990年代以来一直积极让AI学习自己的风格,并为此感到自豪,认为“AI有我的一滴血在里面。”然而,除非消除“抄袭”的顾虑,且出现了生成图像相关的社会道德规范,否则插画需求方不会有积极使用AI插画的势头。
未来有可能为这些AI法律和伦理问题寻求解决方案,其技术缺陷也会逐渐找到解决方案。交互设计师深津贵之预测,未来图像生成AI将从输入型向交互型转变,且可以进行更为详细的调整。从谷歌2023年1月2日公布的图像生成模型“Muse”也可以看出这一发展方向,虽然该模型尚未向公众发布,但很明显看到这一工具可以通过遮罩功能调整图像的特定部位,从而提高其交互性。另一工具NovelAI则似乎调整了算法,来让生成图中的手臂和手指更加自然。
Google的“Muse”生成的图片
>>
利用AI的方式多种多样,日后或会出现专门利用AI作画的专业插画师
目前对AI图像生成的使用更多是将其作为一个终端用户看不见的“中间产品”,或者创意辅助工具。例如在为游戏制作概念图时,可以利用AI生成启发新想法;也可以利用AI生成提案阶段的图片文件。
在这方面,最近发行的《CG WORLD》2023年1月号和《SF Magazine》2023年2月号都利用了AI图像生成来制作封面,两本杂志都讨论了AI话题,在封面制作中使用AI工具也是扣题的。这一举动可以说让插画圈切实认识到了AI图像生成“进行时”。
《CG WORLD》封面
然而,即便都利用了AI生成,两个封面的制作过程也存在很大差异。《CG WORLD》封面是概念画师田岛光二基于约800张生成图像创建的3D模型,也就是说他对画面的色彩和形状都进行了人为安排,这并非纯粹的图像生成。对此田岛表示,虽然他能感受到生成图片的影响,但作为图像创作者并没有体会到其中的好处,所以最终还是选择了亲手创作。
与此相反,负责《SF Magazine》封面设计的深津贵之则严格规定自己必须原样使用AI图像,他从根据自动生成描述文字创建的数万张图像中选出最终的封面,让人联想到加藤直之等科幻插画家的绘画作品。而两个封面的共同点是:只看一眼,人无法辨别这是利用AI生成的图片。
《SF Magazine》封面
目前,互联网上已经出现了专门用于发布AI插画的网站,也有不少人在利用编程或长篇复杂的描述来让AI生成完成度较高的图像。不可否认在不久的将来,这些平台上可能会产生一批新的“专业插画师”。
>>
尽管存在表达和伦理等方面的问题,人类与AI的关系正在进入一个新阶段
关于图像生成AI如何在设计和插图中使用的具体案例,本文至此已经列出不少。最后想提的是,目前社交网络上充满了围绕AI生成图像的各种“梗”——对人类而言,AI的行为必然有着有趣之处,它会生成我们意想不到的图像,比如人用手抓拉面吃,而不是用筷子。
这其中呈现出来的,AI图像生成最让我们震惊的或许是,至今一直由我们提供、在管理着我们的大数据在我们不知不觉中获得了自主反馈。以前,所谓的数据档案都是由人类创建的,然而最近事态发生了急剧转变。哲学家米歇尔·福柯所说的“人将被抹去,如同海边沙滩上一张脸的形象”,或许正在实现。而社交媒体上人们对其进行幽默化、“梗”化的处理,是否意味着人类也在逐渐接受算法所呈现出来的“他者性”?
Stable Diffusion根据“中国平面设计”关键词生成的图片
AI图像生成的发展为信息技术的创造性提供了新的思路。在未来的设计和插画中,通过学习生成的图像会绘制出什么样的螺旋结构?变化正在稳步发生。尽管存在很多表达和伦理等方面的问题,但毫无疑问,人类与AI的关系正在进入一个新阶段。
在文末留言一起来聊一聊
#你对AI作图和AI设计的看法?#
原文链接
gdr.jagda.or.jp/articles/61/
编撰&排版 | Shelly
校对 | Naomi