查看原文
其他

当我沉迷AI画图几百小时后,我在思考什么?

shaonan 产品沉思录 ProductThinking 2022-10-14

细心的读者可能已经发现,沉思录从6月开始对文章封面图进行了一波升级,也总是有小伙伴来问图片是哪里来的。今天我们就来聊聊封面图的来源-Midjourney。


Midjourney 是一个用 AI 生成图片的工具,基本上说一句话,就能得到一张图片。


比如:A beautiful painting by Ivan Aivazovsky, a lonely girl in the snow-covered woods,HD,with cliffs in the distance

刚发现这个工具的时候,我几乎每天的业余时间都泡在 Midjourney 上生成图片,把大脑中曾经有过的画面给展现出来。

得说个脏话,太™牛逼了!


——————冷静的分割线——————


先讲个历史,我最初学画画并不是想学艺术,而是当年想画漫画讲故事,但是郑州没有地方学,只能学素描了。在上素描课之前,画的都是飞船、太空人各种科幻小说才有的场景。但是上了素描课之后,画的都是苹果橘子葡萄啤酒瓶和破布,要么就是丑老头和讨厌的同学,最喜欢的风景速写不在考试范围,更别提漫画了,谁画谁就是大逆不道,淦。

吐槽完美术教育,回到画画这件事上。在没有 PS 的时代,我们都是用颜料在纸面上绘制,所谓的参考要么是实物,要么是照片,许多时候你想表达一个东西,就需要练习非常多的时间积累基本功。当然能积累出来的人都非常厉害,比如宫崎骏的许多动画背景,都还是在纸上画出来的,并非电脑绘画。我们先假设表达脑子中一个画面的难度为 100。


后来有了 PS 之后,就产生了一个新的流派,叫 CG(Computer Graphics)。好处是什么?一方面不用担心颜料干了或者画布翘了,但最关键的是有撤回啊!这简直是神器啊,有多少次一笔画错了基本上一张画就废了。最可怕的还有图层叠加功能,这样就不会干扰之前的层次。甚至能方便地缩放比例,调整整体色调。这群人最初是遭到鄙视的,因为那些曾经辛苦手绘的人觉得你是在作弊。利用这种技术画头脑中的画面,难度基本上降低到了 50。


这其中有一个人叫「新海诚」,一不做二不休的直接拍了照片然后在上面疯狂 PS,在他的动画中人物各种崩坏,但是场景美哭。这种直接魔改照片的流派在当时被 CG 派鄙视,因为前者好歹还自己徒手画,这直接拍照 + 调色 + 补充几笔,算什么英雄好汉。但架不住人家最后拍出来了《你的名字》等票房大作,这种作画方式也得到了主流的认可。现在绘制头脑中的画面,难度继续降低到了 20 左右。

Midjourney 直接把这个门槛拉到了 1 ,大概这么个量级。


先不着急总结,我们来看另外一个案例。在 B 站上有一个很火的《三体》外传《章北海传》,整个画面都是利用类似「我的世界」那种方头人来渲染的,但是由于故事很吸引人,许多人都看得津津有味。


那么问题来了:假如没有「我的世界」的引擎,《章北海传》的导演这辈子恐怕都没有机会来表达自己的故事能力。


技术赋予更多人创作的能力,继而让创作的权利更加平等。


所以回到刚才绘画的鄙视链上,其实随着时间的推移,人们总会转移到先进生产力上,剩下一些古老的艺术当做怀念。所以今天很多人鄙视 AI 画画,认为不是绘画,但我并不这么看。


因为一张画,除了绘画技巧之外,表达的主题和画面构成也很重要。如果有兴趣可以对比姜文和老谋子的分镜头,你会发现姜文的属于儿童画,但这不妨碍姜文的故事讲的比老谋子更好。


有了 Midjourney 后,绘画能力和表达能力,终于低成本的被分离出来 —— 你可以不用依赖于任何一个画家,低成本地来实现脑海中的想要表达的画面,甚至可以指定某个艺术风格,镜头,颜色,东西的位置等等。


当绘画技巧不是问题的时候,主题和风格就成了新的难题:大家都知道梵高和印象派,但是一个赛博朋克的印象派城市是什么样的呢?穆夏画女人很漂亮,那么来画个克苏鲁的怪兽呢?泡在社区中的十几个小时,我对许多人的脑洞惊为天人,也对 AI 对字词的理解(或者是曲解)表示惊叹,许多是从未有过的脑洞。另一方面是对风格的学习和了解,自古人类有这么多的艺术风格,如何找到匹配的风格和主体就成了最难的部分,因为每一种流派都有其局限性,非要拿浮世绘画个欧洲古典圣母降临。

所以有人类的地方就很卷,当技巧被拉平到一根水平线上的时候,创造力,或者说叙事能力就变得更重要了,因为你无法说出一个你大脑中不存在的单词。就像一个外国人很难描绘出来中国园林一样,许多画面中的东西,也是超过我生活中认知的叙事。另一方面就是关于艺术流派和镜头控制的技巧,那一刻我才发现自己对于艺术家了解的如此之少,对于镜头的运用如此之呆板。


但随着我生成了几百张画面之后,逐渐发现自己主题开始重复。这就产生了一个新的痛苦和挑战 —— 我想讲一个属于自己的故事,自己的世界观,而这又要反推,你需要疯狂获取许多新的知识和花费更多时间在脑海中铸造那个狂野世界的细节。


在 AI 的加持下,第一次感觉到精神世界「被掏空」,创造的速度超过了表达的速度。也感觉到,「叙事」将会变得无比重要。那些拥有狂野想象力但是没有绘画能力的人,将会在新的媒介上,如鱼得水。


这是一个革命,也是一种自由,但也伴随着巨大的痛苦。

然后又过了一阵,我发现我错了,我在用一种古老的方式使用新的媒介。


刘慈欣的《诗云》中讲了这么一个故事:当外星人用熄灭太阳的能量来用所有汉字组合了所有诗歌的可能性后,却发现由于信息量太大,无法搜索到那些绝美的诗歌。


其实 Midjourney 是一个庞大的数据库,里面有几十亿对匹配的数据,再加上机器学习的进化。所以理论上它存储了所有的可能性,问题是,我该如何来检索这个数据库呢?仅仅是基于审美?


把自己从主角的位置上拿开,反而有了新的视角。


比如之前看到有人在生成无人的加油站,虽然短短的一句话,但是 AI 不知道怎么抽风了,画出来的画面极其具有故事感,单凭这张图就可以写出来一个科幻小说。也就是说,我们不再是命令 AI 来完成自己的意志,而是 AI 本身自有其意志,甚至可能是创作主体,我们做的更多的是提出问题,然后看他给的答案。


是否会有一个流派的文字创作,会依赖于 AI 生成一些画面,然后根据画面来为自己的文字补充缺失的细节?或者直接将自己的未完成的小说生成画面,配上音乐和镜头做成电影?或许应该有更多新的创作形式,而不仅仅是用 AI 来绘制浮世绘。从这个角度来看,人机共生不是脑后插管,而是思维的融合。


最后一个问题:外卖员在送外卖的时候,小哥是主角,还是指挥他送餐的 AI 是主角?


我们该如何和 AI 相处?我们该在什么位置和 AI 相处?




您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存