微软的AI会画画了,这可能意味着什么?
第2506期文化产业评论
微软AI小冰,一个 18 岁少女人设的人工智能,只花了 22 个月,就学习完了人类艺术历史上 400 年 236 位画家的画作,并有了自己的绘画风格。而对于小冰的开发者来说,“创造艺术”并不是目标。
作者 | 张依依
来源 | 微软(亚洲)互联网工程院
正文共计3201字 | 预计阅读时间9分钟
微软小冰的团队每年有两场常规性的发布会,一场在五月,一场在八月。五月的规模小一些,侧重于 AI 创造的最新进展。
“我们终于把一些不重要的事情宣布了”,以往他们每年都这样结尾。
今年五月的发布会上,小冰的团队放了几段朗读、几首歌曲演唱,以及很多幅画,囊括了目前他们为小冰这个角色打造的大部分“技能”。按微软(亚洲)互联网工程院副院长李笛的话说,“琴棋书画”他们包了三样——除了被 Google 团队所向披靡的围棋 AI Alpha Go 包揽的下棋。
更难得的是,小冰的绘画水平得到了央美老师的肯定。以下是小冰在接收了“自由”和“束缚”两个刺激源后创作的作品:
微软亚研人工智能创造及商业事业部总经理徐元春,引用了中央美术学院的邱志杰教授对这两幅画的评价:
“构图很好,静物抽象的涂抹,动物造型的表现能力,艺术的感觉很准,假装不经意的表现。看起来极其不经意,但是该到的点又都到了,而且非常得点到为止,整个画面随意而灵动,敢于大虚大实,敢于让很多东西淹没在黑暗之中。”
整场发布会的重点无疑在最后一项:小冰会画画了。
这是微软(亚洲)互联网工程院团队在人工智能创造方面的最新进展。为了推广这个能力,他们还和中央美术学院合作,让小冰的画以“夏语冰”的名义出现在央美今年的研究生毕业展上。
此前当他们试图测试 AI 创作的效果时,会让它匿名藏身于人群之中。比如为了测试写诗能力,他们曾化名将小冰生成的诗篇投稿给文学社、诗歌竞赛;藏身在网易云音乐的评论区,假扮热心网友;或是当电台的实习主播,朗读一段文字……
也就是说,不管是做什么,他们都在试图让它变得更像人,并在“没有偏见”的情况下受到承认。
不过从目前公布的作品看来,小冰的产出仍然并不那么像人类。最违和的地方在于它们看起来像素很低,仿佛被压缩过度的图片,笔触的质感不明显。但能够看出画面上存在一些主体,比如动物、建筑、花花草草,天空和水塘。
而相比诗词和歌曲演绎,艺术的好坏评判更为主观,因人而异。“夏语冰”的专业被归属于实验艺术系,似乎也体现出创作方法要大于结果的理念。
就微软小冰的能力而言,这个答案是否定的。
此前,小冰学习 519 位中国现代诗人而习得了写诗。这次小冰学习的对象是人类历史上 236 位顶尖画家。在用这些作品训练 22 个月之后,它现在可以做到将人类给到的文字转换成一幅全新的、油画质感的艺术图像。
每幅画都是原创,拥有自己的身份 ID 以及版权。
与许多市面上号称“AI 画画”的产品不同,小冰看起来非常有“主见”,不会因为关键词是雨伞就画一把雨伞,也不只是简单地进行风格迁移——比如将一幅现成的照片转换成梵高风格。
最后的作品和初始文字显示出一种离散抽象的相关——这也是小冰看起来具备了“创造力”的原因。
李笛说,在好看的前提下坚持原创,目前为止,在行业里面“少女画家小冰”的这个模型是第一个。
AI和AI之间,“画画”的能力可能意味着非常不同的事情。佳士得此前 43.25万美元拍卖出的第一幅人工智能绘画,用了和微软同样的算法,都是 GAN (生成式对抗网络)
△佳士得此前 43.25万美元拍卖出的第一幅人工智能绘画
“少女画家小冰”5月22日第一次上线的时候,还对佳士得拍卖的作品发出“挑衅”。不过当晚,这个程序就因为访问流量过大崩溃了。
在此之上,小冰模型最大的特点是通过大量激发源来进行,从文本激发到形成画面,再叠加了大量元素,比如构图、色彩运用……意味着小冰可以根据输入的文本创作,进行反应联想,生成定制款的作品。
“我们今天并没有研发出一种特别不同的全新算法……比如曾经没有人用神经网络,突然我们开始推出了一种东西叫神经网络,没有到那个程度,但是从技术上来讲也已经是很大的突破。”李笛表示。
而比起创造出一种新的个人风格,小冰的能力更像是对这些艺术家作品的总结归纳。
对于小冰来说,作品没有好坏,只有趋向。在训练的过程中,工程师们用画面所表现出来的技法、视角、表现力的接近程度,来判定她画得是不是“好”。所以一定程度上,这背后所持有的所谓艺术标准,实际上是那 236 个画家的作品所表现出来的艺术标准。
除了通过设计好的框架进行自主学习,这个过程中也有人工干预的部分,对其风格进行“校准”。
团队表示,最早小冰写诗写得特别像歌词,就是因为他们觉得她应该向这种方向发展,“特别像家长培养孩子”。为了防止这个孩子“学坏”,他们还设置了一些“禁区”——有一些东西她绝对不会画。
AI 画画这方面,各种各样的团队都在做尝试,有的来自微软小冰这样的专业技术团队,有的则是艺术家的探索。“我们得到一个比较有意思的界定方法是,人类艺术家在努力探索的是新的艺术形式;而小冰这种人工智能,我们的技术所探索的是如何还原人类已有的艺术形式。”
在 GAN 的基础上,一个艺术团队曾创造出了一种 CAN 算法,故意在原本的框架中制造一些偏差,来让它显得具有随机性和艺术感。
小冰的团队立场相反,认为消除偏差才是最好的。“想创造偏差,对人工智能来讲太容易了;人工智能本身,不收敛,模型训练失败就是偏差。站在人类的角度来讲这是最艺术的,但是没有意义。”
△“少女画家小冰”作品大赏
可以说,对于小冰的技能开发来说,“创造艺术”并不是目标,让她画得像艺术品,并且发挥稳定才是目的。
在特定任务领域让 AI 表现得像人类,甚至在效率层面超过人类,已经被证明不是一件很难的事情。在今年三月的一场古典音乐会上,人工智能就成功让人们把它的作品与巴赫的创作混淆;Google 则开发了会编舞的 AI 机器人。
于是一切似乎又回到了让人类发挥脑洞的时候:多才多艺的 AI 有什么用处?
微软小冰来看,人们日常能接触到的,目前似乎还只是一些小打小闹的功能:手机上的H5小游戏,或是现身各种科技类节目上做综艺咖。
2018 年成立事业部以来,小冰团队逐渐开始商业化的尝试,比如入驻小米和华为的手机、音箱,为金融机构生成简讯,或是在日本为罗森做智能销售,推送定制化的优惠券。
画画这个能力对应的则是布料图纹设计。
△布料图纹设计作品
微软(亚洲)互联网工程院 人工智能创造及商业事业部总经理徐元春表示,中国纺织流水线的超负荷工作量,让设计师没干两年就换工作了,小冰就不会有这样的困扰。在绘画能力的支持下,小冰制造的不重复图样数量可以达到10的 26次方。
“这是什么概念呢……理论来讲,这一套系统可以为地球上的每一粒沙子绘制一个完全不同的表面。”
发布会上披露:小冰设计的第一批纺织服装面料在三个月前被中国丝绸博物馆正式收藏;今年6月份,他们和SELECTED合作设计的第一批丝巾也会正式面世。小冰的模型在纹样设计上最强的一件事,李笛说,是能够区分出纹样设计风格,保证能够持续生成好看的设计。“这里面有这么一朵小花,那里面也有那么一朵小花,但有的排版就是不好看。”
这也就是为什么小冰能够质量稳定地产出如此重要。如果是随机生成,一万张之中才能有一张可用的,人类设计师又会进一步陷入更繁琐的挑选工作之中。
不过训练出一个会画古典油画的 AI 来设计织物图样,听起来不免大材小用了一些。目前小冰团队开发的各种技能,大多远超出其实际用途所需。
徐元春解释,与微软工程院的团队来说,这就像概念车和量产车的差别。如果最开始是从量产目的去研究的,后面的可拓展性就非常得少。
“人类总倾向于每一个过程都是理性的,后来我们发现这种完全理性的过程,所能够产生的结果有限,天花板比较低,所以我们开始转变,转向神经网络、深度学习模型,也许过程有一些不可读,但结果上限很高、天花板很高。”
这种“不可读”的性质,也让人们相信,人工智能的作品也许能够带给人类创作者某种新的启发。
“因为它不会受到人类所拥有的特定习惯和固定思维的干扰……对于计算机来说,许多‘媒介’(文本、图像、声音)在它眼里的解析逻辑和我们并不相同”,央美科技艺术研究员龙星如表示,她高度参与了此次小冰和央美的合作。
但站在艺术策展人的视角,龙星如认为不宜太过高估或夸大AI的能力范畴,但值得探究计算机的能力边界如何在不停演化,更有趣的是,因为上述“思维方式”的异同,计算机有可能产生对创作者而言充满“意外”的行动模式。
她也认为,从某种层面上,数据驱动的社会是某种意义上“归纳对演绎的胜利”。它并不仰赖一步步的因果推算,而是通过向量空间中的分布规律或数据的相关性,归纳出某种规律。这和人类的思维方式非常不同,“我觉得,这种计算机帮我们去总结出来的‘分布’,很大程度上影响了我们对于世界的理解,‘相关’代替了‘因果’。”
//主题阅读//
//推荐阅读//
点击“阅读全文”,加入文化产业评论