对撞机|基于标注和算法生成的平庸 ——人工智能视觉应用
本文原载于《工业 工程 设计》2020年2月第2卷第1期。转载已获得期刊授权。
2020年2月 第2卷第1期《工业 工程 设计》推出了由南京大学艺术学院周计武教授策划组稿的专题:“人工智能时代的艺术设计理论”。在专题序言中,周教授指出:“设计作为一种人类改造世界的创新活动,与包括人工智能在内的新技术彼此交集,汇聚为促进社会高速发展的强大动力。然而设计除了其科技特性,还涉及社会、人文、审美、伦理等更多因素,由此形成的设计创新驱动问题与伦理价值问题,都是人工智能目前无法解决的。”专题收录的六篇论文就从不同的学科视角提出并回应了这些问题。
人工智能对设计观念、思路、方法、规范、价值的冲击和重塑与数字人文领域的“主义与方法”之争多有交叉和呼应。零壹Lab有幸得到《工业 工程 设计》和各位作者的授权,将逐一转发这一期专题中的六篇论文,希望能够引发更多针对科技与人文、艺术与科学关系的讨论。
——吴维忆
作者简介
陈亚建(1976—),男,南京大学博士生,主要研究方向为设计艺术学、艺术学理论。
基于标注和算法生成的平庸 ——人工智能视觉应用
摘要
摘要:分析近年来设计领域中不断增强的人工智能应用在设计的过程和结果中所起的作用,研究判断它们将对未来的设计产生什么样的影响。通过将目前主要的一些人工智能设计工具的目标任务、系统架构、学习模式与设计师工作方式进行比对,找出人工智能设计应用的长处以及其无法克服的问题,判别其未来可能的发展方向。得出了目前的人工智能只是致力于解决设计中基础的技术性问题与较低层次上的设计需要,并无可能像人类一样提出设计上的需求并创造性地解决问题。未来的人工智能应用可能会进一步帮助设计师完成更多事务性的工作,但不可能颠覆设计并代替人类进行思考。人们需要警惕因各种智能应用泛滥而导致人的技能与想象力衰退的问题,因此开发必须要受到限制,技术伦理问题也不容忽视。
关键词:人工智能;设计技术;设计实质;技术伦理
随着数字化技术朝人工智能领域的发展,在设计领域里也诞生了一批初级的人工智能应用,它们帮助设计师完成了不少基础性的工作,并在努力朝自主设计方向发展。当设计与代码结合进行工作时,设计师的角色就已经发生了转变。人们似乎可以畅想,未来的设计师已不再需要精确地控制每一个步骤,只需要提供创作元素和构建机构框架,剩下的一切繁琐的工作就可以交给程序来解决。可问题是一个具有随机性的脚本会产生如此令人惊讶的效果吗?它们究竟会对设计产生什么样的影响呢?它们会作为设计的辅助还是会彻底地颠覆设计呢?本文通过对目前全球几款重要的人工智能设计应用的分析来做基本的了解。
一、 人工智能设计的模式与方法
人工智能是研究利用计算机来模拟人的某些思维过程和智能行为(如学习、推理、思考、规划等)的学科,主要包括探索计算机实现智能的原理,制造类似于人脑智能的计算机,使计算机能实现更高层次的应用[1]。将人工智能介入到设计的过程中,就是希望利用计算机的深度学习技术,加强在内容识别、合成处理方面的能力,帮助设计师完成一些重复性高、繁琐的基础性工作。目前在该领域中比较成功的应用案例有Adobe Sensei、阿里鹿班以及加拿大的Logojoy等。
(一) Adobe Sensei
2016年11月,美国的Adobe公司发布了旗下首个基于深度学习和机器学习的底层技术开发平台——Adobe Sensei。Sensei并非一款单独的软件产品,而是一个可以应用于Adobe旗下各款产品的底层人工智能工具。它利用大量数据和内容,从图片到影像,帮助人们解决在媒体素材创意过程中面临的一系列问题,例如如何在互联网上的海量图库里找到想要的图片,让软件明白某张照片、某段视频以及某段文本描述的真实含义,帮助人们把一些固定的、重复性的操作变得自动化和简单化。此外,Sensei还利用了机器学习和深度学习技术,解决了费时费力的抠图以及处理各种光线的问题。
集成了Sensei的Photoshop CC 2018可自动识别设计稿中的内容,然后生成一系列相关的标签。紧接着Sensei便会在Photoshop CC 2018面板的右侧提供与标签相关的素材。如此一来,通过人工智能技术和海量的数据,集成了Sensei的Photoshop CC 2018便能将你所需要的素材一一呈现给你,从而帮你省下大量的时间。而当素材都敲定了,Sensei也早已帮你把人像抠出来了,接下来直接挪出人像,再进行前后景处理,一张图片就完成了。
总的来说,Sensei是一个供专业用户使用的智能应用,具有很高的专业性,它的目的在于帮助设计师提升工作的效率。然而前提是你首先得有初步的广告创意,当你有了较为成熟的构图和原型选择后,它才可以进行标签的建立和素材的检索,并进行合成。它在其中集合了大量美式广告的模板样式,根据不同的客户需要进行内容匹配。它的优势体现在对图像主体的内容识别上,可以帮助设计师节约抠图的时间,同时在内容匹配方面也节约了检索的时间。
(二) 阿里鹿班
阿里鹿班的面世,曾一度引起人工智能能否全面取代设计师的争论。在2015年淘宝商城(天猫)举办的“双十一购物狂欢节”(以下简称“双11”)上,阿里第一次基于算法和大数据,为用户做大规模、个性化的商品推荐,这是阿里在流量分发模式下的一次大的升级转型。也就是说,在大数据技术的支持下,阿里会根据用户浏览和检索的内容,进行个性化的商品广告推送,从而提高广告推送的精准度和有效性。为了从商品个性化跨到广告资源定位的个性化,在2016年的“双11”上,阿里继而推出了鲁班系统,为广告商家等设计了1.7亿个横幅广告条。
2019年4月,在第七届UCAN用户体验设计论坛中,阿里发布了这个设计应用,向其他公司和行业输出人工智能的设计能力。为了融入集团的动物系主题应用,阿里将“鲁班”改名为“鹿班”,并在5月对外开放一键生成、智能创作、智能排版、设计拓展四大功能。鹿班系统的三个关键技术,第一是图像算法“抠图”;第二是把设计变成“数据”,一张广告设计图片是像素组成的“信息”,利用机器把商品、文字和设计主题进行在线合成,这样每张广告图片就带上了商品信息,可以根据消费者偏好进行个性化投放;第三就是让机器学习设计。人工智能目前有几个主要方向,一个是“识别”,像语音识别、图像识别;另一个是“生成”,从无到有创造东西,让机器能根据请求生成符合特定要求的结果。
该系统基于阿里自身网络销售业务的增长需求而产生,它的任务是替代设计师做一些网络广告。因为“双11”的风格是比较确定而且需要严格执行的,所以设计师制作了很多特定风格的固定模板。机器在这个基础上,把调整尺寸这些行为进行优化,节省了制作尺寸拓版的人力。
(三) Logojoy
2016年,加拿大的设计师Dawson Whitfield创办了Logojoy网络应用,通过智能算法帮助客户完成标志的制作。他认为标志也可以被理解为由字体、颜色、布局、符号等不同部分形成的有机组合。Logojoy用机器学习来判断哪些组合搭配在一起更合适。从追踪用户所做的操作开始,比如他们从一堆标志中选择了哪个,给哪个标志点赞,做了哪些改动,他们下单的标志是怎样的。学习算法每天都会读取用户做的所有操作,再根据发生次数判断其重要性。然后定义规则改进标志的生成算法[2]。
Logojoy通过客户输入的公司名称、行业类型、广告语与选择的图形、色彩进行版型组合,在此基础上进行图形智能对比、扫描相关字型档案、套入品牌风格参数、品牌色彩演算、标志结果优化等步骤。制作流程是:第一步选择你喜欢的样式;第二步选择你喜欢的颜色;第三步选择你喜欢的图形;第四步生成标志;最后如果想把标志下载下来使用就需要付费了。
综上,今天的人工智能都是基于大数据规模结构化的标注数据,比如一张广告作品中主要的图形、广告语、商标等都被标注成基本元素,人工智能就可以根据网页上广告位的比例和尺寸,依据基本的模板进行切割和编排,使之符合大众化的审美需要。这种通过标注和算法生成的设计,模拟了设计师工作中的一般性程序和方法,也许可以提供一些模式化的样式供人选择,但是对于设计就是要“创造不同”的使命来说,它们显然无能为力。
二、人工智能与设计的本质
人工智能在设计领域里的应用,是在先进的计算机辅助系统上进行升级。人们希望利用计算机的深度学习和自主学习能力,提升计算机在设计过程中的作用,减少企业在人力资源方面的开销,并提升设计的效率。
(一) 数字技术的第一革命
从20世纪80年代开始,信息技术对设计的影响便逐渐显露出来。在数字化技术发展的初始的阶段,软件企业考虑的是如何把传统的基于绘图的工作流程数字化的问题。它们在软件中模拟设计师所用的大大小小的画笔、制图用的各式各样的工具,千方百计地把制图从画板转移到了屏幕。可以说,软件开发的基础完全是建立在传统设计师的工作习惯与流程之上的,但即使是这样,基于数字化技术的制图和设计也对设计的过程产生了深刻的影响。相比较而言,计算机辅助设计有不小的优势,它便于修改、放大、缩小,以校验整体和推敲细节,让设计师可以驾驭更加复杂的大型项目,极大地降低了传统手工制图的工作量,同时使设计的结果变得更加的合理、科学。
强大的计算机辅助设计不仅方便了设计师的工作,提高了设计的效率,而且也缩短了从设计到生产之间的距离。在专业设计软件的帮助下,参数化的设计可以让建筑设计师考虑更大胆的造型、更富想象力的结构,3D打印能够为工业设计师提供更宽广的思维,先进的虚拟现实的技术更是将媒介设计师的创意表现得淋漓尽致。今日全球绝大部分的超级工程、精巧的工业设计以及华美的信息设计绝对是,并且只能是出自于计算辅助设计的结果,很难想象,如果没有电脑的帮助,那么今天各大城市里就不会有这么多像艺术品一样美丽的建筑、桥梁、轮船、飞机、跑车等,这就是存在于现代生活中的奇迹。
(二) 人工智能“设计”的特点
虽然“人工智能”是21世纪最热门的词汇之一,被人们广泛地讨论,但是渗入到设计领域里的智能工具,真正被投入到实际场景中应用并产生商业价值的还很少,它们都是在一个封闭的空间,对明确的、单一的任务进行的开发,因此并不具备像人脑一样纵览全局的开放性,以及利用事物间广泛联系的创造性的解决问题的能力。它们不仅无法拥有人类的灵感、感觉和感受等主观能力,而且也没有人类的跨领域推理、抽象类比能力,只能依赖数据和经验来创作或者解决问题。它们更无法像人类一样能够深层次地思考人类的认知特点和设计的意义,思索人类的未来。因此这些具有学习能力的人工智能应用,永远不可能取代人类设计师的角色。
从目前的人工智能设计应用的工作模式来看,它们基本上都是建立在大数据分析的基础上,对现有设计方法与风格进行总结与分析,确定一些容易被人们接受的基本模式,然后对现有的图片、色彩、文字等元素进行分类和标注,根据各种不同的任务进行随机组合。但是它们仍需要一些指定的版面构图,并依据这些模块化构图进行编排。这些所谓的智能应用的工作看起来更像是依葫芦画瓢,它们不仅没有创造出新的元素,而且也没有创作出新的组合方式,更没有创作出一种新风格,因此,这些人工智能生成的设计恐怕是要打引号的。
(三) 设计的本质
机器不可能像人一样去分析问题,提供新的解决方案,它们唯一的可能就是将建立在模式基础上的设计进行进一步的平庸化。目前人工智能所做的一切,还远谈不上是“设计”,它们充其量也就是扮演“美工”的角色而已。如果将这种简单的拓版及合成也当作设计的话,只能说明人们对设计的理解过于简单化了。因为在平面设计中,合成只是设计最终的一个环节,真正的设计在于前期的主题分析,核心创意的形成和执行上。只有这些思想在经过充分的酝酿、发酵、成熟之后,才能够去寻找素材、创作图形、设计文字。也就是说,设计的问题不在于版面构成方面,而是在其中的主体图形、标志符号、口号字体元素上。只有在这些元素全部确定之后,才能将它们进行排版、组合。所谓的人工智能回避了这些元素本身的设计,只是将简单的后期排版作为应用的方向,如果有人认为机器和算法可以取代设计师的话,无疑是出于对人工智能的盲目乐观和对设计的无知。
现实世界的问题解决远比想象中困难。举一个最简单的例子,对人工智能设计应用的一个关键步骤,即抠像问题,Adobe公司曾经做过不少专门的插件,但时间已经过去了20年,该公司还是没能成功地解决这个问题,遇到一些景物和背景颜色反差较小的图片,或者前景中的物体边缘稍微虚糊的话,这些智能化的插件就毫无办法了。又如不管在什么现实场景中拍摄一个长发飞扬的女孩,想要完美地将这个头像从背景中分离出来,对这些插件而言是一场噩梦。就连这样一个最简单、最基础的操作,都让全世界最强大的软件企业头疼了几十年还没办法解决,更不用说从复杂现象中提取元素进行抽象处理,生成使之能传达新意念的图形设计了。
人工智能并不能真正地了解人类的需求,也不具备审美能力。它无法识别男人和女人、成年人及老人、年轻人和儿童、大学生和上班族,以及各种不同职业、不同知识背景、不同收入层次的人们对信息的不同需求,对于风格、色彩的好恶。它们同样不知道不同题材对风格、氛围的处理有不同的要求,各个时段、应用环境下对设计要求各不相同。它们知其然而不知其所以然,而作为人类想象力和创造力巅峰的设计,并不是简单的条件反射。如果一味依赖这些智能工具,那么唯一的可能就是使已经日渐趋同的世界变得更加的无聊。
三、 可能的影响
设计手段的变革当然会对设计的结果产生一定的影响。尽管早前的计算机辅助设计只是将设计从纸上搬到电脑中,竭力为设计带来便利,但是工作流程的简化也实实在在地推动了设计风格的转变。便利的计算机和摄影技术使得设计师放弃了手绘表现并逐渐失去了这样的一项技能,他们习惯了使用电脑与互联网进行工作,使用同样的软件,共享同样的字体和图像资源,解决类似的问题。在今日的商业设计中,已经很难看到30年前的老一辈设计师那种创造力和个性化表达,富有想象力的图形设计几乎完全被数字化的商业广告排挤出去,美式广告通过“漂亮的模特+产品”的简单方式风行全球。这里当然有传播效率方面的考量,可设计方法和程序的标准化所扮演的角色无疑也是同等重要的。
(一) 平庸的风格
模式化的设计手法抹去了手工创作中的个性与文化特点,使全球的平面设计的视觉效果逐渐趋于一致,并产生了缺乏个性的商业设计风格,这是计算机辅助设计带给平面设计的第一个转变。如果说设计标准的提高带来的结果,是设计中个性和文化之间的差异被抹煞的话,那么以目前人工智能介入设计的形式来看,这很可能会对设计带来第二次变革。而这次变革的结果可能比第一次还要糟糕,那就是未来的设计将在日趋趋同的基础上变得进一步的平庸与乏味,它们将使未来的信息交流和沟通变得犹如源代码一样的无聊。
(二) 平庸的体验
法国哲学家维尔勒在《论设计》中谈到数字化时代的影响时说,科技革命不仅仅是一场关于技术与机器的革命,它同时也是一场关于人类与社会的革命。科技改变了机器,改变了生产模式,改变了经济进程,最终改变了人们的生活。他认为,科技,像影响着机器一样地影响着人,数字化的不仅仅是技术,而是这个社会整体[3]。因此孤立地从技术角度谈数字技术与人工智能对设计的影响是不完全的,它也包括了数字化技术如何通过设计影响人们的认知与生活方式,塑造不同的社会形态,以及设计应该如何去回应这些变化。
20多年前,法国社会学家马克·第亚尼曾将21世纪描述为一种“非物质社会”,设计将走向“艺术与科学的边缘”,非物质社会设计会更加注重“非物”的客观性和重要性。即随着非物质社会的来临,信息的普及标志着社会的需求方式已经从“硬件需求”转变为“软件需求”,这是一种关系的体验[4]。当前“体验经济”时代的来临似乎也证明了这点,但人工智能应用提供的“体验”显然并不完美,反而令人生厌。
(三) 技能与想象力的倒退
大量的实践表明,工具的便利也会导致人在某些方面能力的倒退,智能时代领军人杰瑞·卡普兰曾预测,人工智能的发展淘汰的不仅是工作,更是技能,机器使人类失去大局观[5]。第一次设计工具的革新使大部分的设计师失去绘画和制图能力,人们怀疑智能应用的泛滥,也会使人类失去创造力与想象力。人工智能的开发只能围绕如何减少设计师的重复劳动,帮助他们可以更快、更充分地表达自己的创意。一旦他们越过这个底线,让设计师和机器博弈,那么就会对人类社会带来灾难性的影响。设计的工作永远需要人类来提出目标,设定方法与路径,检查或选择随机设计的结果。设计的出发点是人,最终目的也是人,任何发展与革命创新所影响的都只能是过程与步骤,而不是始末的两端,在这点上,人们永远需要有清醒的认识。
日渐平庸的设计只能塑造出平庸的人类。因此,没有必要对人工智能的发展过于乐观,如果过于依赖它们去帮助设计师思考,并继续发展它们的这种能力的话,人类就不得不接受它们带来的模式化的结果,任由它们抹去世界上的一切差别,将世界变成由符号和代码组成的信息世界。日本设计大师原研哉曾说:“如果自己不能和科技一同进化,就无法获得真实的幸福[6]。”科技并不一定能给人带来幸福感,因为有太多的科技已经超出了可以被人感受到的程度了。
四、 结语
约翰·莫里森在论及设计的本源和目的时说,设计并不需要被精确定义,因为一旦设计被定义成一套固定的程序时,设计将被僵化[7]。他认为形成过多的设计理论和设计方法是有危险的,保持设计知识的活化性非常重要。人工智能所提供的各种集成化的模式选择对设计师来说并不总是意味着帮助,它也有可能限制想象力的进一步发展,使设计师失去探索各种可能性的耐心,使人类失去好奇心。
不客气地说,在有的智能应用中只能看到人类贪婪的欲望,因而人工智能背后的伦理问题更值得人们的关注。设计并不完全在于工具,人工智能的发展对于设计并不完全意味着是一件好事。如何将人道主义精神贯注到设计中,让设计师为了全人类的福祉去工作,将设计从风格和美学中解放出来,使之从“造物”变成“谋事”的哲学是设计师的努力方向。人工智能的发展同样不能以抹杀人类的个性和创造力为代价,这也是开发者应该注意的问题。
参考文献
[1] 腾讯科技. 为什么人工智能(AI)如此难以预测?[EB/OL]. (2014-12-29)[2019-12-10]. https://tech.qq.com/a/20141229/006887.htm.
Tencent Technology. Why is Artificial Intelligence(AI)so Unpredictable?[EB/OL]. (2014-12-29)[2019-12-10]. https:// tech.qq.com/a/20141229/006887.htm.
[2]sideidea独立黑客. 月入¥46w案例分享:Logojoy,智能 Logo生成器[EB/OL]. (2017-11-14)[2019-12-10]. https:// xiaozhuanlan.com/topic/5126498703.
Sideidea Independent Hacker. Monthly Entry ¥46000 Case Sharing:Logojoy,Intelligent Logo Generator. [EB/OL]. (2017-11-14)[2019-12-10]. https://xiaozhuanlan.com/topic/5126498703.
[3] 斯蒂芬?维尔勒. 论设计[M]. 来哲,译. 上海:上海书店出版社,2017.
VIAL S. Court Traite Du Design[M]. LAI Zhe,Translate. Shanghai:Shanghai Bookstore Press,2017.
[4] 马克·第亚尼. 非物质社会[M]. 藤守尧,译. 成都:四川人民出版社,1998.
DIANI M. The Immaterial Society[M]. TENG Shou-yao,Translate. Chengdu:Sichuan People’s Press,1998.
[5] 杰瑞·卡普兰. 人工智能时代[M]. 李盼,译. 杭州:浙江人民出版社,2015.
KAPLAN J. The Age of Artificial Intelligence[M]. LI Pan,Translate. Hangzhou:Zhejiang People’s Press,2015.
[6] 原研哉,阿布雅世. 为什么设计[M]. 朱锷,译. 济南:山东人民出版社,2010.
HARA K,AVE M. Dialogue for Design[M]. ZHU E,Translate. Jinan:Shandong People’s Press,2010.
[7] 约翰·莫里森,约翰·崔佛. 设计的能力与设计的意识[M]. 张建成,译. 中国台北:六合出版社,2002.
MORRISON J,TREVOR J. Design Ability and Design Consciousness[M]. ZHANG Jiancheng,Translate. Taipei,China:Liuhe Press,2002.
更多内容请关注“工业 工程 设计期刊”微信公众号。原推文连接请点击“阅读原文”。
END
主编 / 吴维忆
责编 / 常博林
美编 / 常博林