查看原文
其他

刘雅典丨生成式人工智能艺术形式与情感关系辨

文艺争鸣 文艺争鸣 2023-09-22
以微软Open AI发布的Chat GPT为代表的生成式人工智能(Artificial Intelligence Generated Content,AIGC),将计算机算法对艺术作品自动生成的规模和质量等都提到了一个新的高度,此前宽泛的“人工智能艺术”将转化为更具体的“生成式人工智能艺术”,可简称为AIGC艺术。尽管艺术生产并非AI的主要应用场景,但用算法合成艺术却也一直伴随着AI的发展。AI算法首先在合成音乐(听觉)、美术(视觉)艺术作品这些相对依赖“形式”的艺术体裁上,取得了较大突破,而合成不单纯依赖“形式”,还包含“语义”的文学文字作品取得较大成绩则相对较晚。当基于自然语言识别和机器学习的微软“小冰”、清华大学“九歌”)、美术(视觉)艺术作品这些相对依赖“形式”的艺术体裁上,取得了较大突破,而合成不单纯依赖“形式”,还包含“语义”的文学文字。“九歌”系统可以自动写诗时,一些人认为算法合成这类小型作品还可以,生成大型作品尤其叙事性文学作品就比较难——现在看来,这两个机器系统学习的是“小”数据、构建的是“小”模型,比如“小冰”最早是通过对1920年后519位现代诗人的上千首诗反复学习,学会自动写作白话新诗的——而微软Open AI研发出的GPT3“学习”了数千本电子书、维基百科的文字以及互联网平台上近1万亿单词,“掌握”了对自然语言的强大处理技巧,其数据之大、模型之大以及算力之大、算法之强等,已是曾经的“小冰”“九歌”望尘莫及了。在此基础上研发出的Chat GPT为算法合成大型叙事类文学作品提供了可能,其基于互联网的聊天机器人以及人机互动的运作方式,又为进一步抓取更多的数据信息、更全面的学习进而不断提升“创作”能力等,开启了无限可能;而其多模态又为文字与视觉(图片、视频)、听觉艺术相互自动转化、自动生成提供了可能——尽管目前可能还存在诸多不足。以上这些简单的描述表明:许多对AI算法合成艺术的认知和判断,其实是很难成立的,与人类传统艺术相比,算法现在做不到的事,绝不代表未来做不到,因为AI还正处于极速的发展之中,以Chat GPT为代表的AIGC艺术已经展现出了这种极速发展的远景。

一、计算机与情感关系辨

轻视计算机算法合成艺术一种最常见的认知,与所谓“情感”相关,而科学认识AI计算机与情感的关系,首先需要了解AI研发的基本路径及其发展历程。H.L.德雷福斯、S.E.德雷福斯的《造就心灵还是建立大脑模型:人工智能的分歧点》指出,在对如何构建AI的认知上存在两个不同派别,一派“把计算机看作操作思想符号的系统”“试图用计算机来例示对世界的形式表述”“把问题求解作为智能的范式”“利用逻辑学”;另一派“把计算机看作建立大脑模型的手段”“试图用计算机模拟神经元的相互作用”“把学习作为智能的范式”“利用统计学”,在学派上,前者是“哲学中理性主义、还原论传统的继承者”,后者“把自己看作理想化的、整体论的神经科学”。所谓“一派”试图“操作思想符号”,主要指第一代AI的研发符号主义或逻辑主义路径,曾经一度发展很快,后来则遭遇所谓“AI寒冬”;“另一派”力图“建立大脑模型”,主要指AI新一代联结主义的模拟人脑神经元运作机制的研发路径,在前一路径遭遇瓶颈之时异军突起,发展为机器学习尤其深度学习等,以超强的Chat GPT为代表的AIGC就是这一研发路径取得的重大成果,目前依然处于极速发展之中。大致说来,利用逻辑学、操作思想符号等“理性主义”路径及由此形成的第一代AI,或许还与“情感”没有直接关联;而利用统计学、建立大脑模型、模拟神经元的相互作用的“神经科学”路径及由此形成的新一代AI,则开始与“情感”产生关联。因为人的情感变化总会引发或落实为一定的神经元运动,而通过AI计算机“神经调节已经被模拟”——诸多关于算法合成艺术无关于情感的判断,其实往往还停留在对第一代AI的认识上,还不够充分了解新一代AIGC的运作机制及其基本机理。
在第一代AI研发中,不太关注情感的逻辑主义路径处于主导地位,但是,一些AI科学家和理论家也开始进行有关计算机与情感关系的探讨,其中一个标志性的成果是罗莎琳德·皮卡德1997年出版的《情感计算》(Affective Computing),把“情感”从“20世纪90年代末期的‘冷宫’中解救出来”,而AI科学家马文·明斯基、亚伦·斯洛曼则早就在AI理论领域展开了这方面的探讨,“他们一直把大脑看成一个整体”,斯洛曼于1987年发表的《动机、机制和情感》一文关注“情感在大脑计算架构中的作用”以构建“意识模型”。该文力图“将设计解答与人类动机结构以及与作为常见情感状态基础的计算机制联系起来”,探讨的是“心灵的计算理论”这种“一般性的理论”,这一理论处在“可以在常规计算机中的低层次上见到的以物理方式作出的显式表述”与“那些神经网络模型中研究的隐含的或分布式的表述”之间,而其基础是人的“心理过程”背后的“计算机制”,并且可以“通过实际的计算机模拟来检验这些想法”;人类情感活动的许多方面确实“不是设备精良的机器人所必备的”,但并不意味着情感的所有方面都不能计算、不能模拟,该文就探讨了“有关对情感的生成语法”问题,尽管“对情感状态来说,没有一种简单、有限的分类法能够着手去掌握这种多变性”
当然,这方面更富理论启发性的,是明斯基1985年出版的《心智社会》,该书把人的心智世界看成“大社会”,而“情感”与“智力(智能)”“思维”等一样,也是这个大社会的重要成员。许多否定AI算法合成艺术价值的论者,往往会认为“计算机可以通过推理解决问题”,但计算机本身无法“拥有”和“理解”情感,但明斯基强调:“问题不是智能机器是否有情感,而是智能机器是否能在没有情感的情况下拥有智能”——这实际上强调了AI机器“理解”情感与“拥有”情感有所不同,或者说,明斯基关注的不是机器是否“有”情感,而是在计算机智能化运作中“智能(智力)”“思维”等与“情感”之间的关系——他辩驳了对这种关系的两种错误认知:
一是“思维”与“情感”割裂论。明斯基指出,“思维和情感存在于几乎隔绝的不同世界中”,但是实际上,两者总是“相互纠缠”而“并非互无关联”,两者“以不同的头脑机器为基础”并“各自工作于特定的思维领域”,“情感”是“思维的变体或者说不同类型的思维”——明斯基将两者称为思维的不同的“原型专家”:“我们从设想一个简单的脑开始,这个脑由一些独立的‘原型专家’构成,每个原型专家都负责某种重要的要求、目标或本能,比如食物、饮水、庇护、舒适或防御。但这些系统必须融合”;从人的智能发育、发展进程看,“在婴儿时期,这些‘原型专家’相互之间几乎没有什么联系,但之后尽管它们之间还是互不理解,但它们在相互利用的过程中共同发展”——“情感”与“思维”虽然是不同的“原型专家”,但在实际的进程中,两者是融合、共同发展的。
二是过分夸大了“情感”的作用。明斯基指出:“我们认为情感比理性更为神秘和强大的另一个原因是,我们错误地把理性的许多成就归功于情感。我们对普通思维过程的复杂性都不太敏感,于是把常识这一奇迹看作理所当然。每当人们做出一些杰出的事,我们并不会试图理解思维到底完成了什么真正的工作,而是会把成就归因于任何我们能轻易辨认出的肤浅情感信号,比如动机、激情、灵感或者敏感性”——这在传统艺术理论中表现得尤为突出;明斯基强调“问题不是智能机器是否有情感,而是智能机器是否能在没有情感的情况下拥有智能。我怀疑一旦我们赋予机器改变自己能力的能力,就必须为它们提供各种各样复杂的制衡方式。‘像机器一样’这句话有两个相反的含义可能并非偶然:一个意思是毫不关心、无感觉、无感情、没有任何兴趣,另一个意思是一门心思投入某个单一的事业之中。因此,每个意思都不仅表现出不近人情,还表现出愚蠢。太投入会导致只能完成一件事,太分心则会没有目标地闲晃”。与此相关,明斯基还辩驳了“情感比人类思维的其他方面更复杂”的流行观点,强调“婴儿的情感特征相对简单”,而“成人情感的复杂性源于相互利用的网络积累”,“成人的情感和智力结构不过是从不同的视角描述相同的结构而已”,前者并不比后者更复杂,“我们智能发展与情感发展的差异不大”。“智能机器是否能在没有情感的情况下拥有智能”,明斯基给出的答案是否定的,即隔绝于“情感”,智能机器是无法拥有智能的;从艺术理论的角度看,我们的问题是:“艺术家是否能在没有智能(思维)的情况下创作出作品”,看来答案也是否定的——这关乎的其实正是德国古典美学涉及的感性与理性关系这一基本问题。
明斯基还用“重叠的思维”描述人脑活动的整体性,“我们都知道一个非常流行的观点:一个人可以同时用两种方式进行思考——一个‘右脑’方式和一个‘左脑’方式”,上面所说的不同的“原型专家”又表现为不同的“智能组”,“我们的脑中的确存在着一些特殊的智能组,它们具有类似人类的独立解决问题的能力,有时甚至可以解决一些在我们看来比较困难的问题。例如,在负责运动、视觉和语言的智能组中,可能含有某些特殊的程序,这些程序与‘你’用于自己有意识的思维的程序一样复杂……它们维持并使用了更多自己内部活动的完整记录。然而,这些智能组中发生的事情都被完好地封锁起来了,以至于你无法直接体验到‘你’如何分辨一只猫或一条狗,无法记起‘你’最后的几步路是怎样走的,也无法知道‘你’如何说话和听到声音的”——这与艺术创作论经常强调的“直觉”有关,直觉等确实具有相对的独立性,“就像一个家庭中的各个成员一样,不同思维可以一起合作、相互帮助,但每个思维仍然保留着自己独有的、其他思维永远无从得知的心理体验。几个这样的智能组可能会具有很多共同的智能体,但这并不会让它们对彼此的内部活动有更多的了解……我们脑中的程序就像公寓的租客一样,它们共用脑资源,但并不需要分享彼此的精神生活”,“要我们能够感知到自己脑中发生的每一件事情,我们的脑子就没有更多的空间用来思考了”,“要渗透那些抵抗的思维堡垒,要比我们想象中更加艰难”——情感思维不能把握理性活动的规律,理性思维也无法把握情感活动的规律,但在人脑实际的活动中,两者又是“一起合作、相互帮助”的——对于AIGC和艺术创作活动来说皆是如此。
明斯基还讨论了“非言语推理”问题:“我们通过操控记忆,用典型的事物代替特别的事物来进行推理。我说这些事是因为人们常常想当然地认为在所谓的抽象或逻辑推理方面,成年人比儿童的能力要强一些。这种理念对成年人和儿童来说都不公平,因为逻辑思维比常识思维要简单得多,也低效得多”,“这些‘常识’推理和假设不需要一点儿有意识的努力或活动,就会进入我们的思维。也许我们之所以意识不到,是因为它们的加工速度太快”——相对于理论活动,艺术活动就具有“非言语推理”的特征,我们古人所谓的“言不尽意”“只可意会,不可言传”等强调的就是这种特征。
明斯基在讨论人脑思维的“框架”中的“默认假设”时,提到了艺术活动,他先引用了文学家普鲁斯特的话:“幸亏有了艺术,才使我们不只看到一个世界、我们的世界,才使我们看到世界的倍增,而且,有许多个敢于标新立异的艺术家,我们就能拥有多少个世界”;然后分析指出:“如果我们不做假设,世界就不会有任何意义。知觉事物‘真实的样子’就像看没有信号的电视机屏幕雪花一样没有任何用处。真正重要的是要能够看到事物看上去像什么。这就是为什么我们的脑需要特殊的机器用独特的‘客体’来表述所看到的内容。”在艺术活动中,“艺术家的作品是如何激活那些栩栩如生的特征的呢?认为用很少的词语就可以精细地描绘一个人,这种想法是很荒谬的。相反,小说家所使用的语言会激活庞大的假设网络,这些假设已经存在于读者的是思维中了(引者注:这就是接受美学所强调的‘期待视野’),要创造这些幻象,也就是激活未知读者思维中的未知程序,并让这种程序服务于自己的目的,是需要很多技巧的。实际上,作家这样做的过程中,会让事情比现实还清晰。尽管语言仅仅是思维程序启动的催化剂,但其实现实也是:我们无法感受它们真实的样子,只能感受它们提醒我们的内容。就像普鲁斯特后面接着说的:‘读者在阅读的时候全都只是自我的读者。作品只是作家为读者提供的一个光学仪器,使读者得以识别没有这部作品便可能无法认清的自己身上的东西’”。这种“默认假设”就会形成一种“心理模型”,“一个人也可以拥有一个‘心理模型’,它能以脑中的机器装置或智能体的次级社会形式存在。这给我们提供了一个简单的说明,让我们可以理解‘知识’这一词汇的意义:杰克对于A的知识可以被简单地描述为心理模型、程序或智能组”——这就是格式塔心理学所强调的:与外在形式结构框架相对应的,是人的心理知觉模式,两者是一种异质同构关系,人因此由艺术作品的形式结构可以产生美感。
明斯基强调:“我们的科学、艺术和伦理技能并非起源于毫不相干的理想真理、美感或美德,而是一定程度上源于那些我们努力安抚或取悦的影像,这些影像在早年时期已经建立好了”;而艺术美学与科学、伦理学割裂开来,恰恰是西方近现代美学的基本趋向,充分结合当今AIGC艺术实践,则有助于我们超越这种割裂。有研究者指出:“情感表达是一个多学科交叉的研究方向,现有的从计算机的角度进行情感表达的工作大多都未曾引入脑科学、心理学及艺术学等产生的丰硕研究成果,这极大地限制了图像情感表达领域的发展、推进和完善。”而“在进行艺术作品创作时,艺术家不仅需要使用艺术元素,而且要研究艺术原理,即把艺术元素进行组织与排列以产生特定语义与情感的各类规则。因此,使用艺术原理作为描述情感的中层特征,可能会对情感识别产生一定的帮助”4——由此来看,“艺术原理”方面的研究,对于推进AIGC“识别”“表达”情感或用算法合成具有情感表现性的作品等方面研究和研发也有重要助益。

二、艺术的形式结构与情感关系辨

一般认为,计算机语言(代码等)就是一种“形式化”“模型化”语言,但是,第一代遵循符号主义、逻辑主义路径的AI计算机语言才是典型的“形式化”,或者说是一种“逻辑式”的形式化语言,这确实与情感无直接关联;而联结主义的机器学习、深度学习的新一代AIGC则相对而言不是这种“逻辑式”的形式化语言,比如GPT系列所学习的就首先是人的“自然语言”,它也会形成某种“模型”或“框架”,但却是通过“学习”而归纳形成的“非逻辑式”的“模型”或“框架”——这与艺术作品在形式结构上的“框架”比较接近,并与人的心理、情感结构存在对应或同构关系——格式塔心理学美学对此多有揭示,而克莱夫·贝尔用有意味的形式可以激发审美情感来描述这种动态同构关系。
博登指出:“人本心理学家采用的许多理论概念(包括动机、意向、情感、情绪、性格和个人理想)明显表现出控制和组织特征”——而艺术表现的恰恰是具有“控制和组织特征”的情感,并且是通过与之对应或者格式塔心理学所谓与之“同构”的形式结构来表现的——这又首先突出地体现在音乐上。斯洛曼指出:“听音乐可以引起身体的运动,同时还产生大量的心理‘运动’:记忆、感觉、联想的波动——所有这些都在音乐的统摄之下。对这些过程的解释,可以借助于这里未讨论的智能系统设计的种种方面,诸如对联想记忆的需要,控制身体运动时进行整合和同步化的微妙方式……音乐似乎驾驭了这样一些过程”,“它们生成的情感过程也可能同样复杂多变。从这个意义上说,这些机制是生成的”——由音乐符号构成的形式结构是静态的,而与之对应的人的心理“运动”是生成的或动态的,两者是“异质”的,但却存在“同构”关系。P.M.丘奇兰德《认知神经生物学中的某些简化策略》分析指出:
正像音乐家在将他所听到的音乐频率调和的内部结构的一般性理论内在化之后,就能学会识别这些音乐频率调和的构成一样,我们也能在将我们的主观感觉特性的内部结构的一般性理论内在化之后,以内省方式学会识别这些感觉特性的n维构成。这种类比更大的优点是取代这样一个可预测的响应:这种对“内部世界”的再构想会剥夺它的美丽和它的独特个性。这样做也许只不过和通过频率调和理论对音乐现象的再构想剥夺音乐的美丽和音乐的独特个性一样而已。与此相反的是,这种再构想打开了许多否则依然关闭着的美学之门。
缺乏“独特个性”,是批评AI机器算法合成艺术的常见说辞,虽非绝无道理,但仅仅停留于这种认知,却关闭了美学探索的另一扇门。博登指出,有一种攻击图灵立场的观点认为:“一台阅读十四行诗的计算机,不管是真有智能,或者仅仅能模仿智能,都绝无存在的可能。这种攻击所依据的常常就是图灵文章所驳斥的那些观点的变种:行为、创造性以及哥德尔定理的‘非形式特性’(不能化简为规则的特性)的观点”——图灵强调事物可以包括“可计算性”的因素,但同时也承认存在“不可计算性”的因素:音乐具有自身的可以化简为规则的特性,但音乐家创作所形成的“音乐的独特个性”则是一种“非形式特性”;当然,另一方面,日常生活中的单一情绪也具有“非形式特性”,这是消极的,而音乐家通过艺术创造所形成的“非形式特性”则是积极的——合而论之,艺术作品是通过一定的形式结构来表现情感的,严格地说表现的是情感的运动,而不是单一的情感如愤怒的情绪等,并且表现的是情感的合规律性而具有“控制和组织特征”的运动过程,而不是情绪的无序波动或发泄过程。
艺术活动中的情感问题,其实涉及紧密联系在一起的两方面关系:一是情感与理性(思维等)的关系,二是情感与形式的关系——贝尔提出的“有意味的形式”与此相关:“一切审美方式的起点必须是对某种特殊情感的亲身感受,唤起这种感情的物品,我们称之为艺术品。但凡反应敏捷的人都会同意,由艺术品唤起的特殊感情是存在的。我的意思当然不是指一切艺术品均唤起同一种感情。相反,每一件艺术品都引起不同的感情。然而,所有这些感情都可以被认为是同一类的”——而这关乎“将艺术品与其他一切物品区别开来的性质”,“什么性质存在于一切能唤起我们审美感情的客体之中呢?”贝尔认为就是“有意味的形式”:“在各个不同的作品中,线条、色彩以某种特殊方式组成某种形式或形式间的关系,激起我们的审美感情。这种线条、色彩的关系和组合,这些审美地感人的形式,我称之为有意味的形式。‘有意味的形式’就是一切视觉艺术的共同性质。”“形式的组合表达了艺术家的感情”,而这就是“审美感情”,而这种由“形式的组合”表达出的“感情”,就具有博登所谓的“控制和组织特征”——作为反例,贝尔《急就章》指出,女诗人柯勒律治“从未创作出真正的艺术作品,因为她无法把握情绪,或者,如果她把握住了(grasped),也无法控制住(hold)它们”——这实际上强调的就是“真正的艺术作品”所表达的感情即审美感情具有“(可)控制的特征”,并非直接宣泄出来的感情或情绪。
贝尔认为:“未来派的绘画作为艺术品是不足以称道的。但是,人们之所以对其评价很高,却不是从艺术角度来评价的。一幅未来派的杰作,就像一篇好的心理学文章那样成功;它能通过线条、色彩来揭示一个有趣而又复杂的心理状态。如果未来派艺术看上去似乎不那么成功,我们就应对此做出某种解释。未来派艺术并非意在表现其艺术性,而在于揭示各种不同的心理状态”——这体现的是一种贝尔所反对的“心理主义”的艺术观,但是,另一方面,贝尔却又说:“在我看来,有这样的可能性(绝非肯定):那个被创造出来的形式的感人之处在于它表现了创作者的感情。大概艺术品的线条和色彩传达给我们的东西正是艺术家的感受吧”——但是,他又说:“我们只知道艺术家创造出了什么作品,却不能确切地知道他的感受”,似乎自相矛盾,并且所谓“感受”难道不是一种“心理状态”?贝尔解释道:“艺术家试图表达的东西是他的情感,而不是对他创作的主要目的或直接目的进行的说明。如果一个艺术家的感情是从对形式或形式之间的关系的知觉中而来,或者说是通过它们而产生的,那么,自然而然地,他会用他从中获得感情的那种形式来表达这种感情”——由此来看,贝尔所反对的是对感情、心理状态的“说明”而不是“表达”,“对形式或形式之间的关系的知觉”被格式塔心理学称之为“知觉模式”,艺术家所表达的毋宁说就是这种“知觉”,而非普通的情绪或心理状态。“一个艺术家无疑地常常会对这类日常所见的东西产生感情,但是在他产生审美感情的时刻,他的审美视野中物体绝不是激发联想的手段,而是纯形式”,如果一个画家画一个物体是为了“说明”自己的感情,那么,欣赏者就会通过这个物体“联想”到这种感情——而这并非“审美感情”,贝尔所批评的未来派画家就是如此。
以上强调的可谓有“情感”而无“形式”,贝尔分析蒙田散文时指出:“专业人士的文学作品是建立在思想或情感之上的巧妙而抽象的上层建筑。蒙田希望将最初的想法或感觉放下,因为它炽热地从头脑中冒出来。而且,由于原始的思想和感觉总是以感觉的力量出现,所以他赋予它们感觉的形式”——许多研究者由此认为,反对心理主义的贝尔似乎是形式主义者,但是,另一方面贝尔又强调:“有一位很优秀的艺术家曾就这个问题对我说,他试图在作品中表现的是‘对形式的带感情色彩的把握’”,他分析指出:“后印象派绝不仅仅在技巧上独树一帜。虽然塞尚确实发明了一种能极巧妙地符合他们创作意图的技巧,这种技巧也或多或少地为他的大多数追随者所采用和发挥。然而,重要的问题并不在于一幅画是如何画出来的,关键是它是否激发了人们的审美情感”,而“没有价值的后印象派绘画”之所以失败,是因为“它们的形式没有意味,也不能引起人们的审美反应”;“有意味的形式把其创作者的感情传达给我们,而‘美’则不传达任何东西”——贝尔显然也反对有“形式”或“形式美”而无“感情”的形式主义艺术观,他还强调:“使我们产生审美快感的感情是由创造形式的艺术家通过我们所观赏的形式传导给我们的。如果事实正是这样,那么,无论传导给我们的是什么感情,它肯定是一种可以通过任何形式表达的感情,即可以通过绘画、雕塑、建筑、陶器、纺织品等形式表达出来的感情。”艺术形式结构所传导的感情具有普遍性,而不局限于特定的体裁或形式。
贝尔最终强调“感情”与“形式”是“同一”的:“我认为,一切艺术问题(以及可能与艺术有关的任何问题)都必然涉及某种特殊的感情,而且这种感情(我认为是对终极实在的感情)一般要通过形式而被知觉到。然而,这种感情从本质上说来还是非物质的,我虽然无绝对把握,也敢断定:这两个方面,即感情和形式,实质上是同一的。虽然很可能会因为人类的软弱而把它们分裂为两种截然不同的东西,但就事情本身,它们还是一致的。这两个方面会导致两种为我们熟悉的问题,即纯粹的审美问题和如何准确再现的问题”——这种将感情与形式同一诉诸“终极实在”的说法难免具有神秘性,贝尔更具经验性的说法是“赋予形式以意味的正是这种感情的本质或目的”,“有意味的形式充满了一种力量,这种力量能唤起所有能感受到形式意味的人的审美情感”——能证明“感情”与“形式”之“同一”的,或者把两者连通在一起的,正是“意味”,或者说,“意味”就是连通“情感”与“形式”而使两者“同一”的“中介”:一方面,艺术作品的结构形式具有“意味”,就表明它必然会唤起相应的审美情感,从而形式与情感连通起来了,而如果艺术作品的形式没有“意味”,则表明“形式”不能唤起审美情感,从而与“情感”是割裂的;另一方面,“形式的正确就难免是感情正确的结果”,“正确的形式是受感情支配和制约的”,艺术家的“情感”只有物化为正确的形式,从而使其艺术作品结构形式具有“意味”,才能证明其“情感”是“审美的情感”,而非普通的非审美的情绪,如此,情感就与形式连通起来了,而艺术家不能把自己的情感“正确”地物化而使作品形式获得“意味”,就表明其情感与审美的形式是割裂的。
除了情感与形式的关系外,贝尔《急就章》对情感与理性(思维等)的关系也有所分析:他一方面强调“感觉是唯一的向导(Feeling is the only guide)”,另一方面又强调“智力的力量是唯一的向导(force of intellect the only guide)”——这与明斯基所谓的“情感”与“思维”皆是“原型专家”“智能组”是相近的说法。贝尔还指出:“华丽的画面中又一种理性的(rational)(如果是无意识的)秩序;在它们的继承中存在一种必然性,这与逻辑必然性(logical necessity)密切相关”;“要达到伟大的形式,既不需要科学,也不需要传统,而是需要强烈的感觉、旺盛的思维和想象力。缺乏形式(formlessness)不是强烈反抗迷信的标志;这只是头晕目眩的表现”——总体上是强调“感觉(感情)”与“智力(理性、思维、逻辑)”统一,可以说有意味的形式或形式富于意味就标志着这种统一——这与明斯基所强调的“情感”与“思维”的融合、共同发展是相通的思路。再如,一般认为,易卜生戏剧是靠政治性的“内容(理性观念等)”取胜的,而贝尔强调:“没有比形式的完美更明显地证明易卜生艺术的伟大”,“他的戏剧是形式的模型(models of form)”——由此可见,要创造出有意味的形式,也需要感情与理性思维的统一。此外,《急就章》还强调了艺术形式的创造性、建构性:艺术想象力是一种“建构性的(constructive)”想象力,“伟大的想象力是建筑;它不断地幻想,直到构成一个辉煌且可以理解的整体——一座有效的空中城堡”——一个艺术家仅仅停留于随意想象、个人性的情绪状态中,是无法获得这种“建构性”进而构建起有意味的形式这种想象力“城堡”的。

三、生成式人工智能艺术的发展趋向

以Chat GPT为代表的AIGC开启了AI艺术新的发展趋向,在艺术原理上对相关问题加以辨析,有助于推动AIGC艺术的进一步大发展。否认算法合成艺术的价值的再一说法是:计算机只是对人的艺术的“模仿”,也正因此与情感无关——贝尔对艺术的“模仿”也有所分析:“实际上艺术品的线条、色彩及空白都是艺术家大脑思维的产物,它并不再现于仿制者的大脑中。人的手不仅仅服从大脑的支配,要以某种特殊方式画出线条和色彩,如果不在某种特殊心理活动的指导下,则将是软弱无力的。我们所见到的两个作品(原作与复制品)之所以不同,是因为支配艺术品创作的东西不再支配复制品的制作。我认为,那个支配艺术品创作的东西实际就是使艺术家有能力创作出有意味的形式的感情”——这似乎强调艺术不可模仿或者模仿并无艺术价值,但他又指出:
能够感动我们的精彩仿制品都是由具有这种神秘感情的人创造出来的。精彩仿制品从来都不企图毫不走样地模仿。我们仔细观察总会发现它们和原作有着很大的不同。也就是说,这些仿制品的作者没有单纯地模仿,而是将别人的艺术翻译成自己的语言表达出来。创造有意味的形式绝非依赖于鹰一般宽阔的视野,而是依赖于某种奇特的心理上和感情上的力量……这种只有创造形式时才有而模仿形式时则没有的东西是什么呢?……将创造者与模仿者区分开来的优势什么呢?如果这种东西不是感情又能是什么呢?难道不正是艺术家创造的形式表达了某种特殊的感情才使得这些形式富有意味吗?难道不正是由于这些形式唤起并加强了某种感情才使得它们连贯起来了吗?难道不正是由于这些形式能够交流感情才使得我们为之感到如痴如狂吗?
那么,AIGC能不能成为人的艺术品的“精彩仿制者”?贝尔强调“精彩的仿制”不是“单纯地模仿”——从模仿过程中所模仿的对象的“形式”有所不同、“情感”也有所不同看,或许对此可以做出更清晰的阐释:从“形式”看,AIGC学习所掌握的并不只是高度形式化的“格式(format)”,而且还包括运用这些格式进行创作的“技巧”:比如清华大学“九歌”系统所掌握的就不仅仅是古典诗词的平仄“格式”,通过对很多古典诗词的学习、模拟,它还掌握了对平仄格式的“运用技巧”,所以才能自动合成诗词作品。从AI的研发进程看,传统遵循逻辑主义路径的AI算法总体来说只能掌握或模仿“格式”,而无法掌握艺术创作的“技巧”,但是遵循联结主义的新一代AI尤其AIGC可以通过“学习”掌握这种“技巧”。“格式”是相对固定的、有限的,而艺术具体的形式结构则是不固定的乃至无限的。比如,符合平仄关系的汉字组合几乎是无限的;再如,西方古典绘画的焦点透视结构,只掌握这种透视结构的“格式”,是画不出好的画的,实际绘画作品的透视结构又是千变万化的。也正是由于艺术形式结构的不固定性,才使这种形式结构与同样具有不固定性的人的心理情感运动产生“同构”关系——在此意义上,AI机器学习所模仿就不是固定的格式,而毋宁说是人的“知觉的模型(model)”——以Chat GPT为代表的AIGC就是如此。
再一否认艺术“模仿”的价值的说法是:缺乏“个性”。贝尔强调:艺术表现的是“某种深刻的和普遍的感情”——这就是康德所讲的审美的“共通感”。“艺术的本质在于激发审美情感,如同对宗教情感和追求真理的激情一样,都是高于民族的。艺术的至高无上性在于:艺术、真理和宗教共享着一种吸引着我们不受时间、地区、公众和个人利益所束缚的力量。一件好的艺术品从审美上满足我们,正如一道真命题从理智上满足我们,无论它是出自德国或是别处:是谁创作的、什么时间创作的以及在哪儿创作的对任何人来说都不重要,除了考古学家。”因此,“从某种意义上说,最伟大的艺术是非个人的(impersonal)。我们没有荷马和索福克勒斯的传记,也不需要它们。我们对弥尔顿和济慈有所了解;如果一无所知,我们就不能享受他们的作品吗?我们喜爱《失乐园》,并不是因为它揭示了米尔顿的什么。《希腊古瓮颂》也独立于作者和他的生活环境,是一件艺术品,本身就完成了”。由此可以说:有意味的形式所激发的审美情感就是一种“非个人的”情感。贝尔认为“我们只知道艺术家创造出了什么作品,却不能确切地知道他的感受”,而这种“感受”就是“个人的”——这种“个人的”感受并不可能通过艺术作品完全传达出去,因而也无法使作品欣赏者完全感受到,而欣赏者在欣赏作品中也会产生“个人的”情感。因此,与具有意味的形式结构相应的情感结构或心理知觉模式,具有共性,所以能唤起欣赏者的审美情感;而艺术欣赏者的情感状态与艺术家的情感状态不尽相同,又表明每个人的情感具有个性。因此,艺术创作者的情感状态具有个体性、普遍性,艺术欣赏者的情感状态也具有普遍性、个人性,而有意味的结构形式则主要具有普遍性(因而可计算)——基于海量数据的AIGC合成的艺术作品结构形式同样可以具有这种普遍性(并非逻辑形式的普遍性),但也可以唤起欣赏者具有个人性的情感状态——由此来看,那种认为算法合成的艺术品因为不具有个性而不能唤起或激发人的富于个性的审美情感的说法,并不必然成立。
当然,说联结主义的机器学习、深度学习等与情感有关联,还只是从总体上说的,即在一般意义上对人脑神经元系统运动的模拟。但是,脑科学已较早地证明:人脑的左半球与右半球的功能不尽相同(参见前文明斯基的分析),一般认为,右半球与感觉、知觉相关,因而也与情感相关;而左半球则与抽象认知相关,因而与情感无直接关联;新近的脑神经科学甚至发现了人脑处理情感的细胞即“梭形细胞”——至少大致可以说:人脑有关“概念”“语义”等的神经运动,与有关“情感”的神经运动不尽相同,属于不同的“智能组”——AI“情感计算”就关注这两者的差异,试图“识别”人的情感,模拟与情感相关的神经元运动进而“表达”情感——Chat GPT聊天机器人等技术就与此相关——而这无疑进一步推进了计算机与人的情感的关联。
贝尔强调“能够感动我们的精彩仿制品都是由具有这种神秘感情的人创造出来的”,要使仿制品精彩,仿制者就必须带入自己的感情。实际上,艺术家都是从仿制或模仿开始自己的艺术学习和训练的,这也可以说是对历史上已存在的情感表现方法(流传下来的经典艺术品等)的学习,而只有根据现实的情感活动及其规律创造出新的表现方法,才能成为真正的艺术家。与此相应,Chat GPT所掌握的也是历史上已存在的情感表现方法——许多论者就此认为AI机器无法掌握与历史有所不同的人的现实的情感及其运动规律——但是,“情感计算”尤其Chat GPT聊天机器人技术等,可以弥补这一不足。在人机互动中,聊天机器人通过人的声音、面部表情、身体姿势等识别出人的情感(情绪)并做出回应,已取得较大进展。可以设想:机器人在游戏中与人互动,当也能通过人的动作识别出人的情感——此类动态、互动的情感计算,当有助于AIGC在与现实的人的互动中掌握人的情感变化规律;而对人已创造出的文字、图像等符号的学习,则有助于AIGC掌握对“过去的人”的情感变化的规律——即使认为艺术是表达人的情感的,那么,人的情感运动也是存在规律的,而对这种规律的掌握,AIGC潜能极大,大有可为。从AIGC的发展看,清华大学的“九歌”系统还只是通过对人的已有文本的学习获得写作能力的,并且对这些已有文本的“情感计算”技术并未被充分使用,如果对此加以充分使用的话,“九歌”机器系统对情感的表达能力当有较大提高,再进一步借助聊天机器人所掌握的现实的人的情感运动规律,机器“表达”情感的能力必然得到更大程度的提高——AI计算机“识别”并“表达”人的情感的能力的潜能可以说是无限的——Chat GPT等AIGC已初步展示了这种远景。
聊天机器人技术可以“识别”人类聊天者的感情或情绪,因而可以与人产生“共情”——这一般被称为“人工共情”,不同于人与人之间的共情。否认AI机器可以与人产生共情的常见理由是:机器无法产生与人的情绪完全一致的情绪——那么,一个人A与另一个人B产生共情,即通常所谓的“感同身受”,是否就意味着A感同身受的情绪与B的情绪完全一致?根据基本的经验,答案显然是否定的。从艺术史经验看,比如中国古代的男诗人写过不少表现女性感情的闺怨诗,上乘之作比如李白的一些闺怨诗是很能传达女性特有的感情的,但我们能由此说:李白“具有”因而表现、传达了与女性完全一致的感情或情绪吗?如果艺术家通过有意味的形式所传达的并非其“个人的”感受的话,那么,我们为什么非要求AIGC机器“具有”这种“感受”?更具说服力的现实例子是精神病治疗活动中的共情现象,在医患关系中,医生只有较准确“识别”患者的心理感受,才能对患者进行有效的治疗,但是,这种“识别”难道意味着医生必须“真实地”产生与患者完全一致的心理情绪?如果真是这样的话,即医生被完全带入患者的情绪,对于医生来说恰恰是非常危险的——好莱坞一些精神病题材的电影对此有所反映。因此,在现实的精神病治疗活动中,医生尽管一方面确实需要与患者“感同身受”而产生共情,但是,另一方面,有效的治疗又需要医生要“像机器一样”无动于衷而不被完全带入患者的情绪或心理状态中——由此来看,聊天机器人虽然不“具有”人的真实的生物性的心理感受,但可以“识别”或“理解”人的心理感受,并由此可以对人产生心理调节或抚慰作用。
综上所述,只有在充分理解艺术形式与情感关系的基础上,才能科学认识AIGC机器与人的关系进而AIGC艺术与人的审美情感的关系:AIGC情感计算不可能完全识别生物性个人的心理情绪,但是,一个生物性个人实际上也不能完全识别另一个人的心理情绪——尽管如此,这并不妨碍一个艺术家可以部分地识别进而表达另一个人的情绪或感情,AIGC机器同样可以做到这一点。另外,艺术家的个人感情、情绪确实是驱动其进行创作的动力之一,但是,如果这种感情、情绪仅仅停留于非建构性的状态的话,艺术家的创作是不可能取得成功的,而艺术家创作取得成功的重要标志,在贝尔看来就是创造出有意味的形式,这种形式固然传达了审美情感,但这种审美情感却是“非个人的”和“建构性的”——如果说AIGC不可能完全模仿艺术家个人的感情、情绪的话,但却可以模仿这种具有普遍性和建构性的“非个人的”审美情感,并且是通过学习并模仿艺术家所创造出的有意味的形式结构来实现的。以Chat GPT为代表的AIGC在把握并运用艺术形式创作技巧的规律性和人的情感运动的规律性上具有巨大潜能,在人机互动中,这也将有助于人类艺术家掌握并运用这些规律,进而提升创作水平。

刊于《文艺争鸣》2023年第7期。

本文系未编排稿,成稿请查阅本刊。


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存