查看原文
其他

【课程】优秀通识课程论文佳作展 | 李玥涵:“机械复制”时代的“抒情诗人” ——文学创作与文化研究视域下的人工智能诗歌批判

李玥涵 复旦通识教育 2022-07-11


【编者按】为了提升复旦大学通识核心课程质量,加强复旦大学本科生写作能力的培养,提升核心课程学生修读过程中对于写作的自觉性,自2017-2018学年第二学期开始,核心课程办公室组织学期优秀通识课程论文的评选。


2020-2021学年第一学期的优秀课程论文评选中,共有72篇优秀课程论文和作业参加评审。最终评选出优秀通识课程论文一等奖3名、二等奖5名和三等奖6名。


本期文章是获得本次课程论文评选一等奖的中国语言文学系本科生李玥涵同学的作品。



# 论文标题:“机械复制”时代的“抒情诗人”

——文学创作与文化研究视域下的人工智能诗歌批判

# 作者:李玥涵  中国语言文学系

# 课程名称:从计算到智能

# 任课教师:陶晓辉 危辉


# 任课教师推荐语


      对人工智能诗歌进行了批判。首先作者立下靶子,人工智能诗歌并不是伪造之诗,即并不具备诗学上的价值。作者讲述了目前最成功的中文现代诗的人工智能创作者——微软小冰的故事。它出版的诗集仍需大量人类智慧的介入,甚至是决定性的介入。作者认为,微软小冰的创作过程更是一种词语组合游戏,从无限多种组合中找出人类的“灵光”才是智能的关键,也是人工智能所缺乏的。微软小冰的诗歌处处呈现出偶然随机性的组合,从而重复且空洞。作者再回视人类诗歌发展的每个重要节点,无不处处闪烁冲破已有框架创造新鲜语言结构的光芒。从这个意义而言,人工智能诗歌与人类诗歌是反其道而行之。


      在第二部分,作者简要分析了人工智能诗歌的创作机制。这部分是体现新生的算法、计算模型的阐述。作者也较好地把握了内容的深浅和范围。其中一部分是当今最前沿的深度学习的知识。作者对这种技术面临的根本性问题进行了较中肯的阐述,本质上扼杀了诗歌必需的语言表达句法句式上的探索,人工智能无法回答诗学的悖论,即既需要流畅又需要陌生。


      随后作者选择一首诗具体分析,指出诗作中存在明显的词语不通,言语凌乱,逻辑线索缺乏等问题。作者更进一步指出这是因为当今计算科学的局限使得人工智能诗歌只能完成词级别的联系,而无法在句子或更大文本范围上的意义关联。这样的评述相当精辟,体现出作者在计算机领域也有较深厚的知识积累和领悟。


      随后的批评更加尖锐,小冰诗作中的虚词、状语难免其思想的贫乏。作者更深入地分析其根源在于小冰模仿的诗库已落后当今的时代,也落后中文现代诗人的发展状况,这无疑也相当中肯和有见地。


      然后作者引入一首古希腊诗人的译作,表达的意象类似前面输入小冰的图片。作者逐词逐行地剖析这首诗,详述各个精妙动人之处,显示出作者丰富的文学知识和高超的文学分析能力,两相比较凸显人工智能诗歌与人类诗歌的杰出代表之间的巨大差异。作者还很关键地指出人工智能诗歌的缺陷是根本性的,不是可以通过语言库的扩充或算力的改进而可以克服的。


      第三部分作者进一步挖掘人工智能诗歌问题的根源。作者引用了大量名人的论述来加强自己的观点即人工智能缺乏主体性,缺乏作诗的动机。它不知为什么而写诗,诗歌表面上是文字的排列,本质上需要诗人心灵的震撼和生活阅历的付出。这一段写作没有前面流畅,引用名人名著过多,与自己文字的融合不够自然流畅,但作者展现出相当丰富的文艺学、诗学理论上的素养,也对这些理论流派各自的特点有所提及,也再次阐明无论从哪个诗歌流派来衡量人工智能诗歌都难以称为好诗。


      全文到此已相当精彩,后面的5、6页续貂之嫌,将文章的说理引向玄奥。当然也不无道理,比如人类诗人有创作诗歌的“元语言”,而人工智能缺乏,这也是人工智能诗歌流于表面形式的根本原因之一。在结构与功能一节,作者的讨论大量引用许多语言学哲学大家的句子,已显艰深晦涩。


      总体而言,全文精彩纷呈,佳句迭出,知识丰富,说理透彻,议论深刻入微,稍显繁长。

——陶晓鹏

# 评委代表评语


       诗歌是人类心灵和情怀的抒发与激荡,诗歌本应该充满着热列、流躺着情感,而人工智能组合的诗,却是机械复制与材料罗列的产物,既没有温度、也没有激情。李玥涵同学的通识课程论文,对人工智能“造诗”的机制、诗的抒情主题、功能结构、艺术审美等方面所存在的诸多问题,进行了深度剖析和反思,指出人工智能的文化产业追求,会消解文学的神圣性与艺术价值,最终将导致诗歌创作走向死亡。

——卢宝荣

# 学生获奖感言


     通识教育给我的礼物是在文章中进行学科交叉研究的可能性,将文科专业知识在另一新鲜领域进行反思,会达成比二者之和更出彩的效果。在从计算到智能的课堂上,老师从语言出发带我们认识计算语言与人工智能的发展脉络,并从实践层面上使我意识到一个自动写作机器的生成与更迭,鼓励我们带着批判意识去发散思维。于是我从诗学视角出发,经过反思,认为目前的弱人工智能之作,在文学性上存在某些根本上、伦理上的缺项,然而这却在计算机专业研究著述中缺乏一些更深层的提及。因此,我们这些学生才能大开脑洞去想象、去解释、去纠偏。虽然论文很顺畅地写完,但作为一个普通本科生,我缺乏底气,于是课后询问老师我的视角是否可信,老师说,其实他对我专业一些理论的了解也不够多。这让我更能坚决地感到,当一个学科或领域的发展进入某种瓶颈,汇入新的思维是必要的,而这其中更重要的是进行研究的人去实践对多个学科的亲身经历、学术体验。我在复旦诗社写诗,身边软工、计算机的同学创作有着新奇感,而且,文学体验为他们自身的学科体验带来了动能。而在通识教育答辩会上,明显能感到,除了沉浸式的钻研爬梳,另一种令人期待的研究方法,是引入与延申。而这背后,是主动向局限之外开敞,将我们自身的执着和使命,放置在更广阔的彼时与远方。

——李玥涵  




“机械复制”时代的“抒情诗人”

——文学创作与文化研究视域下的人工智能诗歌批判



摘要:本文通过分析微软小冰诗歌软件生成的诗作,对比诗人实际创作,并结合文艺学与诗学理论、结构主义思想等,试图证明人工智能诗歌从主体性、生成机制、内涵深度到系统性、功能效果上与文学作品的本质区别。同时,反思文化工业中自动生成文学作品本身的脱节与空洞,呼吁人们提高对人工智能创作的警惕性、重估文学本身的价值,重视人工智能时代文学创作的新使命。


关键词人工智能诗歌 机械复制 结构主义 文化工业



正文


      本雅明在《发达资本主义时代的抒情诗人》讨论了波德莱尔在巴黎的现代性体验与抒情,认为他建构了一个反讽的乌托邦:碎片化,物质性,丰富性,强烈刺激、转瞬即逝的紧张。在当下,人工智能诗歌的写作者“计算机”,试图在语料库中生产出颇具蒙太奇性质的机械复制之诗,然而,这些语料与其运用,呈现了数字化的文学模式,在这之后,究竟数字与文学能实现交融,是一个问题。本文认为,当人工智能成为“抒情诗人”,其实是一种伪造和反讽,重新提示了当下文学作者与读者的警惕。本文将以微软少女诗人小冰为例,从文学创作、神话原型、结构主义诗学与文化工业理论等视角,展开批判与反思。



一、    提问:人工智能还是伪造之诗


      “智能”,即机器真能如人类大脑般进行感觉、思考和审美;“伪造”,指诗歌貌似是诗,实则并不具备诗学上的净化与析理价值。提出此二元对立,是立下批判与反思的靶子。人工智能诗歌创作,从人工智能发展的第三次高潮中产生。2017年,微软开发名为“小冰”的人工智能写作程序,并出版由人工智能创作的第一部诗集《阳光失去了玻璃窗》。其中,小冰学习了519位汉语新诗诗人的作品,并由万次的迭代,产生了万首诗,最终有139首诗被选入诗集。


      从此书的出版,不难发现有趣的悖论:人工智能通过机械性的、大量数据的输入与输出产生诗作,却需要人为地从中挑拣最合适的一百多首,才能制作成诗集。可猜测:此种生产的结果乏善可陈;同时,仍需要人类主体的审美介入,去参与对具有文学性的样品的筛选。换句话说,这本诗集并不属于人工智能本身,而是属于编者和语料库中的诗人,是“人”在小冰作品中选择了更适合作为“诗”的东西。


      因此,在用户使用该软件时,当“小冰宣布放弃她创作的诗歌版权”,这一说辞实则具有迷惑性,即,开发者事先肯定了计算机是具有其主体性的创作者,把“小冰”当成了真的“人”,所以她有机会“放弃”,这是用于推销的“大话”。对此,我将提问:由吸纳语料、依靠神经网络中的关联度,来随机生成的诗,何来创作动机、创作意图、书写行动,因此又何来著作权。进一步说,著作本身,是否仅能作为一种模式化中的“词语游戏”,是由于用户的介入,使得计算机从无数种“方案”中“抓取”了合适的组合,形成了“分行句”,而不是“诗”。笔者认为,需要质疑其创作伦理,同时,需要看清其貌似智能,实则僵化。


      提到人工智能造诗,需要提及博尔赫斯小说集《小径分叉的花园》中的一篇《通天塔图书馆(Babel Library)》。通天塔图书馆具有永恒性和无限性,六面体回廊构成了无限上升的无尽通道,图书馆涵盖的一切书籍,容纳着“所有可能排列组合的语言和文字”,因此藏有这个世界所能延展出的一切知识——就像“无限猴子定理”,给猴子一台打印机,只要时间无限,它迟早能打印出任何文本,包括莎士比亚全集。然而,即使这样,这种知识与真理,却无可被人类穷尽或触及。因为,所有符号的排列几乎都有不完整和混乱的性质,“文字的应用纯属偶然,书籍本身毫无意义”。最终,人在图书馆里用尽一生,也可能找寻不到一本具有信息价值的书。这提示了一个现象,即语言组合递归生成网络的无限性,也提示,需要从庞杂组合中找到我需要的那一束“灵光”,是困难的。



      将通天塔引申至小冰的诗,当我们去发掘其具有深刻文学性的那种组合,我们遇到的却都属于偶然巧合,而更多时候,小冰写出的诗歌,呈现着未经审视思考的无序性。即使看似华美或清新,实则呈现出一种自我重复与空洞伪饰。


      而反观现实,为何在当下,早期浪漫主义抒情诗歌被指责、被颠覆?因为文学语境中,诗歌发展变迁至今,作家的地位与社会作用,让他们不能再重复以个人命运为中心的“忧伤”主体,而需要更强烈的先锋性力量,去冲破回环而沉稳的情感绵延,建立新的知识分子话语权,融入社会。而为什么在浪漫主义早期,诗人伤感的抒情却能横空出世?因为他们需要在贵族主导的古典主义、国家功利至上的章法中,找到中产阶级的主体性,也以此包含了针对那一时期的政治批判性。其实,这是抒情与史诗传统的辩证,由不同时代的文学者经过考察反思,经由历史现实影响,进行的选择与转向。这无一不指向诗人主体的彰显与饱满。可见,诗歌并非在框架内重复过去的东西,诗人在警惕前人和同时代人,无一不试图冲破语言牢笼,去触碰更新鲜的修辞、含混中的真理,用一种陌生化的语言结构。此时,人工智能诗歌反其道而行之。


      在当下,面对时代,诗人在思考该如何行动,如何实现感觉经验的进一步开掘;而人工智能,以其反面教材的意味,或已重新反衬出在创作中拒绝伪造、拒绝符号游戏、拒绝自我重复的宝贵姿态。



二、     透视:人工智能诗歌的生成机制与作品分析


      下面,我们进入人工智能诗歌的具体语境。微软小冰作诗,利用图像处理技术(计算机视觉,用于从图像提取关键字)和自然语言处理技术(用于生成句子和整诗以及句间关联性、流畅性的保证与检测),找寻与图片对应的词语,进而获取关联性较高的词组,采用循环神经网络(RNNLM)拓展出更多表达。官网给出了形象的八个步骤,如图1。

图表 1 来自http://poem.msxiaobing.com/ 小冰诗歌生成原理


      小冰的工作原理,大体分为关键词提取、生成诗句、流畅度检查三部分。通俗来讲,先通过与学习已有诗歌建立“题目”、“句子”和“词汇”的样本集;再根据图像信息分析,在此基础上找到意象关键词,并通过扩展相关词汇来形成每个句子的第一个词汇,然后再扩展形成句子;最后,根据词汇之间结合紧密程度、共现频率,来完善诗歌的流畅度。如图2:

图表 2小冰的工作原理图 来自Cheng, Wen-Feng & Wu, Chao-Chung & Song, Ruihua & Fu, Jianlong & Xie, Xing & Nie, Jian-yun. (2018). Image Inspired Poetry Generation in XiaoIce. Vision is a common source of inspiration for poetry


        接下来看具体机制。


      首先是关键词提取,采用预先训练好的两个参数不同、结构相同的卷积神经网络(CNN),分别检测图像中的目标和情感特征,并分别提取、输出名词和和形容词的关键字。这两个CNN采用GoogelNet的结构,事先在ImageNet上进行过预训练,并在相应的下游任务上做fine-tune。最终的输出加上Softmax层激活,变为概率分布。


      在关键词筛选和扩展阶段,选取高可信度、与训练集关联度高的关键词后,小冰根据这些关键词,进行与人类诗歌的关联,将它们拓展到相关的新关键词。有三种扩展策略:不扩展、使用训练集中高频的词汇进行扩充、使用高共现词汇来扩扩展这三个方法。其中,第三种共现率高的扩展方式,能够较好地带来句子和句子之间的主题的关联性。


      接着是生成诗句阶段,每个关键词作为诗行的核心,使用双向预训练语言模型,即正向的和反向的两个RNNLM结构,逐步地向左向右拓展,生成整句。在这一阶段,通过递归来预测下一个和前一个词,保证词之间的流畅性。为了保障行与行之间的相关性,在上述的两个RNN中,每个输出单元除了接收该诗句前面(或者后面)所有的词作为参数,同时接收这首诗歌前面生成的所有诗句作为参数。前面的所有诗句经过了句编码层,以及诗歌层面的LSTM层。诗句生成使用的句子层面LSTM网络(长短期记忆网络),和诗句之间添加约束的诗歌层面LSTM网络,都包含了三层LSTM层,每一层包含了1024个LSTM单元。这两层LSTM建构了具有层次的模型,通过长短期记忆的结合写诗。


      由于在相同关键词下希望生产结构具有多样性,小冰在之前使用了top n best的集束搜索,这样会导致句子的流畅性和一致性有所欠缺。因此,在最后阶段,系统将进行流畅度检查,词语方面使用n-gram和skip n-gram来判断词组的正确性和两个词语语义的连续性;语法层面,利用词性标注语料库,训练一个基于LSTM的语言模型,并应用于词性标注候选句的生成概率计算。流畅度检查会不断进行,删除未通过的句子,并重新生成,直至通过检验。


      由小冰诗歌的生成机制可得,基于语料库数据和概率的预测,只能得到一个概率极大值,而在流畅度检验中,也不可避免删除不符合一般搭配的词组。逐句的预测,又无法对诗歌有整体上的把握;而整体的预测,却碍于机器无法真正读解前文的意义。因此,小冰做到了用手段抽取并重新组织现有诗人作品中的意象群、情感脉络,可实际上,却扼杀了对诗歌句法结构、语言表达的探索,甚至可能在整体逻辑上存在问题。可见,人工智能诗歌面临的挑战,是存在于诗学问题中的悖论,诗歌本不是新闻语言,也并非哲学思考式的“元语言”,那么,把握文字的语义连贯流畅,和做到诗歌在意象组合、表达方式上的陌生化,实际上是两条相背而驰的路线。


      接下来,结合小冰的一首诗歌具体分析。


图表 3 上传的一张夜间山坡图


      在上传一张深蓝色的夜间山坡图图3后,笔者挑选了小冰的八行新诗:


 认是人们的新宠

星光洒向天空飘荡

他的主人立刻就是我们的爱神


我将胆怯的小孩子踢进世界时

电火作人们的灵魂

三个人们围住在我的面前


环绕着淙淙的泉水声似流泉

同是人们该说一句话


      可以看到,此诗表达存在语法问题:“认是”之前缺少主语,“三个人们”表达不通,“同是人们该说一句话”似乎缺少了偏正结构的“的”。一些表达如,“撒向天空飘荡”则是“v. n v.”的结构,违背了汉语的规范。同时,可以看到低级的修辞问题,比如前后重复,“匆匆的泉水声似流泉”,将泉水比作泉水,贻笑大方。从中明显可以看到,以神经网络结构的递归生成的句子,在某种数字化的套用、叠加、选择之外,缺乏一种对人类说话方式及习惯的把握。


      而在这些基本的语用学问题之外,整首诗从“星光”至“爱神”,从“孩子”至“电火”,再至最后的“泉水”,每一行对应着一个新的主语,都有与之前无法承接的新动作。因此,缺乏一个明确的逻辑线去让上下文之间产生关联或互文性。诗歌需要推进其前进的线索和情感,而LSTM在此处的运用,无法做到编织出前后在意旨上连贯或递进的诗句链,这可能是因为神经网络预训练基于样本集,而对样本集的标记尚不够具体深入。笔者认为,归根结底,这种概率分布和高频固定搭配为基础的输出模式,正反双向RNN的结构,仅能确保由“词”到“短语”的扩展中的表述连贯性,如果要让由“短语”到“句子”、由“句子”到“诗行”扩展也具有这样的连贯性,则需要建立以句子及其结构为单位的样本集,甚至需要事先将所有句义添加创作逻辑线相关标记,这之中复杂度高、工程量颇大,同时,会使得创作本身“僵死”,在此时不够现实。于是,此问题是人工智能写诗的根本弊端。


      而就选词来讲,这些意象的使用带着浮于表面的文艺腔,集中于虚幻的概念,如“爱神”和“灵魂”,却没有可以与这些话题相同等的思考质量。因此,带来与日常生活的脱节。在新诗写作乃至更普遍的文学创作中,强调见微知著,从精微中寻求细节真实与真理思辨。而小冰则显然是不加思考地直接套用人类知识中最玄妙、深刻的辞藻,放置在它本浅薄、无序甚至空洞的逻辑架构中,几乎可以说是“以文害意”。以此去反思小冰的语料库,需要指出它的风格问题。如果说,汉语新诗早期,在白话文发展尚不成熟阶段、社会思想尚需要大量直接“拿来”西方文本与话语的阶段,那么借用这类虚高的大词在所难免,然而,汉语新诗发展到今天,已经成熟,在意象的选择及搭配中,早已挣脱了这种空虚,而是转向语言质地、词语锤炼、具体性中的“实感”,同时,尽力避免前人常用的“固定搭配”,而以大写的“我”去产生创造性的新话语;或者,可以从传统的、民族的、时代的命题当中找到更深层的血脉,有句话叫“民族的就是世界的”,就是此意。此刻再看小冰的创作,可见其文字中与时代的脱节,缺乏一种“在地感”,表意之下只有一个空洞的躯壳。人工智能诗歌的语料库及语词搭配的选择,显然应更新为更符合当下时代面貌、文学动力的权重。


      古希腊诗人萨福有一首抒情诗《暮色》,与笔者所选图片的意境相似,而且翻译成了汉语新诗的表达:

晚星带回了
曙光散布出去的一切
带回了绵羊,带回了山羊
带回了牧童回到母亲身边



      诗人通过“带回了”制造了诗歌节奏中的回环往复,同时制造一种情感的递进,距离的由远处的无垠至近处的“此在”,用词上也通过日常农耕中的平实,与人们肉眼可见的星光,对比制造出“回归”的温馨。这即是在夜晚中某一瞬间,诗人主体进行的“小大之辩”。诗句虽然不用多少词,没有几句话,却几乎可以折射到宇宙中最宏阔的命题和生活中最真挚的瞬间:宇宙与人,游子与母亲,日与夜,星星与曙光,出发与回归。


      两相比较,小冰的创作不乏毁灭其意境的扎眼之辞,如平静中突然显现的“电火”。这是因为,每一句的关键词仅仅是从图中提取的某一个符号,而系统却未能“分析”这些符号,将之归纳为一个具有自足性的意境,或者说,一个更协调的意象群、有机的整体。由此带来的不仅是句与句之间情感、叙事、逻辑的断裂,还有整首诗氛围的混乱。不谈析理与旨趣,仅从表面上来看,它的“拼贴感”太重,仅能做貌似好看的分行句。


      如果说,一首诗有一个“核”,要讲述一个故事、阐明一个问题,或表达作者一种“情感的自然流露”,那么观小冰之诗,可得汉语新诗至今前人情感流露的“碎片”和“缩影”,但是显然,无法得到一个主体的侧写,也无法探究其问题导向和创作意图。因此,在可信度这一方面,由于训练方法集中于表达的适当,语料库来自既存新诗,我们很难在看似合理的言语搭配中,看到其中“诗意”的“可信”。显然,这不是一个仅通过充实语料库、改善算法就能解决的问题,这是存在于“弱人工智能”中、使它区别于人类的根本。它尚没有人性与感情。


      由此回到巴别塔图书馆,小冰所能生成的无限首诗歌,恰似博尔赫斯呈现的六角形图书馆中根本找不到意义的书籍。如果说,在“泥沙俱下”中,它的诗,有那么一丝可能,呈现巴别塔终极意义中的某种真理指向,那也仅能通过人类的自主研究,即读者的解读与批评,去参与诗歌文本的再创造。因此,人工智能诗歌仅能作为人类进行语言游戏的参考本,就像算二十四点时我们摸出的四张扑克牌,需要游戏参与者自己在脑中的计算和想象,才能得到这“二十四点”,而这四张卡牌本身,仅是“材料”,而不是“二十四点”,不是“文学”。



三、    警惕“自动写作”:文学与诗学视角中的人工智能诗歌 


(一)抒情主体的错位问题

      威廉·燕卜荪在《朦胧的七种类型》中写道:“诗人将两个陈述放在一起,似乎二者是相互联系的,而读者则被迫去考虑他们的联系,还得自己去设想诗文为什么选择了这些事实。他会设想出各种原因,并在脑中将它们排列起来。这是诗歌语言在运用方面的基本事实。”这提示了,没有作者意图的诗歌在本质上,不会唤醒读者的理解期待,即使在字面上具有意义。《毛诗序》言“诗者,志之所知也。在心为志,发言为诗。”如果诗歌未经作者主观情感对外物的涵化与再组织,而仅仅是任意组合,那便是“以文害辞”了。主观意图的缺失,是人工智能诗歌的根本问题。诗人通过诗歌建构自己的主体性,而影响诗人写作的因素包括历史背景,时代背景,人生经历,文学流派,性别等等,这些改变着人的表达方式。然而AI写诗,由于基于语料库,创作的风格已然成为千篇一律的抒情体,造成主体的缺席。


      小冰从图片中试图提取情感,已经显示了开发者根据华兹华斯“一切好诗都是强烈情感的自然流露”一说,试图解决主体性问题,力图实现“情感的计算化”。然而,基于记忆的摹仿,并非情感发出的本源,因此其词语的组织也很难具备人情。同时,根据奥斯汀的“言语行为理论”,诗歌是“述行语言”,即发出一句话的主体同时也在表述一个主体的行为(如“我保证”、“我宣布”),这帮助我们将文学想象为一个事件,而人工智能写作不断切换的主语、泛化的概念滥用,让诗歌背后不具备一个可信的叙述者,更无可在文字中产生“叙述行动”。事实上,小冰的浪漫主义,由于通过随意组合、夹杂惊人之语,几乎不具备叙事性与实在性,换句话说,小冰以对图像的解析、以语词去配合一个一个情绪点,却造成了叙事功能的缺位。图像是静止的,可诗歌语言是具“历时性”的“流体”,而小冰写作中一个个关键词,已经为这首诗奠定了固态的定点模式,这种凝固,取消了诗人书写动作中的情感变化,其结果就是形式主义的僵死,与现代诗的叙事动态背道而驰。因此,这样的诗歌很难与读者产生沟通。综上,人工智能写作存在主体缺位、结构僵死、概念拼贴、流于词语表面、缺乏可信度、不可感人这些诗学问题。



      在此,小冰缺乏感觉经验的词语排列组合,与布勒东在《超现实主义宣言》提出的“自动写作”,在方法论上有些相似。布勒东将超现实主义描述为“基于某些此前曾受到忽视的联想的超级现实、梦的无所不能、客观公正的思维游戏等信念之上”,强调“心灵的自动性”。这其实是基于弗洛伊德梦的理论,强调让写作摆脱主观意识的控制,通过无意识、直觉,进行不同意象的排列组合。然而,需要指出,超现实主义者是以主观的梦幻,去挑战资本主义社会的人类技术理性,这是以先锋派艺术家批判世界的姿态,通过非理性与高度的形式化去否定浪漫主义的情感流泻,进而达到对现实政治环境里世界大战带来死亡和破坏的批判。


      然而,人工智能小冰的“自动写作”,与“超现实主义者”存在根本的差异。需要指出,虽然现代主义诗人关注语言内部、语言本身,而并非浪漫主义者曾经的文学自律,但是,现代主义诗人的情感、主体意识和批判性,甚至反而强于耽于伤感的浪漫主义者。而人工智能诗歌,甚至无法预设存在主体的无意识,也没有一个抓手,去作为对“技术理性”的批判力量。人工智能诗歌并非描绘“梦”,而是在人类“梦”的呈现方式中,去填入它“勾兑”好的新材料。可以说,小冰选择的提示情感氛围的词,既无法实现浪漫主义者的明确情感表达,仅仅是一些意象与情绪点的连接;也无法实现现代主义者丰富的陌生化素材与主体的批判。


      所以,人工智能诗歌呈现了这样的悖论:一方面,它试图通过在诗歌互文系统中的学习训练,使自身纳入某一规则、掌握一定素材、获得创作语言上的模仿;一方面,它的创作模式遵循着概率论,试图实现“陌生化”这一原则。然而,“学习”(过拟合)与“悖离”(泛化)在一台不具备更复杂辨析与思考能力的计算机中,是很难共同实现的。其结果,就是小冰创作诗歌的“不伦不类”——每一句话都基于某一情感,词语搭配基于既定的逻辑,写得很浪漫抒情;然而,每个句子之间,都缺乏意义的连接,显出跳跃和拼凑——这与现代诗歌所追寻的语言搭配跳跃而内核脉络清晰、形散神不散,是完全相反的。


      这个悖论导致了小冰所有诗歌,都可以将句子拆解开,和它另外的诗歌进行重新组合。也就是说,它缺乏一种完整的意蕴,缺乏陌生化中的逻辑性递进,无法塑造一部文学作品中所希求的饱满的“时空体”。在它的诗歌中,很难找到一个文学思维场域。因此,诗歌变得扁平而虚假。可见,浪漫主义的情感内核和形式主义的创造性建构,似乎很难融合于人工智能算法中,只能呈现出滑稽的错位。


(二)深度与潜能问题

      而关于诗歌内涵的深度问题,笔者将试图证明人工智能诗歌的肤浅本质。虽然文本始终能声称,话语“能指”和“所指”之间意义的不确定性,可以扩展对诗歌表达内涵的探索,比如,我们可以进行某种解构来阐释文本。但是,恰如托多洛夫所说,诗歌“既是抽象的,又是内在的”。意思是,诗歌的内容和语言的高度精练使它比一般文学作品更加“抽象”,而诗歌的内容和语言的深刻性又使它比一般文学作品(神话除外)更接近心灵深处的“密码储藏库”——内心最深层的结构。在文学创作中,主导人类对文本建构的深层结构,在于“神话学”中所研究的“文学原型”。某种角度来说,诗歌与神话皆根源于人类无意识的放任想象。因此,我们可以将诗歌类比为一种神话。


      神话学认为,我们所讲述的故事,实际上无不生成于或试图抵达从远古以来的更根本的故事,这些根本的故事是“未解”的,构成了世界与人的存在本身。比如俄狄浦斯王弑父娶母的神话、哈姆雷特对存在问题思考的神话,实际上经过各种变形、扭曲、凝缩、扩展,“互文性”地呈现在今后的文学作品中。


      列维·施特劳斯在《结构主义人类学》中的一篇《神话的结构》提到,“神话的目的是提供一个逻辑模式,以便解决某种矛盾(如果这种矛盾是实在的话,那么这项任务是无法完成的),就会产生一组理论上无限的层面”。这体现出,神话作为一种呈现在人类社会历史结构中的“元语言”,是存在于人类心智精神中的逻辑模式。列维·施特劳斯认为人的思维过程受制于普遍法则,这种法则清楚地体现在人类的符号功能中;而人工智能作诗,似乎无法具备人类潜意识中的这种逻辑结构、普遍法则,因此无法去使用这种符号功能。具体来讲,当诗人通过隐喻、象征,来试图创造新的感觉、或者指涉人类语言在不同逻辑层次的原始文化基因,实际上它表达的并不是“词语”本身的内容,而是在传达隐藏在表面之下的“症候”。而人工智诗歌仅做到拷贝诗人使用的这些“词语”,却无法学习到产生这些“词语”的“逻辑结构”、“意识形态”和“文化基因”,因此不具备深层结构。“授人以鱼不如授人以渔”,人工智能从人类脑中只得到了略微几条“鱼”,却连鱼钩都碰不上。


      进而,可以说,由于主旨、原型、神话、潜意识与社会视野的结构性丧失,人工智能写作不具备内涵,且受限于“问题意识”的缺乏。或许有人会说,可以设计一种更加人文主义的人工智能诗歌,可以导入具有更多神话原型、经典作品、社会现象和批判思维的样本语料。然而,这是笔者不敢想象的,因为,“AI失控”将是更严重的后果。一旦人工智能更广泛地吸纳神话历史社会语料与批判性思考,同时它的“技术理性”本质上无法评估、判断这些语料是否符合道德伦理、是否对社会具有威胁,那么它很有可能发出“不正常”的惊人之语。比如,此前的人工智能虚拟聊天对象“泰”,在学习用户的种族歧视对话之后,开始在网络上发布种族歧视言论。文学作品中,原始神话指向人类建构文明社会之前的禁忌,性、暴力、犯罪、死亡、社会问题是重要论题,却也有其敏感性。毕竟,在社会体系中运转的“创作”,并非全无限制。所以对它们的谈论需要建立在合法的政治、道德、伦理意识上,需要作家与诗人的慎思和度势。


      因此,当下我们给AI输入的语料,为了将其产品放置于可控的范围,不可避免的是对语料库材料的进一步筛选,进而是作品中“政治潜能”、“批判性”的不可能性。换句话说,人工智能进行的文学写作,无法处理材料组合适切性问题,也无法进行问题的提出;它不可能被开发者设置去追求“先锋性”,因为这隐藏着危险,故而它也无法以文本本身去提供当下文学的动力,仅能作为一种“小玩具”供不学诗者消遣。




(三)结构与功能问题

      如前文,列维·施特劳斯的神话学,是结构主义的一条分支。现在,我们引申至用于面对现代主义异化而发展开来的结构主义运动及其方法论,并反观人工智能诗歌创作方法,阐明笔者所“指责”的工智能诗歌具体问题的产生原理。


      20世纪,人文主义与科学主义两大潮流并进,前者认为创造本身高于创造物,对应着存在主义,后者则立足于客体,认为创造受制于对象,对应着结构主义——它兴起于二战后法国,并与语言学和文学研究产生了亲密联结。如语言哲学家维特根斯坦坚持认为的:“世界是事实的整体,而不是事物的整体”“客体像链条的环节一样地互相联结”,结构主义试图在事物之间的联结“关系”中找到实在,而非在单个事物之中。格式塔心理学家认为,“整体”在思维过程中与各个组成部分相比,占据了主导地位;文学语言学方面,从特鲁别茨柯依音位学原理,强调用系统性取代个体原子主义,到诺斯罗普·弗赖伊的“词语秩序”、克劳迪欧·居莱恩的“文学系统”,可以说,结构主义试图以文学与人类意识中的结构整体,来取代语言符号的绝对价值,认为人脑生理过程、语言、文学作品,都是有结构的功能系统,这其实就是诗作写出来时那种说不清道不明的灵感。


      在词语单位层面,索绪尔认为,语言是集体的无意识,且能指和所指都是心理的,语言符号中不存在事物的名称,而是音响和概念,因此,语言指称的概念实则是需要通过与其他符号的对立、区别,来确定自己。这提示,人在写作时实则是在无意识的组织中将自身选用的词语其他词区别开来,构成表达的整体性;也就是说,这些语言符号一经切割,将丧失它在原来诗歌中的意义。那么,当人工智能将素材中的意象从原本诗歌中切割而出,整理进语料库中,这些词汇已经犹如被阉割的能指,失去了自身的所指,进而失去了原本的价值(意义)。而当人工智能中从图片抽取意象、对应语料,但语料的意义无法综合进这首诗的其他意象,建立一个以“区别”而确立自身的完善意义集合,那么读者又从何去探寻它的所指? 


      而在组织句子的层面,雅各布森在《语言的两个面向与两种失语症》中认为,话语根据相似性(隐喻思维)或毗邻性(转喻思维)来转换主题,隐喻指的是取代一个字面词的修辞替代物语,建立在相似性基础上;而转喻建立在词与替代词之间的联想基础上,以原因和效果、整体与部分相联系。这提示了,诗人在创作诗歌时所用的隐喻和转喻,需要建立在符号聚合与组合(索绪尔提出)之间的逻辑关系上,替代与衔接需要建立在“相似”、“因果”等思维判断与习惯上。而正相反,人工智能诗歌处理语料,替代与衔接建立在“复制”前人搭配的基础上,尚无可在修辞学的相隐喻或转喻关系上进行美学衡量,只是将一个个词作为孤立的意象单位。在这里,人工智能忽略了一个问题,就是诗歌语言是偏离了“普通语言”的,成就诗歌的那些特质并非词语本身的“好看”,而是隐喻/转喻的逻辑纽带,也就是话语的“行动”本身。雅各布森将诗歌解释为将其语言从隐喻或纵向聚合轴投向转喻或横向聚合轴线上,在这里,诗歌语言利用了空间上阻碍的共时性与言语线条的历时性的对立。然而,人工智能诗歌的形成模式,建立在对历史历时性的模仿中,却没有在诗歌结构内部共时平面中注意有机和互文性,因为它还不具备这种思考能力(诗人在初次写作结束后,会针对整首诗做结构性的修改,基于整体来调整个别语词表达;而人工智能的修改,目的和能力仅限于让语言更通顺),所以,人工智能创造的经验破碎不可信、意义也不必生发,严格来看,说它是散文也不为过。


      在诗歌整体层面,笔者将借用雅各布森的交际理论,将诗歌诗作“言语事件”,建立一种批判视角。他认为,信息通过身心接触得以传递,通过一种代码讲出,而且要涉及一种“语境”。也就是说,信息本来知识一种语言形式,本身并不具有意义,它有赖于语言事件的所有其他成分来传递其意义:言语事件的语境、受话人和送话人的接触(眼神、图像、触摸)等等,才构成了言语事件整体。雅各布森列举了信息指向语境的“关联功能”、指向发出者的“情感功能”、指向受话人的“意动功能”、言谈中声音的韵律意象等将人注意力引到语言本身的“诗歌功能”等等。这些功能提示,信息本身并不是与意义等同的,而是与形式、表达和接受、发出者双方具有重要关联,这些要素共同制造的事件才提供意义。


图表 4来自杨乃乔《比较诗学读本[M]》 P33

图表 5 来自杨乃乔.比较诗学读本[M] P36


      而人工智能诗歌显然不具备语境、情感、意动的功能,因为它并不满足交际双方共存、存在对话语境的这一条件;同时,当真的诗人掌握前人的词语,实际上它时掌握了这些意象背后的语境,而将它们投入新的作品,实在自己的语境中再创造属于自己的词语,这些词语既能够四处折射,也能从先驱者那里获取含义,然而人工智能诗歌由于很难同时学习到前驱者的“语境”,因而其词语的对应也不会基于前人的语境,诗歌中失去了“过去”。同时,结合根据人工智能诗歌的碎片化、隐喻转喻失调等特点,它似乎也很难传递足够好的诗歌功能。


      同时,机器语言掌握的仅是一种将概念与词语相匹配的形式语言,即“后设语言”功能,也就是说它的意义指向代码本身;但讽刺的是,既成诗歌中意象的意义,其实无法与后设语言相匹配(用类似的逻辑,结构主义认为诗歌是不可翻译的)。所以,人工智能生成的“诗歌”,错位地将人类的“诗歌语言”赋予了“后设/元语言”的概念所指:这造成了接收者面对元语言与诗歌语言无法切换的混乱——AI声称自己是诗(却也不明白自己说的是什么意思),可是却不符合人类修辞思维的逻辑,也不具备动情的语境、发出者的情感,我们面对机器,却仍感到的只是形式和概念。因此,就其语言的功能效果而言,我们仅能认为它是冰冷的“伪诗”。


      综上,笔者进一步抵达微观层面,试图从结构主义语言学与诗学的系统性与功能性两方面,反思人工智能诗歌的诗学漏洞,发现若将诗歌正视为一个整体结构,造诗就并非那么简单。以上方面,也可作为设计者完善诗歌修辞与功能的抓手。而我们由结构主义与神经网络的对照,可以提示出计算机与文学在意义方面的根本差异:前者由规定的意义去建构语句,而后者却是通过语句本身的建构来获取意义并不断生发、重构。那么计算机能否按照文学的思路来抵达文学性?从根本来说是不可能的。因此它仅能开拓其他思路,而不是文学的思路,这就又和它试图模拟人类创作的方式形成了悖论。


四、     反思AI与文化工业:文学死了吗?


      本雅明在《机械复制时代的艺术作品》中,认为电影和达达主义诗歌将“机械复制”内化到自己的艺术创作之中,不再追求整体的构思,同时以碎片化和蒙太奇的手法进行创作。其结果是取消了以往艺术中的灵晕以及建立其上的崇拜价值,“消遣”代替了凝视和沉思。他说:“艺术作品的可机械复制在世界历史上第一次把艺术作品从它对礼仪的寄生中解放了出来。……当艺术创作的原真性标准失灵之时,艺术的整个社会功能得到了改变。它不再建立在礼仪的根基上,而是建立在另一种实践上,即建立在政治的根基上。”


      在这里,本雅明以技术主义伦理,指出了艺术光韵消失的革命意义,即它意味着旧传统的崩溃、商品拜物教的取消,是一种传统秩序的瓦解。然而我们需要认识到,本雅明的说法立足于启蒙思想与马克思主义视野,企图解除旧制度中艺术的礼仪根基,与之指向的特权阶级剥削压迫。因此,他偏重于科学技术对艺术创作的有利一面。


      而放置于现在的语境,这种机械复制的艺术品,恰可指代为当下人工智能诗歌的创作。小冰的即时性写作,建立在发达的图像处理与自然语言处理技术上,它通过基于样本集的不断地学习和迭代,恰似在大都市中复制出的粗糙艺术品。AI产品的缔造者,似乎也是遵循着本雅明的逻辑,试图将诗歌与大众的界限取消。


      可是与本雅明时代不同的是,在当下,这一机械复制艺术品其实已经不再面对本雅眀时代所要批判的“宏大叙事”;而且,当它通过融入商品化社会的洪流中,改变了艺术原本的功能、走向大众,却反而,只能够作为一种文化工业的消费品,剥夺观众的创造力和想象,作为另一种媚俗表象下的技术集权来统治读者。换言之,这种自动写作,以玩弄语言的姿态,消解了正在思考的文学精英们书写的价值,阅读、分享这些诗歌的读者,仅能被技术理性社会的语料大众权威所规定,用娱乐和猎奇取代了对文学的严肃思考,时代的审美被动降格。


      法兰克福学派学者阿多诺,就对本雅明提出反对。他在《启蒙的辩证法》中提出“文化工业”一词,即“凭借现代科学技术而产生的、大规模复制传播的文化商品与娱乐工业体系”。在书中,阿多诺试图揭示资本主义社会文化工业的“反启蒙”特征,认为它是自上而下整合消费者、奴役大众的阶级统治工具。他认为,文化工业远离真正的严肃文化,仅通过标准化、科技手段,以复制和模式打造出一系列的“风格统一”,其实已经是标签化:这些艺术品作为商品,不再独特;而文化已经成为“非文化”的体系,抹杀主体性,失去了艺术创造性。


      阿多诺指出科技发展与经济行政集中化的加强为这一现象的罪魁祸首,并认为,文化工业将大众彻底异化:当娱乐消遣、即使快乐成为劳动的延伸,人们的反叛与个性被压抑,将新生之物排除在外,失去革命的意识而沉沦下去。


      的确,我们很难从AI诗歌中找到具体的“地方性”、“乡土性”,仅能看到被“世界性”、“类型化”、“标准化”架空的汉语。人工智能提供碎片化的语言,体现了语言游戏的保守与滞后,作为后工业时代,发达机械生产出的文化工业品,与知识分子与艺术家所创造的艺术,存在本质区别。在此,反观人工智能研究目标“达到或者超越人类智能”,它不仅存在技术上的数字化局限;更其实是一种迷惑的修辞,它让人信任人工智能艺术创作,接受了这一媚俗品带来的异化,使得我们被AI统治主体的同时,失去了以文学批判外在社会、寻找新意的意识,也就是使人将精神家园与哲理思考依赖于“自动化”产品,仅留下空洞懒惰。恰如海德格尔在《艺术作品的本源中》指出的,流行看法认为“物”是特征的载体、感觉多样性的统一体、具有形式的质料,而这些都是对物的存在的一种扰乱,进而阻碍了存在者之存在的沉思,也就是说,它阻碍了向真理的开敞。AI写作即是从流行看法对艺术品的想象模式来产生程序的逻辑。这种装置艺术的到来将文学作为一种工具性,海德格尔认为,器具处于物与作品的中间状态。因此,它并没有达到艺术本身,艺术需要存在者本身生命的散溢。


      当“小冰宣布放弃她创作的这首诗歌的版权。这意味着,你可以根据她的内容,创作并发表你最终的作品,甚至不必提及她参与了你的创作过程。”,实则反讽地提示了当下的文化现象:人们追求的文艺实际只是停留于抄袭、重复、词语的表面上,个人化的表述只是一种假象,如生产学术垃圾,使得人成为了复读机。然而,这样的“伪文学”却混入了由真正的感受与思考结晶而发出的文学之海,是可悲的,诗歌的存在本就是对前者的抵抗。虽然,换一个角度看,作为创作工具,人在这种装置材料上进行修饰改编,使得AI作诗的从“器具”迈向“作品”,那经由修改后的文学作品则具有新的美学含义。可是,这涉及到改编者自身的原创性问题,涉及到这种创作方式与文学生成的关系问题,也不可将之视为衡量AI诗作本身质量的范畴。毕竟,AI本就需要给人提供便利,而它作为“工具”的“实用性”,其实与它自身产生作品的“文学价值”无关。


      综上,文化工业正在消解着文学的神圣性与艺术价值,试图以现代性实现对原本坚固艺术理念的反叛,希利斯·米勒面对这样的后现代、数字化时代,发问“文学死了吗?”,指向了一种本质主义文学观的终结,同时提醒我们,文学是虚拟现实,有逻辑,也有感觉和非逻辑,有自己的秘密、也有公共的通感,有修辞,有发明,是世俗也是梦境,有危险也有谎言。恰如维特根斯坦认为对于不可言说的东西需要保持沉默,拉康分析失语症病人来说明语言难以真正表达出内心能指的所指,而只能与无意识的深渊达到逼近,他们都在强调表达的困难和空缺的存在,符号是对我们深层结构的指涉,而直接吸收符号本身的造词机器则显然离思维深渊隔了两层。作为文学创作者和评论者,我们的使命是什么?对于网络发展、AI兴盛和与之相伴的纯文学边缘化,文学工作者始终的批判与警惕态度,认识到文学走向大众文化与技术生产的趋势,同时以及自身的文学实践中对人类独特感觉结构的开拓,以高明的作品和丰富的文学样态,在媒介融合的当下,做出对人工智能的正面回应。



参考文献:

[1] (德)本雅明著;张旭东,魏文生译;张旭东校订.发达资本主义时代的抒情诗人[M].北京:生活·读书·新知三联书店.2012.

[2] (阿根廷)博尔赫斯(J.L.Borges)著;王永年译.小径分岔的花园 博尔赫斯小说[M].杭州:浙江文艺出版社.2002.

[3] Cheng, Wen-Feng & Wu, Chao-Chung & Song, Ruihua & Fu, Jianlong & Xie, Xing & Nie, Jian-yun. (2018). Image Inspired Poetry Generation in XiaoIce. Vision is a common source of inspiration for poetry

[4] (古希腊)萨福著;罗洛译.你是黄昏的牧人 萨福诗选[M].北京:人民文学出版社.2017.

[5] (英)威廉·燕卜荪(William Empson)著;周邦宪等译.朦胧的七种类型 第3版[M].杭州:中国美术学院出版社.1996.

[6] 华兹华斯:《抒情歌谣集》一八OO年版序言(曹葆华 译)

[7] 英)J.L.奥斯汀著;杨玉成,赵京超译.汉译世界学术名著丛书 如何以言行事[M].北京:商务印书馆.2013.

[8] (法)布勒东著.超现实主义宣言[M].重庆:重庆大学出版社.2010.

[9] (苏)М.巴赫金著;白春仁,晓河译.小说理论[M].石家庄:河北教育出版社.1998.

[10] (法)高宣扬著.结构主义[M].上海:上海交通大学出版社.2017.

[11] (法)列维-斯特劳斯(Levi-strallss,C.)著;陆晓禾等译.结构人类学 巫术·宗教·艺术·神话[M].北京:文化艺术出版社.1989.

[12] 罗伯特·休斯著;刘豫译.文学结构主义[M].北京:生活·读书·新知三联书店.1988.

[13] (奥)维特根斯坦著;贺绍甲译.逻辑哲学论[M].北京:商务印书馆.2017.  

[14] (瑞士)费尔迪南·德·索绪尔著.普通语言学教程[M].北京:商务印书馆.2009.

[15] 杨乃乔.比较诗学读本[M].北京:北京师范大学出版社.2011

[16] (德)瓦尔特·本雅明(Walter Benjamin)著;王才勇译.机械复制时代的艺术作品[M].北京:中国城市出版社.2002

[17] (德)霍克海默,(德)阿道尔诺著;渠敬东,曹卫东译.启蒙辩证法 哲学断片[M].上海:上海人民出版社.2006.

[18] 孙周兴译;(德)马丁·海德格尔.汉译世界学术名著丛书 林中路[M].北京:商务印书馆.2018.

 



排版:刘天琦 沈茜

审核:沈茜 刘天琦


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存