查看原文
其他

对撞机 | 模型与意义:评《计算:数据与文学研究》

麦克纳尔迪 零壹Lab 2022-10-08


作者简介

苔丝·麦克纳尔迪(Tess McNulty)为哈佛大学学者,研究当代文学和数字文化。


模型


去年八月,芝加哥大学出版社出版了安德鲁·派博的《计算:数据与文学研究》,开篇便提出简单而具煽动性的指控:文学评论家不懂如何恰当地归纳。为了证明观点、表明野心,派博以艾里希·奥尔巴赫的《模仿论》为例——这个选择特别且单一,出人意料。在派博看来,这本备受尊崇的书为整个“西方文学”提出了主张”(p. 6)。但他认为这是建立在谬误的基础上。《模仿论》的每一章都用一个单篇代表一部完整的“巨著”。这些单个“巨著”又代表了“所有西方文学”。派博称这种错误为“认识论悲剧”:它表明了将部分与整体相联系这种基础能力的缺乏(p. 7)。


派博认为问题一直存在。文学评论依然像奥尔巴赫那样寻求归纳——例如,我们也许会对“那本小说”(p. xi)做出总体性断言。派博认为,即使那些抵制归纳的人也必须承认其重要性。甚至凯瑟琳·加拉格尔和史蒂芬·格林布拉特等新历史主义者,那些留意文本独特个性的人,最终也将其纠缠置于一般语境之中。但派博说,尽管有必要做归纳,我们却仍不胜任。我们无法以“用于单个文档的……那种严谨”将文本与其语境联系起来(p.7)。派博称,我们要呼吁的是“归纳的科学”(p. xi)。在《计算》中他提出了一种:他认为文学评论家能够用计算模型更好地归纳。


初初一看这可能很眼熟。过去20年,计算文学评论和弗朗科·莫雷蒂的名字紧紧相连,他2005年的《远读》一书提出类似观点。莫雷蒂和派博一样强调需要提出归纳性论点——他说,除非文学评论家也看了另外99.5%的作品,否则就无法理解那0.5%的正典化作品。莫雷蒂也和派博一样推崇计算。他写道,压根就没办法让学者们去“细读”那些“大量未读作品”①。 他们必须求助于“远读”,这完全必要。


①Franco Moretti, Distant Reading (London: Verso, 2019), 66-7. 他将这个说法归功于玛格丽特·科恩(Margaret Cohen),是她造的这个词。


不过,派博在两个方面修正了莫雷蒂的想法。第一,他并不强调规模——也就是查看更多文本的必要性——而强调代表性。他问道,我们如何能够做出真正有代表性的归纳、我们是在谈论单个篇章抑或全部体裁?第二,他不是宽泛地提议使用计算方法,而是更具体地为建造“模型”辩护。派博所称的“模型”是电脑设计的文本“体现”或“缩微模型”(p. 9)。如通常所说,它们给“词语计数”;但也能进行更复杂多样的操作。派博说,建立这些模型就能更好地议定文学的部分和整体。


我们能怎样着手这项任务?讽刺的是,很难归纳。派博在他内容广泛的书里建立了诸多不同类型的模型——仅举三例:“矢量空间模型”、“主题模型”和“预测模型”。他用这些模型回答不同类型的问题。在本书的六章里面,他逐步使用越来越复杂的计算方法来处理基本的文学评论主题:标点、情节、传统主题、功能性、角色塑造和语料库(或诗歌生涯)。他的推进结束于自我意识中。派博将他的方法用于自身,开始有点异想天开地建造模型、描述我们刚读过的这本书。例如,他优雅地承认,书的章节随着它们逐步进展越来越自信——也就是随着他的逐步进展。对我来说,最后这个谦逊的姿态比这本书开头大胆的火炮齐鸣更加体现力量。《计算》为模型提出了两个野心勃勃的理论辩护。但最终其论据由于在实践中被小心限制的程度而令人信服。



词、词、词


派博给模型做的第一个辩护源于以下信念:词语计数不只是词语计数。它是通往我们所谓文本“意义”的关键因素。这一信念在派博从计算语言学中得来的“分布语义学”理论中找到了支持。根据这个理论的“分布假设”,一个词的意义和它出现在特定语境中的频率以及它在该语境中和其他词相比出现的频率相关。由此可推论,一个文档的意义也和词频及分布相关。这个理论有某种直觉的力量:一条能发现“花生”和“杏仁”这两个词意思相近的捷径也许可以指出它俩都经常在“酱”这个词的前面出现在名词词组中。这也有认知心理学支持:有证据表明这是我们阅读时大脑处理意义的方式。


文学评论家可能觉得这些概念不太熟悉。可以说,分布语义学以其对词语间关系的强调把结构主义语言学理论编码了。派博将它和后结构主义理论相联,后者将意义置于“句子之外”。他引用了巴特在《作者之死》当中的看法,即文本“不是一串发布单一神学含义的词语”,而是一种“多维空间,其中多种作品混杂碰撞”(p. 16)。他还提到德勒兹的“块茎论”阅读和克里斯蒂娃的互文性。这一切意在提出:当我们建造适应于词频的模型时,就捕捉住了某些非常接近语言学意义的事物,不仅是计算语言学家所理解的那样,而且也还是后结构主义理论家理解的那样。


矢量空间模型尤其适合这个任务。为了解释其工作原理,派博提出了歌德的三个句子。

1. My dear friend, what a thing is the heart of man!

亲爱的朋友,人心是何等的事物!

2. I treat my poor heart like a sick child. 

我待我可怜的心灵如对待病童。

3. I have possessed that heart, that noble soul.

我拥有了这颗心,这高贵的灵魂。(p. 14)


派博解释说,矢量空间模型将每句话转换为词频。在此基础上,它能测量其语义学关系。此处,它发现前面两句话彼此更为类似,超过它们和第三句话的相似度,因为这两句话都有“心灵”(heart)和“一个”(a)。细读的读者可能提出异议(后面会更多谈到这一点)。但根据分布语义学理论,至少这个模型表现并比较了这些句子的意义。


派博求助于分布语义学,意在先发制人、阻止一种普遍的反对意见:词频对于阐释文本没有功能上的用处。近来,笪章难重新提起这条反对意见。她在《以计算的方法反对计算文学研究》中再次强调:派博的这种工作仅仅探讨了词频。“决定了哪些词语或标点要计数、如何表现这些计数。就这些。” ①这种计数“不是阐释”,也并未捕捉到文学特质,例如“同音异义、比喻、多义性、[和]反讽”。② 派博则多亏了他在分布语义学中的投入,以相反的效果重复了笪章难的表达。他说,词语重复讲述了文学的“深层故事”;它们是文化表达的“沟槽和渠道”(p. 3)。


①Nan Z. Da, "The Computational Case Against Computational Literary Studies," Critical Inquiry 45, no. 3

(2019): 606.

②Nan Z. Da, "The Computational Case Against Computational Literary Studies," Critical Inquiry 45, no. 3

(2019),p.606,p.636.


派博的反驳很有力。分布语义学的存在就表明词语计数不能根据表面而被视为无意义。但他也得加以更多说明才能说服持怀疑态度的人站到他这边。就算抛开有关分布假说是否确实成立、或是否和后结构主义观念一致的疑虑,还有其他问题浮现。除了矢量空间模型,其他模型能捕捉到分布假说理解的那种意义吗?即使捕捉到了,这是否说明它们也能捕捉《计算》分析的更为具体的文学性,如体裁、人物或情节?派博诉诸于分布假说,开始回答笪章难这样的反对意见;但没有解决争论。


《计算:数据与文学研究》


超凡魅力


派博对建造模型的第二个辩护带有民主的腔调:模型不仅有助于我们更严谨地争论,还能更透明。派博说,典型的细读读者从高处提出“盛气凌人的声明”,依赖纯粹的“超凡魅力”去说服别人。相反,建造模型的人则受制于更为严格的方法;她能“界定[其]智识过程的每一步”。计算或许“也经常模糊费解”。但完善而公开地操作,就能打败“评论的超凡魅力的黑盒子”(pp. 10-11)。


论证在多种层次上展开。在智识层面,它暗示了模型更为精确,因为它鼓励自我意识——模型建造者面对外部机制必须抑制她的本能。在政治层面,它提出模型也许可以拆解学院等级制度。确实,派博更宽泛地接受了这个目标。在他的后记中,他用模型揭示了体制特权的运转。他表明,从1970年开始,在最显赫的文学评论期刊上发表的所有文章中,86%都来自颁发博士学位的学院中的前20%。


但是如果派博在表明模型能够揭示学院等级制时很轻松,那他在提出模型本身并不依赖有超凡魅力的权威时就不那么有说服力。他有关细读对超凡魅力的依赖性的提法则小题大做——毕竟细读的读者不得不求助于文本本身、抑制其本能并给出有说服力的论点。而他关于模型对超凡魅力的依赖则论述太少。在一个大多数文学评论家仍然不理解高级统计学的世界里,就算最为“开放”的计算分析也不得不被无条件地信任。他们诉诸高等技术,这仍可能构成其权威的基础。


文学评论家对卖弄技术并不陌生。新批评派产生了严格的“细读”方法,合法化了文学研究。从那以后我们将自己的“理论镜头”运用到文本样本上,詹明信式的解释学、解构主义的操作以及读者的“方法”。远读并不比之前的评论实践更加摆脱了光晕式技术性,很可能还更迷恋它。例如,派博在第四章分析角色时,很快就引入了“角色特征工具”,这是他和一位同事开发的,“尝试根据26种不同维度评估角色塑造的实践”,包括“行为形态”、“目标—导向”和“行为、描述及能动位置的多变的组曲”(p. 131)。除了屈服于这壮观而莫测的工具运作,还能怎样。


无论如何,来自超凡魅力的论点都是次要的。它能否起到重要的论证作用将首先取决于派博更基本的声称是否成立:模型能产生好的文本阐释。如果不能——笪章难就提出模型在捕捉文学性上表现差劲——那么它们包含透明流程这一事实本身就不足以举荐这些模型。许多流程可以逐步设计——比如我能轻松解释我只阅读一个文学文本每第800个单词最后一个字母所采取的步骤。但这不意味着它们应该在解释学实践中被接受。


双聚焦


派博很幸运,他的论证经得起彻底检查——至少就它本身而言。确实,它的弹性往往来自其谦逊。模型也许是、也许不是所有文学批评归纳的最终解决办法。但也不必如此。派博更有保留的评论实践为其目标效用提供了有力证据。


首先,派博用模型工作,这不是单一方法、而是许多评论方法中的一种。他不含糊地提倡细读和远读彼此启发的实践方式,他在第一章里对此做了说明。此处,派博讨论了20世纪诗歌中的标点。他运用一种叫做grep的方法确定了一组1900年以后的诗歌,其中词均句号的数量特别高;有意思的是,他发现这些诗歌作者中非裔美国诗人的数量高得不成比例。有了这个发现,派博通过新的镜头细致查看了阿米里·巴卡拉和安吉拉·杰克逊的“多句号诗歌”:为何如此多的句号?这和诗歌的种族政治可能有何关系?他的细读令人信服:它们表明句号编码了斗争和潜力,就像刺伤一样作为一再重复的痛点起作用。派博的解读在评论上也是有成效的:就我所知,还没有专门对非洲裔美国诗歌中过过量句号的诗学研究。


借用派博所说的“双聚焦”过程结合细读和远读的一个较大的好处在于,它让远读摆脱了要无所不包的压力。再想想歌德的句子:

1. My dear friend, what a thing is the heart of man!

亲爱的朋友,人心是何等的事物!

2. I treat my poor heart like a sick child. 

我待我可怜的心灵如对待病童。

3. I have possessed that heart, that noble soul.

我拥有了这颗心,这高贵的灵魂。(p. 14)


回忆一下,矢量空间模型判断出句子1和句子2在语义上更为接近,从而显示了它的力量。然而,这个例子起初可能显得会适得其反。为什么?因为如果你和我一样最初直觉认为其实句子2和句子3才最为接近——共享第一人称代词,在我看来,这才是最要紧的特征。但这不意味着模型错误或我在这件事上错了;相反,模型促使我去考虑另一种解释。毕竟这是真的——就像派博给他的结果做的注解中说的——由于句子1和2中“我的”和“一个”的重复存在,它们通常强调“所有”和“一般性”(p. 17)。如果我们以这种方式考虑模型,将作为阐释的伙伴而非单一的仲裁者,就难以否认它们能对实践有所贡献。


甚至在派博只使用远读时,他的例子对论证的支持也和他更宽泛的理论申诉一样多,如果不是更多的话。想想他有关功能性的第四章问的那个基本问题:什么是小说?约翰·塞尔告诉我们,虚构语言和非虚构语言之间没有本质差异。但派博还是提出,难道没有哪怕一些常见特征能区分二者?为了找出这些常见特征,他采用预测性机器学习模型,类似于区分垃圾邮件的模型(参见笪章难的评论中的解释)。后来发现,这个模型能根据许多特征可靠地区分虚构和非虚构文本。派博对这些特征的运用落实了一个更普遍的文学史说法,即尽管我们往往认为现代主义引入了对角色和世界间不确定关系的更多重视——“测试”或“假设”的关系——这种强调实际上显而易见属于虚构作品。


当笪章难将她关于词语计数不能有意义地捕捉文学性的论断具体化时,想到的正是此类模型。的确,她提出这个论点时,有一段话提到了垃圾邮件过滤。她认为,我们使用垃圾邮件过滤器等工具时,“[知道]人类的阅读能够捕捉更多细微差异、例外、歧义和限定条件。”但正因为这些过滤器执行了实际任务,我们不在乎——“你不会想要自己来。”但是,当我们做文学批评时,我们执行的不止实际任务,因此我们应该在乎——我们应该更愿意“自己来”。笪章难再次断言垃圾邮件过滤器的“实际”功能和文学批评的“隐喻”功能之间有分野,以此强调她的论断:“如果我们所用工具明面的目标是功能性而非隐喻性的,那我们必须根据其实际功能来运用。”①


①Da, “Against Computational Literary Studies” 620.


但是,仅仅因为一个预测性模型为“实际”功能服务并不能说明它就无法产生“隐喻性”的看法。其实,应该说,预测性模型在实际上起作用,恰是因为它们注意到与隐喻性或描述性相关的特征。例如,假如垃圾邮件能被部分识别,是因为它们可靠地运用例如“钱”这种词,那么可能钱就和“垃圾特质”有某种重要关联。如果根据虚构文学对感知和身体的讨论就能可靠识别它,那么也许这种“现象学”的关切——派博如此称呼它们——就和“虚构性”有某些重要关联。如笪章难所说,细读——如果能在这种规模上运用——会觉察其他细微之处,这也许是真的。但并不完全清楚它是否会探知到相同的细微之处。热切的细读读者读一年的小说,也未必能偶然发现关于身体的词汇出现如此频繁。而这正是派博的重点:计算机可以对我们正常的阐释实践提供信息而不会压倒它。


结论:或两全其美


当然还是会有反对意见。有些人会说我们作为文学评论家的任务本不是归纳——因为,正如派博提到的,新历史主义倾向的评论家认为我们存在主要是为了处理特殊性。其他人会说无论我们是否应该归纳,用计算方法这么做不值得付出那些政治代价——对莎拉·布洛莱特这样的评论家来说,远读对于学术界的新自由主义化让步太多。派博的书可能这两种人都无法影响。它并未小心翼翼为归纳辩护,而主要假设——虽然我认为是很公平的假设——我们确实至少某些时候想要归纳(我们真的情愿让本学科每一本做出一般性声称的主要作品都失效?)。它也没有从抵抗新自由主义化的具体指控出发为模型辩护,而是从不同的政治原因为模型背书:作为一种可拆解学术等级制的工具。


《计算》最可能说服我这样有两种思路的批评家。我和许多人一样,对模型能对智识项目做贡献这个想法持开放态度;但我也和许多人一样,一想到英语系整个儿投入文本挖掘就不寒而栗。对那些和我有同感的人来说,派博也许在这些方面引起兴趣:它所假设的批评世界中,细读和远读、美学分析和数据分析、文化批评和文化分析学可以共存。如果《计算》是某种象征,那么远读就不会、也不应压垮我们这个变化中的学科。我们可以有电脑分析的小说;我们也可以读它。


版权说明

附录1、2两篇书评摘自耶鲁大学 “Post45”研究团队网站(post45.research.yale.edu)。2019年5月,该网站发表了由丹·辛金主持的“Cultural Analytics Now”学术专栏,这两篇书评为此专栏的一部分。感谢“Post45”及丹·辛金授予中文版权。

所评书为安德鲁·派博的《计算:数据与文学研究》(Andrew Piper, Enumerations: Data and Literary Studies)




END


主编 / 陈静、徐力恒

责编 / 任苗青

美编 / 任苗青


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存