查找与替换:约瑟芬·迈尔斯与远距离阅读的起源
主持人语
本期我们讨论的是数字人文研究领域中的社会多元问题。很多人认为,数字人文的前景在于使用计算机制作一些漂亮的图表,以加深我们文化史或者文学表征方面的知识,偶尔也会产生一些挑战传统认知的分析。我们觉得远非如此。数字方法的出现提供了新的机会,让我们可以重新思考人文学中有关社会表征的两组基本问题。第一组是:我们分析研究的对象是什么? 人文学者如何才能揭露社会不公,重现劣势群体的个体声音,并从而挑战权力、表现真理? 第二组是:研究者自身的位置和立场是什么样的? 学术研究的预定对象读者是谁? 对于一些学术传统中的学者来讲,这些问题并不陌生,比如后殖民研究、性别理论和妇女史、种族族群研究、阶级分析等。现在,在数字人文领域,这些问题也越来越经常地被提出来。
目前,有关数字人文的批评空间问题,正在进行一些高度政治化的讨论。社会多元、表征以及身份问题与这些讨论直接相关。一方面,对数字人文持怀疑态度的学者们常认为,量化方法体现了新自由主义的运行原则,数字人文是资本主义生产方式的一种后人类模式,是反人文主义的。另一方面,数字人文的支持者们则认为,实证研究和大规模分析会带来更广阔的批判空间。而且,对那些关心人文研究社会效应(即“公共人文”)的学者们来说,数字人文社会学式的、以数据为中心的批评方式提供了一个颇富吸引力的研究方法。这是相对于传统文学批评和人文学术来讲的,比如20世纪八九十年代高度理论化的学术研究,常常过度理论化甚或晦涩难懂。也许,双方的论点皆有可取之处。
我们组织这期有关社会多元议题的文章,目的并非在于证明大规模计算分析和数据可视化可以拯救人文学研究,只是想探索文化分析和数字人文与对于多元性议题的讨论在何种程度上能形成互相促进、互相转换的关系。真正的重点在于形成批判性的自觉,意识到学术工作的社会性意义,这要求我们不断反思当前所使用的学术工具,以及期待自己的学术工作会起到什么样的社会介入作用。在这个意义上,数据和人文学的结合提供了一次独特的机会。正如本期专栏作者之一劳伦·克莱因所说,“数字人文最伟大的贡献之一就在于它突出了批评者本人相对于其所研究的档案的位置,并唤起对批评者所选择的方法背后的伦理、情感和认识论意义的注意。”这种反思是本期三篇学术论文的集中主题。
雷切尔·萨格纳·布马和劳拉·赫弗曼在她们合作发表的«查找与替换:约瑟芬·迈尔斯与远距离阅读的起源»一文中,针对女性在早期使用计算技术研究文学之中的前驱性角色,提供了一幅修正的历史图景,提醒我们发现并承认在数字分析等工作方面许多女性所作出的贡献。具体来讲,“远读”的方法也许并不仅仅是斯坦福大学弗兰科·莫雷蒂教授在2000年灵光一现的个人独创,而是整个20世纪(或许更早)文学与文化批评中许多人工作的汇流。*这其中包括这篇文章所描述的主角约瑟芬·迈尔斯。迈尔斯的例子让我们想到数字人文领域中,学术资本权限及其分配是一个非常重要的问题,那些在历史上为数字化和学术方法试验作出贡献的人中很多是女性,工作也常是在很简陋的条件下完成的。
在«社会网络分析与“‹大波›三部曲”的人物功能»一文中,赵薇使用“社会网络分析”方法,发现李劼人小说中复杂的情节结构和人物功能。这篇文章也符合我们专栏上一期的主题,进一步显示了数字人文在非西方拼音语言语料库中的发展,是中国文学方面数字人文原创性研究的典范之作,相信之后会启发更多中文学界数字人文方面的研究,也会推动目前在国际人文学语境中还占据边缘位置的非欧美拼音语言的数字人文研究,为数字人文跨语际研究作出贡献。
劳伦·克莱因的文章«缺席的图像»通过批判性地使用托马斯·杰斐逊文件的数字版,研究杰斐逊总统与其奴隶詹姆斯·赫明斯之间的关系。通常而言,数据越多就越能弥补研究中的缺陷,然而克莱因考察的则是研究材料中的限制、空白和失真如何能表明历史档案中的张力。材料的缺失被赋予了意义,具备社会和文化政治层面的价值。这篇文章引导我们批判性地反思普通人与文档(即数据库)之间复杂的历史关系。
此外,本期还包括梅丽莎·丁斯曼对苏真的访谈。苏真是芝加哥大学文本实验室(Text Lab)的创建人之一,也是20世纪美国文学研究领域最前沿的数字人文学者之一,他主要研究后殖民理论和东方主义批判,积极倡导使用文化分析方法来研究美国文化中的种族和阶级问题,这篇访谈正展现了其在此领域的深入思考。
上述文章讨论的重点,在某种意义上来说,不是数字人文中的技术工具或数据化,而是数字人文的研究起因问题。这突出了文学批评中的伦理责任问题,提出了平衡“数字” 与“人文”之间关系的一种方法,即“数字”方法为“人文”问题服务。
查找与替换:约瑟芬·迈
尔斯与远距离阅读的起源[1]
[ 摘要 ] 通常认为利用IBM技术整理阿奎那文集的罗伯托·布萨神父是人文学科定量方法的奠基者,斯坦福大学弗兰科·莫雷蒂教授是第一个提出远距离阅读观念的学者。本文通过学科史研究,发现加州大学伯克利校区的约瑟芬·迈尔斯教授是更早运用计算和远距离阅读方法的学者。迈尔斯的计算词语检索项目和远距离阅读工作相互影响,这也启发了她自己的诗歌写作和诗歌写作教学。同时,她非常注意承认参与数据收集和研究的集体性贡献。这有利于我们建立一个远距离阅读和定量文学史研究方法的多元化的学科史谱系,并使得我们注意到承认数字化和数据收集过程中那些机械性工作的集体性质,打破我们有关数字人文研究者为单一男性性别的僵化认识。
[ 关键词 ] 远距离阅读;列表视图;数据收集;迈尔斯;现代诗歌;
从这天起,每当你看到罗伯托·布萨(Roberto Busa)的名字作为一位人文学科定量或计算方法的奠基学者被提起,我们都希望你在大脑中查找并替换为另一个名字:约瑟芬·迈尔斯(Josephine Miles)。迈尔斯是诗人、美国加州大学伯克利分校英文教授。20世纪30年代她作为加州大学洛杉矶分校研究生完成了自己的第一个远距离阅读项目:分析罗马诗人偏爱的形容词。40年代,她在一位古根海姆家族成员协助下扩展了这一工作,将其变为对17世纪40年代、18世纪40年代和19世纪40年代诗歌短语形式(phrasal form)的大规模研究。在这些远距离阅读工作中,迈尔斯用手、笔和方格纸创造了自己的图表(tabulation)。她还指导了可能是首个使用机器设备(machine methods)的文学词语索引(concordance)。20世纪50年代早期,迈尔斯担任了一个被放弃的、以索引卡为基础的约翰·德莱顿(John Dryden, 1631-1700)诗作词语索引项目的主管。迈尔斯同伯克利分校电子工程系合作,同他们的计算实验室及其IBM打孔卡片制表机定了协议,用机器设备完成词语索引。在她与几位女研究生和女打孔卡片操作员开始工作6年后的1957年公布了结果。因而也大概在那前后开始,布萨传播了他给托马斯·阿奎那(Thomas Aquinas, 1225-1274)全集所做的词语索引的早期概念验证(proof-of-concept)草稿,并在56卷阿奎那索引(Index Thomasticus)的首卷开始出现前17年就公之于众。
学者和新闻记者乐于从布萨开始当然也有充分理由:他是首位将整个过程全部5个阶段都自动化的词语索引作者,那是1951年。[2]布萨还寻求与IBM的托马斯·沃森(Thomas Watson)等人高调合作;他强调其工作的创新性质,他的索引吸收了20世纪50年代晚期直至60年代开发出的新编程方法。反之,迈尔斯同附近科瑞教学楼(Cory Hall)近在咫尺的工程师和机器合作;她认可了合作的女打字员和女打孔卡片操作员的功劳;她珍视“有想象力的”程序员。[3] 迈尔斯接手被丢弃的德莱顿词语索引项目前经历了自身的困境,她试图说服加州大学出版社将她的数据和她对数据的文学批评和文学史阐释一起出版。迈尔斯开始德莱顿项目时,在出版问题和围绕手工及机器词语检索历史的工作流程方面已饶有经验。[4]
因此我们在两件事上依然受惠于迈尔斯。最重要的是在她的工作中我们发现了远距离阅读的一个文学谱系,可并立于其他通过文学社会学追踪“定量或实证的文学史研究方法”[5]之崛起的悠久谱系之列,例如,像特德·安德伍德(Ted Underwood)做的那样。迈尔斯认为计算词语检索的最新进展受到上一代“有创意的”词语检索传统影响,包括“伟大的莱恩·库珀(Lane Cooper)的华兹华斯词语检索,康奈尔1911”(Miles, review, 290)。迈尔斯将词语检索和机器索引看作文学评论的一个核心部分,因为它们能帮助学者更开阔地看待诗歌间和诗人间的比较。迈尔斯的远距离阅读工作不只是文学的,在某种重要意义上要也是现代主义的:她的工作测试并推翻了她那一代人将现代主义诗歌和玄学派诗歌定义为“坚硬”(hard)或“具象”(concrete)的若干叙述。迈尔斯的远距离阅读项目因而也是二十世纪诗歌史的一部分。她没有将其“列表视图”(tabular view)限于文学史;她的定量工作还影响了自己的诗歌风格并塑造了她在伯克利向A.R. 埃蒙斯(A. R. Ammons)和杰克·斯派塞(Jack Spicer)等诗人教授的“韵文写作”(Verse Composition)课程。
用迈尔斯替换布萨还有第二个功能:它能作为一个例证,看我们如何可能撰写一部不以原创性和个人成就为中心的文学学术史。尽管布萨得到了许多同伴的帮助——梅丽莎·特拉斯追寻到了布萨的女性打孔卡片操作员们并肯定了她们的贡献[6]——但她们的名字并未在其已发表著作中得到肯定。反观迈尔斯,则非常细心地肯定了在她的项目中工作的女性。她在德莱顿索引的封面列出了两名研究生工作人员的名字,玛丽·杰克曼(Mary Jackman)和海伦·S·阿戈阿(Helen S. Agoa)。她在序言和后来的访谈中都谈到她和伯克利科瑞教学楼计算实验室的潘妮·基(Penny Gee)协作的重要性。她还强调说如果不是加州大学出版社的一位“英雄女性”、“打字大师”主动提出打印那些表格,她的《文艺复兴、十八世纪和英语诗歌的现代语言:列表视图》(Renaissance, Eighteenth-Century, and Modern Language in English Poetry: A Tabular View )(1960) 就不可能最终印出。[7] 那么,用“迈尔斯”替换“布萨”就让我们得以想象来自文学研究学科内部的计算协助阅读的起源故事,其中还包括一位保留了其女性合作者姓名的女性项目负责人。迈尔斯的职业生涯还提供了远距离阅读和文学分析定量方法的另一个起点。它促使我们看到迈尔斯的计算词语检索项目和远距离阅读工作如何相互影响,并共同启发了她自己的诗歌写作和诗歌写作教学。
德莱顿项目起初进入迈尔斯的生活时是某种“系里的义务和杂务”。[8] 迈尔斯的同事盖伊·蒙哥马利于1951年去世时,留下满满64个鞋盒的索引卡片,是要做成德莱顿全集的词语索引的。时任伯克利英文系主任的乔治·波特(George Potter)写信给蒙哥马利的老学生,但没人能承担这个项目。波特让迈尔斯做此项工作,因为她的学术研究有十年以上一直专注于词语检索和制作图表。迈尔斯记得波特说:“你这么多地用到词语检索,还有那么多计数,你应该能够处理盖伊·蒙哥马利死后留下做德莱顿词语检索的这六十三盒卡片。”迈尔斯回忆道,这个项目“将我引入多年的计算机研究,我确实做出了计算机词语索引”(Poetry, Teaching, 75)。为了把索引卡词语索引转换为计算机词语索引,迈尔斯向教师研究委员会申请资助,用来同电子工程系签约,使用他们的IBM打孔卡片制表机和打孔卡片职员,创造一套修正过的新的制表用卡片。加州大学伯克利校区大学校长罗伯特·史普罗(Robert Sproul)给光刻复制研究成果拨款以备出版。
迈尔斯1957年写信给蒙哥马利以前的研究生及合作者莱斯特·A 哈伯德(Lester A. Hubbard),描述了项目的“实验性”和合作性质:“词语检索经过了那么多次重大变化……至少有七个名字必须列入编辑名单”(letter to Hubbard)。出版后的序言中,迈尔斯感谢了英语系、法语系和言语系(Speech Department)的教员,但她特别提出“在计算实验室戈登·莫里森(Gordon Morrison)先生和博伊德·贾德(Boyd Judd)先生指导下工作”的计算实验室女职员,包括雪莉·莱斯(Shirley Rice)、奥黛特·卡罗瑟斯(Odette Carothers)和潘妮·基,[9]她们给词语索引中每张卡片打上一个单词,一个与单词出现其中的那首诗的标题相对应的符号,还有一个诗行编号。[10] 后来,迈尔斯记得基“非常聪明优秀”,——最重要的——是真正的合作者,和那些“圣何塞来的IBM的人”相反,他们会定期过来不痛不痒地问:“我们能帮你做什么?”“我从来没法和他们建立联系,”迈尔斯解释说,“但我和潘妮·基做到了。她真的让我受到教益。”(Poetry, Teaching, 126)。
词语检索[11]出版时,迈尔斯选择肯定两位研究生玛丽·杰克曼(Mary Jackman)和海伦·S. 阿戈阿(Helen S. Agoa)的编辑工作,她们曾在词语索引最后阶段紧张工作,但她拒绝将自己的名字放到封面上;她的名字作为《词语检索》序言作者出现。后来,哈伯德需要请一位律师,以他和盖伊·蒙哥马利共同工作并产生了最初那套索引卡片为基础、要求认可自己为共同作者。印着哈伯德名字的小纸条被发放并粘贴到已经出版的书卷中。
到1957年德莱顿词语索引出版时,迈尔斯用自己手写的单词计数分析诗歌语言已近二十年。作为20世纪30年代后期加州大学伯克利研究生,迈尔斯的论文考察了华兹华斯的语言——特别是考察他是直接字面表达感情或通过隐喻。“我开发了一个这么做的方法”,迈尔斯后来解释,“包括计数,因为我想要给出实际的比例,就是说他只在字面上表述,几乎不做别的”(Poetry, Teaching, 65)。《华兹华斯与感情词汇》(Wordsworth and the Vocabulary of Emotion)1942年印刷出版,随后是《十九世纪的可悲谬误:变动中的物体与感情关系研究》(Pathetic Fallacy in the Nineteenth Century: A Study of a Changing Relation Between Object and Emotion )(1942)和《从怀亚特到奥登的英文诗歌中的主要形容词》(Major Adjectives in English Poetry From Wyatt to Auden)(1946)。
迈尔斯以20小时25美元的薪酬雇研究生帮助她为过去诗歌中的形容词、名词和动词及其在诗歌句法中的位置制表;有时像“简·沃伦小姐”[12]这样的学生会建议修改“分析方法”。[13] 后面几十年中出版了《诗歌语言的延续性》(The Continuity of Poetic Language)(1951)、《英语诗歌中的年代和风格》(Eras and Modes in English Poetry)(1957)和《文艺复兴、十八世纪和英语诗歌的现代语言:列表视图》(Renaissance, Eighteenth-Century, and Modern Language in English Poetry: A Tabular View )(1960) 。
不同年代里,大规模文学数据收集的命运起起落落,迈尔斯工作的时期,制作数据集被看作女性化、机械化工作。[14] 相应地,她要说服出版商复制她的数据时遇到了困难,也难以在评论家中获得认可,他们觉得她的数据集仅仅是为真正的评价工作做预备。迈尔斯形容,她的项目在语言学研究和文学研究之间“两头落空”。她不认同语言学家,因为语言学分析“与文本格格不入”。同时,文学评论家在丢弃“她插进去的那些图表”的同时又希望吸收她书里那些“有意思的”说法(Poetry, Teaching, 133)。
三、列表视图和世纪中叶的评论(The Tabular View and Mid-century Criticism)
迈尔斯的目的是结合评论与数据;对于那些“把有关诗歌语言为何的讨论变成诗歌语言应该为何的批评指示”的评论家,她认为她的列表是种矫正,还说“不只是理查兹(I.A.Richards, 1893-1979)这种理论家,连贝特森(Mary Bateson, 1865-1906)这种历史学家做的评估都比列表多”(Major Adjectives, 305)。克里斯多弗·罗维(Christopher Rovee)形容她是“新批评时期早期形式主义者中的离群之马”,而且她与世纪中叶的诗人—批评家和形式主义理论家对话很多。[15] 迈尔斯给往昔诗人的语法倾向做的列表不仅揭示了过去诗歌的形式,也展现了二十世纪中期的诗歌价值观在何等程度上从多个层面上决定了评论家对过去的感知,将布莱克(William Blake, 1757-1827)或邓恩(John Donne, 1572-1631)或华兹华斯或叶芝等诗人变成了当前诗歌的“镜子”。[16]
例如我们可能认为布莱克是“活跃的、反叛的和怪异的”,但迈尔斯的著作表明了他如何“和所有人一样全心全意接受他同类和时代的素材”,使用的语言“名词和形容词……远远超过动词,”句子“由短语复合”(phrasally compounded),节奏“强调的不是限制、时期界限和结论……而是内在单元和对应,在回声和象声词里”(Eras, 87)。
至于邓恩,迈尔斯形容像克林斯·布鲁克斯(Cleanth Brooks)和I.A. 理查兹这样“强调诗歌是审美客体”的“现代批评家”如何必然忽视或歪曲列表视图揭示的邓恩诗歌中占支配地位的“概念指涉和辩论的语言”(Eras, 31)。同样,迈尔斯表明世纪中叶对华兹华斯的评论几乎全是臆造,指出现代批评家“忽视了华兹华斯的作品主体”,自行挑选了不具代表性的诗歌,例如以“其岩石、石头和树”代表了“我们自己重大的具象化”的《昏睡曾蒙住我的心灵》(“A Slumber Did My Spirit Seal”),而非华兹华斯更典型的微妙概括的风格(Eras, 128)。叶芝也被从当下角度加以赞扬,然而迈尔斯的著作显示,他后期作品的语言——迈克尔·罗巴兹和舞者》(Michael Robartes and the Dancers)(1921)、《塔》(The Tower)(1928)和《盘旋的楼梯》(The Winding Stair)(1933)——变得更少而不是更多表述(predicative),反而转回最早期作品的平衡和古典风格。
迈尔斯的列表视图不仅拯救了被当下诗歌价值观绑为人质的往昔的诗人,还揭示出将过去与现在相连的全新的谱系。迈尔斯几乎所有学术论文都有关于现代诗人的新颖而发人深省的旁白。例如,她提出“邓恩传统”如何在“卡明斯(e.e.cummings)和米莱(Edna St. Vincent Millay)的骑士抒情风格”中和“弗罗斯特(Robert Frost)和奥登(W.H. Auden)的形而上冥想”中一样继续生存(Eras, 27)。她描述了古老民谣中突出的“父亲、母亲、儿子的家庭关系”如何在“奥登或洛威尔(Robert Lowell)等诗人中”(Eras, 107)重现,而埃兹拉·庞德和罗伯特·佩恩·沃伦(Robert Penn Warren)以及费德里科·洛尔迦(Federico Garcia Lorca)则发展了“柯勒律治(Samuel Coleridge, 1772-1834)关于夜晚和奇妙的叙事诗”(Eras, 110)。她认为T.S.艾略特尝试在弥尔顿式的短语诗歌(phrasal poetry)(定性的、同等的)与邓恩式表述性诗歌(从句的、概念的、充满逻辑从属关系)之间“获得平衡”(Eras, 24)。
迈尔斯站在她那个时代评论的老生常谈对面——对意象的强调、将诗歌从散文分离、将诗歌作为客体定型——开辟出另一种对现代诗歌挑战及力量的看法。在她看来——将诗歌看成句子、追踪每个世纪的钟摆从动词到形容词再回来 ——20世纪50年代的诗人面对着“蒲柏(Alexander Pope, 1688-1744)或汤姆森(James Thompson, 1700-1748)”在18世纪面对的相同挑战:他们有“数量多到令人窒息的方法去应付数量多到令人窒息的客体和感觉”。迈尔斯认为,现代诗歌需要“它自己的华兹华斯,成为自己的措辞的概括者和坚定的阐释者”(Eras, 125)。
迈尔斯自己的诗歌反映了她的抱负,要从诗歌问题后撤得足以成为“……措辞的概括者和坚定的阐释者”,但又不至过分到与“同文本格格不入”。罗伯特·比鲁夫(Robert Beloof)在1959年的一篇题为《距离和表面:约瑟芬·迈尔斯的诗歌》(“Distance and Surfaces: The Poetry of Josephine Miles”)的文章里评述了迈尔斯的几部诗作,描述了迈尔斯以自己的视角达成的成就。她“从一种最困难的艺术视角看她的世界……中景(middle distance),”比鲁夫写道。从这个特定距离,“一方面她从未意识到它是个宏伟的形而上的体系,另一方面也没有意识到它是一道细节之流,本身即终极现实。”“中景观察者距离够近,能看到人物及其主要的态度,但不会感到与有他们无法消解的联合。他也没有远到其印象完全是过度延伸的结构。怎么都不容易。他被朝着两个方向拉,朝着群体中的个体,也朝着为他们建立秩序的宏大抽象。”[17] 被两头拉扯的迈尔斯朝向了第三个方向——并应当在我们的方法论起源故事中列首位。
责任编辑 | 陆晓芳
主持人简介
姜文涛
姜文涛,美国纽约州立大学哲学博士,现任职于浙江大学国际联合学院人文与社会科学研究中心,主要研究方向为英国十八世纪印刷文化及情感研究、文艺理论和比较文学、数字人文。
戴安德
戴安德(Anatoly Detwyler),美国哥伦比亚大学哲学博士、东亚系教师,主要研究方向为中国现代文学和数字人文。
作者简介
布 马
雷切尔·萨格纳·布马(Rachel Sagner Buurma),美国斯瓦斯莫尔学院(Swathmore College)英文系副教授,研究方向为18和19世纪文学与印刷文化、20世纪英美文学批评以及文学信息学。
赫弗曼
劳拉·赫弗曼(Laura Heffernan),美国北弗罗里达大学(University of North Florida)英文系副教授,研究方向为美国现代主义文学、小说史及专长社会学(Sociology of Expertise)。
译者简介
汪 蘅
汪蘅,毕业于北京大学英语系,自由译者。
转载请联系授权。
Integrating Technology into Liberal Arts Education
“Prehistory” of the Digital Humanities at Tsinghua University in the 1920s
欢迎投稿,稿件请发至
dh2020@tsinghua.edu.cn
长 按 关 注