查看原文
其他

李今 | 数字时代的考据问题与机遇 ——从“现代汉译文学编年考录(期刊编)1896—1949”数据库说起

李今 中国现代文学研究丛刊 2023-03-17


现代汉译文学编年考录数据库首页



内容提要

介绍国家社科基金重大项目组与中华书局古联数字传媒有限公司联合开发的“现代汉译文学编年考录(期刊编)1896—1949”数据库的主要功能和价值,并以该数据库的建立与其数据预处理的个案考据事例,具体呈现了传统研究方法与数字化技术应用之间相互生发与创造性转换的新形态,从而探讨人文学术在数字化时代所遭逢的问题与机遇,显示出传统研究成果向数字化转型的新路向。


关  键  词

汉译文学 编年考录 数据库 考据


学界将最近十几年由新史料观,特别是计算机和数字化技术所引发的,史料存储、呈现及获取方式的巨大变革,称为“史料革命”。虽说数字人文的发展已经进入数据挖掘、情感计算、文体测量学、网络分析等应用的新阶段,我所受惠的这个“史料革命”,主要还是图书馆博物馆馆藏文献档案的数字化,这一步无论怎样估价都不过分,它是一次伟大的科技创举。其进一步的发展,现在已经显示出从聚积型数据库向聚类型专题数据库过渡的趋势。由我主持,夏晓虹、方锡德、孙郁、解志熙做子课题负责人,罗文军、赵天成、熊婧、朱佳宁、李欢著录的国家社科基金重大项目组与中华书局古联数字传媒有限公司联合开发的“现代汉译文学编年考录(期刊编)1896—1949”数据库(以下简称汉译文学数据库),从立意、立项、撰写、结项,到数据库开发,正贯穿于这个史料革命的爆发过程之中,可以毫不夸张地说,该数据库在相当大的程度上是因这个“史料革命”而起意,也凭借这个“史料革命”得以建立。

下面先介绍一下该数据库的功能和价值,再结合现代汉译文学期刊史料的整理与其数据库的建立,谈谈传统研究方法,特别是考据与数字化技术应用的相互生发与创造性转换,在数字化时代所遭逢的问题与机遇。


汉译文学数据库的价值和功能


“汉译文学研究”是上世纪末西方翻译研究的文化转向学术思潮和世界文学理论研究的复兴流布到中国而兴起的“新学问”,因为这两种理论都把翻译提高到前所未有的位置,它的新眼光、新问题使一向被忽视的汉译文学产生出新价值,使“汉译文学”或作为中国文学的一个组成部分,或作为世界文学的一支流脉“登场”,从边缘文献史料进入学术前沿。

汉译文学长期被学界视而不见的原因是,由于长时期以来,翻译专业的传统都集中于如何翻译、怎样翻译才能与原作对等的问题,因而,其研究范式以经典译本与大翻译家为主要对象。这样,历史上丰富的汉译文学文献,特别是晚清民国时期那些翻译得并不规范、甚至是“豪杰译”的译作就被当作垃圾而打入冷宫;而中国近现代文学研究专业则一般把汉译文学作为背景,并不专注于此;比较文学研究的对象是世界文学及其相互关系,往往把中国文学与相关原语文学直接对接比较,也忽略了汉译文学普及与传播的这一转换环节。的确,若以是否忠实而充分地传达了原作的形式与内容为标准,历史上不忠实的译作价值不大,但如果考察中国从传统向现代、中国文学从传统向现代的转型或过渡的问题,就不能无视历史上的汉译文献,毕竟中国主要是通过不同历史时期的译介来了解西方,以译介西方来学习西方的,从这个意义上说,汉译文学就显示出作为一种历史文献的价值,而且正是在不忠实的改写之处,隐藏着极其丰富的历史与文化信息。

由于晚清民国时期所爆发兴盛的“向西方寻找真理”的时代潮流一直汹涌澎湃,这方面的文献史料也汗牛充栋,亟待被整理。我们做的即如梁启超所说“治一学,第一步,先将此学的真相弄清楚”的工作。

就整理晚清民国时期汉译文学史料的复杂性来说,它不仅涉及跨文化、跨语际的文学及其思潮的知识,特别棘手的是,这一时期外国作家及其作品汉译名极不统一,译介者又多使用笔名且变化无常的“同实异称”问题。如雪莱(Shelley),曾被汉译为解莱、许丽、希雷、师梨、休娄、希利等,普希金汉译名就出现过柏书卿、蒲轩根、布雪金、朴思径、波希穆、普式庚诸种;《简爱》曾被意译为《重光记》《孤女飘零记》,又被音译成《真亚耳》;译介者鲁迅使用过索子、风声、杜雯、庚辰、唐俟、L.S.、封余、葛何德、邓当世、茹纯等笔名,周作人尚以萍云、碧罗、病云、独应、三叶、黑石、仲密等别名发表译介,若不加以考证、注释,一般读者很难将两者对应起来。更何况此一时期署名还不规范,著译者多有佚名情况。加之有相当数量的原作者、译介者不见经传,有些虽曾名噪一时,后来却湮没无闻。凡此种种都说明,整理汉译文学史料若仅仅照抄,难以认知原作者、译介者是谁、原作是什么这些最基本的问题,由此也决定了考录的必要性与难度。汉译文学史料混乱的实存状态,特别是汉译名“同实异称”的难题在新世纪数字化的快速发展时期愈发亟待处理解决。因为它使汉译文学研究者无法充分利用相关数据库进行有效的检索,这就逼迫我们从最初只想汇集汉译文学史料,建个专题索引数据库,到致力于解决汉译文学史料的检索难题,以助力汉译文学的研究。

目录学从来是治学的一条有效途径,传统古典文献学特别重视文献的分类和目录,在目录中又更重视“录”(解题、撮要)。但现代文献目录多有“目”无“录”,难以更好地发挥“辨章学术,考镜源流”的作用。实际上,在古典目录学中,“录”是目录功用和价值的最高层级,具有“揭示内容,订正讹误、考察存佚、研究版本、叙述源流”等丰富的学术内涵。鉴于此,汉译文学编年考录的学术追求旨在不仅做“目”,也做“录”,以将目录这一学术文体的价值充分发挥出来,为汉译文学研究建立起跨语际、跨文化、跨学科的知识系统。而且,汉译文学编年考录也是要实现该专题史料数字化的前提,只有经过规范化的预处理,数字技术才能大有作为。

所谓“考录”,是项目组结合汉译文学的实存状态及其研究的需要,吸收目录学的提要和做卡片的传统研究方法所设计的一种“录”的体式,其体例要求:


1.在每一译事条目下考证其译作原名和今译名、作者原名和今译名、译介者原名,或常用名,从而使之规范化,以方便认知和检索。

2.考述原作者、译介者生平简介、译作的版本、来源、缘起、翻译目的、翻译策略、形式等。

3.摘要、概述有价值的外国作家作品评论,有关翻译的理论、批评、活动以及相关信息。


为此,项目组成员都花费了相当多的时间与精力,从图书馆、中外互联网和数据库,广泛搜罗了各种工具书、期刊、图书,特别是集纳了已有的零散个案研究成果,逐个条目、逐项内容地查询、落实、考述相关信息,在相当大的程度上大规模地清理了这一时期混乱不堪的期刊汉译文学史料。经过八年的努力,我们项目组终于以前所未有的规模为1896—1949年间226种期刊上登载的汉译文学及其相关现象做了编目、整理和考释,撰写了约10000个条目,进行了原作者、译介者、原作的考订以及规范化的编年考录处理,涉及多达1580位外国作家,为2130位译介者做了生平简介及其笔名录,从而使之与现今外国文学知识体系相对接。当我们将汉译文献基本知识考证清楚后,不仅为一个新的研究领域建立起期刊汉译文学独立的史料专题,也为电子检索提供了条件。

在此成果基础上,IT技术人员进一步借助自然语言处理的同义词功能,以及检索功能,建立起同义词库及其专题性检索系统,使汉译文学考录数据库不仅是专题文献数据库、知识库,还可以成为该专题的研究工具。

大体说来,汉译文学编年考录数据库具有三大主要功能:

第一,实现了“同实异称”的关联检索。

如上所述,与一般直接将历史文献数字化的数据库不同,它是针对晚清民国时期外国作家及其作品汉译名不统一、译介者笔名繁多、研究者无法充分利用数字化手段进行检索的难题而设计的。经过中国近现代文学专业学者对外国作家及其作品的不同汉译名、译介者的不同笔名,包括佚名作品逐一进行考证、钩沉和统一规范化预处理后,再施以数字化检索技术,从而实现了原著者及其作品曾译名与今译名、译介者笔名与常用名的关联检索。这使该数据库所提供的两种检索模式:全文检索和基于数据库的字段检索,只要输入一个名字或词语,如鲁迅,他曾使用的索子、风声、杜雯、庚辰、唐俟、L.S.、封余、葛何德、邓当世、茹纯等笔名的相关文献均可以同时呈现;如雪莱(Shelley),即使曾被汉译为解莱、许丽、希雷、师梨、休娄、希利等,其相关资料信息也能同时在全文检索中列出。


数据库期刊列表


第二,项目组的前期考录和数据库的后期制作将传统分类目录索引与数字化检索相结合,为这一领域的研究建立起专题性分类目录索引系统。

该数据库吸纳了传统目录学通过类的区分和书目的解题示学人以读书、治学之门径的方法,对期刊上汉译文学相关译作、文章、序跋,以及周边资料、出版情况做了先期的撮要、概述、校订和摘录。考虑到现有的期刊文献数据库难以达到全文检索,一般仅是目录检索,我们在考录中注重摘录文章所涉及的概念和人名,这样就可以拓宽可检索的内容,从而提高专业类词汇在检索中的权重,有效提高和扩大检索的准确率和范围。数据库所提供的按原著者、译介者、作品/文章名、文体、国别、刊物等字段进行的分类检索和可选择性的分类阅读模式,能够使相关信息以类相从,条其篇目,方便学者按类阅读,也可以按类查找相关文献,翻检贯通,索其沿革,不仅可以集中掌握该领域的基础信息,更能够便捷地分类组合、盘活汉译文学领域的史料,从中发现新的议题、论证模式,以及进行量化统计与分析。虽说目前数据库所收期刊不全,但将其视为大的抽样调查,进行各种分类的量化研究还是可行的。

第三,通过对编年、目录学和考述方法的综合运用,系统发掘、考辨和整理,为汉译文学著录了一种接近文学原生形态的编年体文学史,建立起跨语际、跨文化、跨学科的知识系统,由此转化为数据库的汉译文学编年阅读模式,集汉译文学初刊文献史料专题库、知识库、分类目录索引为一体。

鉴于汉译文学跨文化、跨语际、跨学科性质会造成阅读的困难,在提供期刊汉译文学列其年月、比其译事的编年阅读模式基础上,又结合数字化技术,专门设计了可以点击即时浮现原作者、译介者、期刊等简介的辅助阅读机制,以方便读者随时获取所需要的知识信息。而且该数据库也不仅是专题性的目录索引数据库,还可全文阅读。所有汉译文学考录条目的文章均配以原刊文本图片,方便读者根据自己的需要扩展阅读,也方便查核,以打破纸媒阅读的限制,为读者提供立体而自由的可选择性的阅读体验。

总之,“汉译文学考录数据库”是在互联网、数字化时代,向专题数据库、知识库、研究工具发展的升级成果。由学者和IT技术人员相结合,针对汉译文学研究领域的问题,为满足和服务该领域科研的需要而开发建立。不仅以前所未有的规模,为1896—1949年间重要期刊上汉译文学的每一条目做出了考释、纠错、规范、摘要和概述,也最大规模地汇集了汉译文学翻译家的笔名、外国作家作品的不同汉译名,并对其做了生平简介。按时间顺序阅读,则可看作一部编年体的汉译文学史和知识库,从而为这一领域提供了基础研究和深入研究的新工具。


考据在数字化时代所遭逢的问题与机遇


“汉译文学编年考录数据库”是建立在大量的考据之上的,并与数字化时代的发展交织在一起,我们在借力数据库的同时,也不得不解决文献数字化所带来的问题。那么,数字人文的新时代会给传统的考据方法带来哪些改变和特点?其利弊有哪些需要引起我们的注意?

史学和考据离不开史料,对于用文字做基本的研究来说,史料的实存是固定的,关键是你难以占有,更难以全面地占有,随时随地可以信手“拈”来。文献数字化其最基本的价值就在于获得材料的便捷与丰富,特别是大型数据库、专题数据库的大量涌现不仅能够盘活常规性资料,更能够复活死材料。这一学者们所说的“人文研究的底层革命”,隐含着一个价值观的悄悄改变。即过去考据强调以实物为准,版本考据要依据原书。数据库的出现意味着可以原书原刊的图片影像为依据。由此清晰划分出学者和收藏家的不同,文字的复制件基本可以满足做学问的一般信息要求,当然需要警惕复制过程中可能会出现的错误。所以当遇到疑难问题时,得出断案的根据仍要以原书实物为准。实际上,现有的数据库还未能提供所需的全部史料,即使如此,也是学术的一大解放,与过去凭借孤本秘籍、拥有丰厚藏书才能做学问的垄断性相比,不能不说是开辟了人类文明进程的新阶段。想想过去泡图书馆的艰难和耗时费力,就该知道能够坐在家里轻松获取过去学贯中西的饱学之士也难以占有的古今中外资料,是个多么了不起的人类科技的创造。在传统研究方法仍行之有效的同时,这一创举已经带来学术风貌的巨大改变。

显而易见的是,竭泽而渔的学术追求与量化统计方法的普遍应用,为学术发展最早输入了活力。虽说过去也提倡竭泽而渔,但对于进入报刊媒介时代的现代学科专业来说,实际上是很难做到的。所以,一般是退而求其次,即论著或论文的质量以其占有资料的多寡作为判断的标准之一。随着文献数据库及互联网搜索的普及,这一可望而不可即的学术理想具备了实现的可行性,由此引发了作家全集、作品集补遗、编撰、辑佚、钩沉的大繁荣,以及作家生平史料的搜集、整理、考订的新发现。过去限于占有资料的局限,特别反映在有关宏观历史的总述上往往采取举例排比的概括式,或征引权威话语的认同式,而大型数据库、语料库的出现使研究可以进入“以数据说话的时代”,特别在概念史、观念史的研究中被有效实践,大大提高了史学的科学性。在这方面的重要成果就是金观涛、刘青峰著《观念史研究——中国现代重要政治术语的形成》。作者依托“中国近现代思想史专业数据库”,通过对上百个现代政治术语的量化统计及其词义分析,相当深入地集中探讨了“权利”“个人”“群”“社会”“社会主义”“天下”“万国”“世界”“共和”“民主”“富强”“经济”“格物致知”“科学”“生产力”“革命”等,与近代中国息息相通、至关重要的观念之形成和演变,其方法论的创新性和科学性,体现了数字人文的巨大优势。


考录正文阅读页


虽说文献数据库及互联网搜索使史料的获取更加便捷与全面,必然会使历史化的追求更具体到历史的细节和来龙去脉的钩稽考订,但这次做“汉译文学数据库”的经验还让我意识到,史料扩张所呈现出的知识歧义问题,暴露了近现代文学,特别是汉译文学知识体系尚未定型,史料考辨成为当务之急的现状。数据库能把所需资料爆炸般地推送出来,既极大地膨胀了考证的参考资料,也加大了考证的难度。先就数据库有利于考证的方面来说,汉译文学考录的一个重要内容是译者简介,但相当多的译者已被历史淹没,如果没有数据库的搜索工具是很难找到他们的生平资料,为其做注释的。举个例子:

1928年远东图书公司出版、钟敬文编《马来情歌集》中的两篇序《论马来诗歌》和《马来民歌一脔》分别署名警民和革尘撰写,但两位何许人也,不得而知。按照一般做法,我会上读秀数据库查找线索,但这位“警民”出来的信息,铺天盖地都是“警民共建”之类(综合文献数据库的问题,信息爆炸),完全不贴边;而“革尘”名字偏僻,显示出来的都是照抄,不做介绍的信息。无奈之下只好求助于笔名工具书,让我兴奋的发现是,郑振铎的字是警民,也是他的笔名之一。考虑到郑振铎关注民间文学,而且编选过情歌,还在《小说月报》上连载过《希腊罗马神话传说中的恋爱故事》。当我查阅到郑振铎在1928年从欧洲回国后,又与远东图书公司关系密切,不仅自己在那儿出书,而且将《文学周报》也改由远东印行时,我几乎判定这个“警民”就是郑振铎了。但仍有疑虑的是,为什么编者钟敬文一直不披露警民即郑振铎呢?为慎重起见,我又去查《郑振铎年谱》《郑振铎全集》都未发现这篇文章。听说郑振铎研究专家陈福康不久前修订了郑的年谱,由于刚刚出版,学校图书馆还未购进。时间不等人,不得不在网上订购了一套。收到后,翻了一天也没找到这篇文章的信息,不由暗自高兴,会不会是钩沉了郑的一篇佚文。但还是因为疑虑,没有轻易判定。转念一想,何不再搜搜钟敬文编的这本《马来情歌集》呢?点开了不知多少条信息,功夫还真是不负有心人,竟然在《马来西亚华文报业史》的《槟榔小报》简介里把两位序文作者的生平之谜解开了。原来他们均为华侨,曾一起在暨南大学读书,一起翻译马来情歌,毕业后又一起回到家乡,曾在这家报纸一起担任编辑。这回准没错了,想想如果不是同时发现两位的生平,把警民推测为郑振铎也真是有充分理由的,但却是错的。

由此可见如果没有文献数据库,如何能想到去查找《马来西亚华文报业史》?很可能就会认定是郑振铎了。这也让我意识到,传统人工收集资料的方法往往是“按图索骥”地去翻检、搜求,如从各种目录、索引、作家自述,以及亲友的回忆文章中去找到线索等,但文献数据库、互联网却可以迅速组合、汇聚相关史料,时常会让人有出乎意料的发现,这也是文献电子化的又一优势。

另如清末重要的翻译家奚若(1880—1914),郭延礼在《中国近代翻译文学概论》中认为“其地位可与周桂笙相伯仲”,并为二人专设一章。奚若译有“述异小说”《天方夜谭》(商务印书馆,1906)、哈葛得“言情小说”《爱河潮》(小说林,1905),还与周桂笙合作,分别翻译了“侦探小说”系列《福尔摩斯再生后探案》(小说林社,1904—1906)之一至十三(其中奚若译有第二三案、第四五案、第六七八案三种单行本)等,其译作多达二十来种。曾用笔名天翼,英文名为Richard Pai-Shou Yie,经常自署“元和奚若”“东吴奚若”。但关于其生平,翻译史家过去所知寥寥,甚至被误认为是另一个翻译家张奚若,《民国时期总书目·外国文学》还将其译作《天方夜谭》的译者误标为伍光建。虽然近来经过不少学者的考证,使其生平逐步丰富,但关于其生卒年及经历,却其说不一。后来我也是借助数据库搜索,偶然在其生前任职的《进步》杂志1914年第6卷第5期上发现了“天翼奚君遗像”,还有盖棺论定的讣告:“天翼奚君,名若,字伯绶,吴县人。弱冠后毕业东吴大学,游学美国,得文学士学位。1911年冬间返国,任本杂志编辑,历二载有奇。本年三月间忽撄末疾,淹滞床蓐者,百数十日,竟于八月二十四日化去,年三十五岁。奚君学问才具,卓尔过人,热心宗教,年力富强。方冀大有作为,造福斯世,即本杂志译政,亦正资倚赖。溘然长逝,何胜悯惜!特志于此,以申悲悼。”由此方获得了他可靠的生平简介证据,加之综合其他学者研究成果,使其形象和翻译成就得以落实。

但也不必讳言,有一利必有一弊。互联网“数据横生”“信息爆炸”的能量也会给考据带来相当的难度,这就是我为什么说,数据库的大量开发和普及会使学术研究越来越加大史料考辨比重的原因。

比如,当查找译者信息时,数据库可以把各种工具书、回忆录、地方志、研究性文章的相关资料都推送给你,但经常你会发现歧义丛生。如伍光建是一位晚清民国时期的大翻译家,不少工具书都收入了他的词条,仅关于其生年就有1865、1866、1867年三种不同说法。如果按照一般的百科全书式生平简介体例,只写出考证的结果即可。但面对不同、甚至相差悬殊的记载,就不得不考订其异同。经过比较,我们最终采纳的是其子伍蠡甫在《伍光建的翻译》一文中1866年的说法,并将采信的理由加以说明。当然若没有歧义,直接采取百科全书体即可;若反之,即使发现不同记载,也不做考异,读者如何能知道你的采信持之有据呢?这就逼迫我们打破百科全书体,写出考异的明文,论证清楚采信的由来,即使不能考定,也可使读者得知其异说,做进一步的探究。举个例子:

梁启超办的《时务报》于1896年8月第1期开始陆续刊登了五篇柯南道尔的侦探小说,作为维新派大力创办宣传刊物的起始,最早发表的译作,其重要性不言而喻。关于这五篇译作的译者主要有两种不同说法:

1.由于从目录到正文,这五篇译作发表于同一固定栏目,其文章均无译者署名,仅于此栏目名称下署“桐乡张坤德译”,所以,一般认为译者是张坤德;

2.由于该栏所载的这五篇译作后合集为《新译包探案》,于1899年夏(己亥夏)由素隐书屋出版。阿英编《晚清戏曲小说目》载录:“《新译包探案》:时务报馆译。丁杨杜译。光绪己亥(一八九九)素隐书屋刊。二十九年(一九〇三)文明书局刊。收柯南道尔福尔摩斯探案五种。”因此,有学者判定译者是时务报馆丁杨杜。

为做汉译文学编年的考录,其著录者罗文军在“全国报刊索引数据库”中发现,《江南警务杂志》曾于1911年第13期重新发表其中的一篇小说:《英包探勘盗密约案》(未完,但译文与《时务报》第6、7册所载该题小说一致),译者署名曾广铨。并在末尾处附有说明:“第二期别录,译者姓名曾广铨,铨字误为钧字,特此更正。”经查,《江南警务杂志》第2期“别录”栏刊载的《中国侦探案续编》并非译作,作者署名为“恽福成”,只有第12期“别录”栏所载《英国包探访喀迭医生奇案》一篇才署有“湘乡曾广钧译”。据此推断,该更正中所说的“第二期”应为“第十二期”之误,即《江南警务杂志》第12期所载的另一篇侦探小说《英国包探访喀迭医生奇案》的译者也是曾广铨。这样,也就起码可以确定1896年《时务报》第1册所载《英国包探访喀迭医生奇案》和第6、7册所载《英包探勘盗密约案》的译者均为曾广铨。

曾广铨(1871—1940)现已少有人知,湖南湘乡人,号敬怡,又名景沂,但若说起他作为曾国藩孙、曾纪鸿子,后过继给晚清著名外交家曾纪泽做嗣子的出身,就如雷贯耳了。他本人的经历也不同凡响,早年随曾纪泽生活在英、法、俄等国多年,精通英、法、日、德语及满文。1890年曾纪泽逝世后,承其父荫,补用为兵部员外郎。1893年被派驻英国使馆,充任参赞。于1897年正式接编《时务报》第46册“英文报译”(后改“西文译编”)栏目,并参与创办蒙学会,与汪康年等创办《蒙学报》、《时务日报》(后改名《中外日报》)等。1898年出任同文馆总教习,同文馆并入京师大学堂后,为京师翻译馆开办人,又任翻译科总办。1904年任出使朝鲜大臣。另译有《斯宾塞尔文集》之《第一论论进境之理》、《第二论论礼仪》(曾广铨采译、章太炎笔述,载《昌言报》第1—6、8册),英国解佳(今译哈葛德)小说《长生术》(今译《她》,载《时务报》第60—69册)等。


数据库条目页 


因为译者为丁杨杜的第二种说法来自阿英的记录,而非第一手资料,我们项目组的赵天成、樊宇婷又分别查证中国国家图书馆藏的《新译包探案》与《长生术》合装本,《新译包探案》版权页标“己亥夏(1899)素隐书屋托昌言报馆代印”,却并无著者和译者署名;首都图书馆藏有1904年文明书局版,封面题“包探案”,正文及版权页作“新译包探案”,也无著者、译者署名,仅版权页标“发行者:丁杨杜”。由此可以推测,如果初版和文明书局版确无著译者署名,而丁杨杜的署名实际是发行人(出版人),并非译者,那么,很可能是阿英将发行者丁杨杜误录为译者,或者印刷厂误排为译者。

经过这一番考证后,最终能够确定的虽然只有《英国包探访喀迭医生奇案》和《英包探勘盗密约案》两篇的译者是曾广铨,但这个发现推翻了原来的权威知识。由此也可以想象,仅是生平简介,就要做如此多的考证,如果是年谱、文学史事件、思想考辨及其脉络梳理等,该会有多少歧义有待考订。数据库汇聚起“无限的史料”的强大能力会使学者无法回避史料混乱的现状,真正从“论史”走向“考史”,从考辨史料做起。另外,大量歧义的发生,有时也并不出于错误,而是因著录无规范。由于行政区域划分的变化,学校、地域、制度名称的变化,汉译书名、人名、地名的不同,都会造成其说不一,这涉及学术的规范问题,迫切需要学者达成共识,当涉及相关史料时,将原文历史名称与今日名称同时标出,或者做注释说明,而不仅仅照抄,或者直接改为今名了事。

文献的数字化和互联网搜索技术,在史料收集、呈现和获取方式上发生的巨大变革也给学者阅读及研究方式带来了巨大的改变。人们常说“书海无涯”,在阅读达到一定量后,进入专题研究时,学者一般会围绕自己的问题和论题分类以求,进行大大小小的分类阅读。学术史上各种专题文献史料集的编撰正反映了这一研治的需要,但传统的印刷出版方式毕竟受到篇幅、时间等的局限,而数据库不仅可以最大规模地汇集文献史料,更因其强大的检索功能,可将人类知识存本数据任意灵活分类组合,甚至细化到“逐字检索”,以使文献史料以类相从。换句话说,数字检索可以瞬间编撰出形形色色的专题文献史料集,方便学者翻检贯通,索其沿革。

文学作品的纸质阅读固然更容易让人沉浸式地细细品味,以获得研究所不可或缺的生动印象和丰富的情感之体验;但在考辨作者思想或事件来龙去脉之演变时,作者的全集数据库、或专题数据库却能够按照研究者所发现的作者独特使用的概念词语,或某一事件的称谓迅速提供相关文献史料。数字化的这一聚类功能是传统纸质阅读、手工查找所难以企及的。虽说我们很容易拥有某一作家全集,哪怕通读过一二次,也很难达到信手拈来、随意征用的熟悉程度。最近,因为经常使用“汉译文学数据库”,让我体验到借助数字化工具展开学术研究所形成的一种人机互动的工作方式和状态。

我主编《汉译文学序跋集1894—1949》时,即注意到周作人关于五四新文化运动之人道主义精神的独特看法。1920年周作人辑译出版《点滴》短篇小说集时,新潮社的傅斯年和罗家伦建议他对集子所收小说的特殊之处——“直译的文体”和“人道主义的精神”做“约略的说明”。为此,周作人不仅写了序,还分别为其中18个短篇一一做了“附记”,并于书末附录其重要文章:《人的文学》《平民的文学》《新文学的要求》。由此可见,周作人的出版《点滴》,是北大新文化派集体筹划的一次集中而郑重的阐发人道主义精神的行为。周作人发表《人的文学》之重要性,胡适在《中国新文学大系·建设理论集》导言中已给予了一言九鼎的定论,如其所说,“是当时关于改革文学内容的一篇最重要的宣言”,是“那个时代所要提倡的种种文学内容”的“中心观念”。在该文中,周作人敏锐地指出,欧洲关于“人”的真理的发现有三次:“第一次是在十五世纪,于是出了宗教改革与文艺复兴两个结果。第二次成了法国大革命,第三次大约便是欧战以后将来的未知事件了。”周作人虽然没有预言第三次“人的发现”会导致怎样的社会文化事件,但他已明确地把一战后的思潮视为“人”的真理的第三次发现,并认为“这真可说是二十世纪的新福音”。周作人的这一观点显然与学界惯常把五四新文化运动喻为欧洲的文艺复兴不同,他还为法国大革命与战后思潮赋予了“人”的真理的发现之性质,并将后者更提高到“二十世纪的新福音”之神圣地位。


李今主编:《汉译文学序跋集(1894—1927)》,上海人民出版社2017年版


周作人的这一观点,学界一直未能给予应有的关注,他将战后新一轮人道主义的兴起视为“二十世纪的新福音”有具体所指吗?带着这个问题,我检索了电子版《周作人自编全集》与“汉译文学数据库”中“福音”一词,瞬间即获得有关该词的所有篇章。周作人在《日本的新村》一文中,明确称颂日本的新村是“一种切实可行的理想,真正普遍的人生的福音”。而且通过周作人使用的“福音”这一词语,不仅可以将其人道主义观念与宗教、与陀思妥耶夫斯基和托尔斯泰等“爱的福音之文学”、与日本新村“人生的福音”的理想联通在一起,也可以把握不同时期周作人思想发生变化的关节点。若进一步将“福音”“新村”“人道主义”作为关键词置于“汉译文学数据库”中检索,则可进一步打开历史话语场的空间,从中考辨这些概念的历史意义及其演变。本文并不旨在论述周作人的人道主义思想,仅借此说明数字化技术与研究者形成人机互动的一种新方式。目前我的体会是人文数字技术并不能为我们思考,但能为我们的思考所用。学者掌握索要什么数据的操控权,并根据研究目的选择整体全文阅读,或聚焦词语辨析式阅读;而数据库,特别是专题数据库则可伴随着学者思绪的不断延展和指令,不断为其提供所需文献史料,从而不断刺激与推动思考的进一步扩充与深化,事实上是形成了一种人机对话的机制。

总之,通过汉译文学数据库的建设与使用,让我真切体会到在数字时代考据所遭逢的问题与机遇,互联网和数据库的现代技术并非仅仅是图书文献的数字化,特别在其向着专题数据库的发展阶段,更能够为人文研究提供前所未有的方便工具,这个新工具有待学者去掌握和利用,更有待学者进一步去开发和创立,在人类文化正在经历的数字化转型中焕发出人文学术的新光彩。


李今

中国人民大学文学院

100082



(本文刊于《中国现代文学研究丛刊》2023年第3期)



一审:付丹宁

二审:李蔚超

三审:计   蕾



——订购方式——


《中国现代文学研究丛刊》为文学研究类月刊,每月1日出刊,每本定价28元。


一、邮局订购

  • 国内邮发代号:2-667  

  • 国外邮发代号:6807Q

二、杂志社订阅   

  • 邮局汇款地址:北京市朝阳区文学馆路45号中国现代文学馆

  • 收款人姓名:《中国现代文学研究丛刊》编辑部


联系电话:010-57311616

投稿邮箱:ckbjb@wxg.org.cn


汇款请注明期数、数量和邮寄地址。





您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存