查看原文
其他

刘青峰|引入數據庫方法對人文研究的意義

劉青峰 零壹Lab 2022-10-08

:此文为刘青峰教授《观念史研究与数据库的建立和应用》一文的第三部分。其它两部分则以“以含关键词例句为中心的观念史研究”和“为什么及怎么样建立‘中国近现代思想史研究专业数据库(1830-1930)’”为题分别在同一期内刊发。


作者信息

青峰,香港中文大学中国文化研究名誉研究员;香港中文大学中国文化研究所《二十一世纪》双月刊创刊编辑、前主编。



在人文研究中引入和應用電腦數據庫新工具,必然會引起研究方法的改變。從以上介紹如何利用數據庫作研究的分析步驟中可以看出,它與以往思想史研究方法上最大的差別,是從以往對某學派、某學者的全文文本的分析,轉變到以分析含關鍵詞的大量例句為中心。而建立某一關鍵詞研究的句庫,需要研讀數以千計或上萬例句,分析工作相當枯燥,往往需借助研究團隊的力量,很有點類似科學工作者在實驗室觀察和處理data。


最重要的是,我們認為數據庫的應用對人文研究最大的潛在貢獻和影響,是它的開放性以及作為文科的驗證工具。開放性和可驗證性在以往思想史研究中是缺乏、或者說難以行之有效的。


人文研究的可檢驗性


為什麼數據庫可以在人文研究中發揮驗證功能呢?這不僅僅是因為數據庫收錄文獻量極大,遠遠超過個別研究者記憶的限制,更重要的是,在以含關鍵詞例句為中心的數據庫方法中,對句子中關鍵詞意義的判定,可以根據相對有公共性詞意的理解和中文語法來作出,沒有那麼大的主觀性,比判定一篇文章中的詞意和思想意義具有更大的確定性,也就是說具有相當大的客觀性。例如要判別「民政」是否沿用其古典意義,我們看到如下例句:1873年張德彝在談到巴黎局勢時說:「初七曰,巴里聞各處失守,國君被俘,眾議改為民政」[23];又如,1876年李鴻章與日本駐華官員森有禮對談中有這樣的問句:「日本是民政之國,抑君主之國?」[24]顯然,兩個句子中的「民政」都是用於表達民主觀念的。因此,可以由不同的研究者反覆驗證。


驗證又可分兩類。有一類驗證相對簡單,即判定某詞的現代意義在什麼文獻中 最早使用。過去是依靠研究者大量閱讀、發現新材料,借助數據庫則使得這類簡單 驗證變得輕而易舉。如我們要驗證「專制」一詞何時在現代意義上最早使用?佐藤 慎一認為是20世紀初從日本傳入中國的,他說:「『專制』這一詞語本身在十年前也 不存在。『專制』和其他許多專門用語一樣,都是20世紀初從日本引進來的語言。」 (佐藤慎一,2008 : 241)查數據庫,鄭觀應就在1893年文章中說:「論者謂變法之易,莫如專制政治。所言不為無見,然蒙謂專制政治,究不如立君政治之公。」[25]就早於佐藤慎一說的十年。當然,鄭觀應在現代意義上使用「專制」一詞,是否是從日本引入的,則需要另作考察了。


又如,任達認為「新政」一詞「是19世紀80年代的中國赴日考察者們,用以 表述明治維新時期各種改革措施」而使用的。[26]我們用本數據庫查詢「新政」一詞, 早在1846年梁廷枬在介紹美國華盛頓的一條榜文時,就出現這樣句子「……。始設新政,自守疆域,非得已也」;1850年奕竚登基後,力圖刷新政治,官方文書也多次使用「新政」一詞:「皇上新政之年,育才是急」。[27]很明顯,在古文中,「新政」一詞也是用於指最高當局推行新政策的改革,並不需要等到後來赴日考察者借鑒日本明治維新的用法。因此,在對某詞新意的何時最早使用時間上,研究者需格外小心。


以上兩例中的驗證相對簡單、也較容易判定,如要驗證某一種公認、但似是而非的說法,就不僅僅是憑一、二詞彙使用情況所能判定的了,還需要做出可以質疑論點的某種定量分析。例如,過去在解釋中國人接受馬列主義時,常常引用的一句話是「十月革命一聲炮響,給中國送來了馬克思主義」。為驗證這一論述,我們用本數據庫統計了《新青年》中提及的國際及國內重大事件後發現,在1917年十月革命爆發時,該刊很少提到俄國發生的革命,當時輿論關注的是第一次世界大戰;直到 1921年起「十月革命」使用次數才開始領先並超過其他重大事件。這表明,不能簡單地把「十月革命」看作是中國人接受馬列主義的原因,相反,比較準確的說法應該是,《新青年》左翼在接受了馬克思主義並在1921年組建了列寧主義式政黨、選定「以俄為師」道路後,才開始重視和強調「十月革命一聲炮響」的歷史意義。這種對俄國十月革命作為馬列主義傳入中國分水嶺的再定位一旦成立,也就成為影響更多人接受馬列主義的原因(金觀濤、劉青峰,2008 : 396-402)。又如,1999年在五四運動八十周年時,我們對科學、民主是新文化運動的兩面大旗這一幾乎是定論的觀點提出質疑。我們考察了「科學」與「民主」兩詞在幾個重要期刊中的使用情 況,做出使用次數多寡和作者價值取向的兩種量化統計後發現,民主觀念不但沒有像科學那樣受到不同思想流派的中國知識份子的一致接納,反而是受到排斥和扭曲 (金觀濤、劉青峰,1999)。由此可見,採用以含關鍵詞例句為中心的方法,拿出大量例證,可以對某些重要的似成定論的問題提出質疑,甚至提出顛覆性論述。


促進人文研究的開放性


由於數據庫方法具有可驗證性,這就令人文研究可能獲得有點類似自然科學那樣的「不斷處於檢驗之中的開放性」,這正是數據庫方法具有的第二個特點。在我們的研究經驗中,我們是有意識地用文獻量大一個數量級的數據庫去檢驗以往用第一階段的三千萬字左右做出論文的主要觀點。2006年數據庫文獻量達到一億兩千萬字時,我們在一個研究團隊協助下,花了兩年時間來考察文獻量大大擴充後對研究結果會有何影響。[28]我們在根據三千萬字寫作的幾篇早期論文中,提出了與以往不同的關於中國近現代思想史分期問題的新觀點,把1895年前稱為近代,1895至1915 年這二十年左右為現代,1915年以後至今為當代。這一看法是否成立呢?為了進一步檢驗這一階段劃分是否具有普遍意義,我們用一億多字的數據庫把所有論文重做一遍,又請高超群先生做出了92個相關政治術語的詞意彙編(劉青峰、金觀濤, 2008:479-571),[29]驗證的結果證實了我們提出的新觀點可以成立。在這一次自我大驗證的寫作中,我們也發現早期論文中,民主觀念和現代經濟觀念的引進中,分別忽略了「民政」和「富強」,類似的問題還有不少,我們在重寫論文時必須做出重要修訂和補充。我們也體會到數據庫方法是可以用於人文研究的驗證、糾錯工作的。


需要指出的是,如果對某一特定的研究型數據庫提出它本身並不可能完成的要求,這並不能構成對以該數據庫為工具做出的研究成果的檢驗。舉一個例子,《觀念史研究》在大陸發行後,有學者質疑該研究沒有關注新觀念傳播中的接受者的心理和語言使用特色等等。[30]產生這樣的質疑,主要是由於不了解在本文一開始談到的對建庫收錄文獻的設想,而這樣的設想正是研究型數據庫的特點。如要研究觀念傳播和接受者心理,研究文學文藝作品中對新觀念的吸收,就需要加入該領域的文獻或建立另外一類的研究型數據庫。當然,也可以設想,隨著不同類型的數據庫的增加,今後就有可能做出統合它們的更大型數據庫,這類數據庫將具有更大的開放 性,可以更好地適應不同學科研究者的不同要求。


哲學家波普爾在討論一門學科是否達到科學所要求的規範時,曾提出如下兩個基本原則:第一,任何研究得出的結論要具有可證偽性,即這一結論是明確的可以和經驗事實對照;第二,它具有開放性,隨著新的經驗數據出現,現有結論總是面臨被證偽的危險。按波普爾提出的這兩個標準是區別科學和偽科學的試金石來看,數據庫方法賦予人文研究某種科學的意味,可以使人文研究逐步趨向人文科學。


但是,一談到人文科學,人們就會強調它和自然科學與社會科學的不同。20世 紀的人文研究是在反對科學主義和實證主義中發展起來的。我們用波普爾對科學的定義來討論數據庫在人文研究中的應用,是不是又犯了科學主義和實證主義的謬誤呢?我們認為,人文研究和自然科學與社會科學最重要的差異,並不在於其研究結果應不應該被經驗證偽,而是在人文研究中必須高度強調和重視人的主體性和價值取向,這兩點正是那種把歷史研究等同於社會史和經濟史所忽略的。在這一意義上,用數據庫開展關鍵詞歷史語義學之分析一旦和觀念史研究傳統方法結合,一方面令可檢驗性進入這一學科,另一方面又可以更細緻地梳理觀念與事件之間的關係,這就會給歷史這一古老的學科注入新的生命,同時亦終於促成觀念史在歷史和社會語言學中找到了自己學科的準確定位。


最後,必須強調的是,儘管電腦數據庫在大量處理文獻和可以驗證這兩點之上發揮了極大的作用,但它仍然只是輔助性的,人文研究者大可不必自卑。當然,利用這一方法,對研究者也提出了新的要求,他們要像科學實驗室分析大量數據一樣,不得不作基礎性、甚為枯燥的數據處理工作,以極大的耐心去分析成千上萬個例句。在做完含關鍵詞的大量例句分析之後,最重要的仍是研究者能否有效地利用挖掘出的大量數據,結合歷史背景和文本結構分析,概括出某一時代某一普遍觀念的理想類型(ideal type),這依然是思想史研究的基本方法。換言之,如何對統計分析結果做出更為細緻深入的解釋梳理,從而勾勒出觀念演變的線索,主要還是依賴於研究者知識積累、創造性和綜合能力。


Franklin L. Baumer曾對觀念史這樣定位,觀念史乃是一門沉思的科學,它可以說是居於歷史與哲學的交界線上,一身兼具兩者的目標,一方面從過去提供種種價值給今人詳細研究,一方面闡明種種歷史的原因。」(Baumer,1988: 14)。我們認為, 數據庫方法的出現正有助於實現Franklin L. Baume提出的這兩個目標。中國思想史研究前輩王爾敏教授在評價我們的研究探索時,十分敏銳地指出這是「當今哲學界的統計學派」(王爾敏,2006 : 48),也正是從上述目標來談的,即它有助於哲學研究與統計方法的結合。如果我們對數據庫方法觀念史研究的定位——以含關鍵詞例句為中心的方法——是正確的,那麼,身處於歷史、哲學和語言學三大學科交界線上的觀念史研究,不僅是代表人文精神的沉思的科學,還是反映人文研究與電腦科學間的人機互動的新學科。


參考文獻

方維規,2000,〈「議會」、「民主」與「共和」概念在西方與中國的嬗變〉,《二i^一 世紀》雙月刊,58,頁49-61。

王延熙、王樹敏輯,1969,《皇清道咸同光奏議》,臺北:文海出版社,1969年影印 本,上海久敬齋石印本。

王栻編,1986,《嚴復集》,第四冊,北京:中華書局。

王爾敏,2006,〈晚清實學所表現的學術轉型之過渡〉,《中央研究院近代史研究所集 刊》,52,頁 19-51。

任達,2006,《新政革命與日本:中國,1898-1912》,南京:江蘇人民出版社。

李天綱編,1998,《萬國公報文選》,香港:三聯書店。

佐藤慎一,2008,《近代中國的知識份子與文明》,南京:江蘇人民出版社。

金觀濤、劉青峰,1999,〈新文化運動的另一種圖像〉,呂芳上、張哲郎編,《五四運 動八十周年學術研討會論文集》,頁809-843,臺北:國立政治大學文學院。

金觀濤、劉青峰,2005,「科舉」和「科學」:重大社會事件和觀念轉化的案例研 究〉,《科學文化評論》,2 (3),頁5-15。

金觀濤、劉青峰,2008,《觀念史研究:中國現代重要政治術語的形成》,香港:中 文大學當代中國文化研究中心。

金觀濤、劉青峰,2009,《觀念史研究:中國現代重要政治術語的形成》,北京:法 律出版社。

金觀濤、劉青峰,2010年5月30日,〈簡答張仲民先生對拙作的評論〉,《東方早

報•上海書評》。

金觀濤、劉青峰、章清,1999,〈中國現代政治觀念形成的計量研究〉,《近代中國史 研究通訊》,28,頁77-99。

故宮博物院編,1968,《咸豐朝籌辦夷務始末》,臺北:成文出版社。

香港中國語文學會,2001,《近現代漢語新詞詞源詞典》•上海:漢語大詞典出版社。

張仲民,2010年5月23日,〈數據庫與觀念史研究〉,《東方早報•上海書評》。

張仲民,2010年9月5日,〈觀念史研究應該怎麼做——再次回應金觀濤、劉青峰 兩教授〉,《南方都市報•南方閱讀》。

漢語大詞典編輯委員會編,1986,《漢語大詞典》。北京:漢語大詞典出版社。

劉青峰、金觀濤,2010年9月19日,〈就觀念史研究再答張仲民先生〉,《南方都市 報•南方閱讀》。

鍾叔河編,1980,《走向世界叢書》,長沙:湖南人民出版社。

Baumer, F. L.,1988,《西方近代思想史》(李日章譯),臺北:聯經。

Lukes, S.,2001,《個人主義》(閻克文譯),南京:江蘇人民出版社。

Masini, F.,1997,《現代漢語詞彙的形成——十九世紀漢語外來詞研究》(黃河清 譯),上海:漢語大詞典出版社。

Wheaton, H.,1864,《萬國公法》(丁韙良譯),北京:崇實館。

Williams, R.,1985,《文化與社會:1780至1950年英國文化觀念之發展》(彭淮棟 譯),臺北:聯經。

Jin, G.-T., & Liu, Q.-F.. (2005). From ‘Republicanism’ to ‘Democracy’ : China's Selective Adoption and Reconstruction of Modern Western Political Concepts( 1840-1924). History of Political Thought (Exeter, England), 26(3), 467-501.

Schrecker, J. E. (1971). Imperialism and Chinese Nationalism: Germany in Shantung. Cambridge, Mass.: Harvard University Press.



注釋

23.參見張德彝,《隨使法國記》,1873 (長沙:岳麓書社,1985)。


24.李鴻章、森有禮,〈照錄李鴻章與森有禮問答節略〉,《清季外交史料》卷五,1876年,北平外交史 料編纂處。北平:故宮博物院,1934 :臺北:文海出版社,1963年影印本。


25.鄭觀應,〈自強論〉,《盛世危言》,1893。


26.任連《新政革命與日本:中國,1898-1912》一書〈導言〉中提出了該書的關鍵詞是「新政」■作者 特別為該詞寫了個長注(見江蘇人民出版社出版的該書頁1 .註1在頁4),指出「新政j 一詞「是 19世紀80年代的中國赴日考察者們,用以表述明治維新時期各種改革措施的。」這個長注還引用韓國歷史學家閔斗基的研究成果,「1895年時,『新政』一詞表述『新的政策』;在1898年則表述為 『新的制度』,或『體制改革』」。其中閔斗基( 1989)的觀點見是著《國家政治形態和地方勢力:中国末代王朝的改革》 (National Polity and Local Power: The Transformation of Late Imperial China)。


27.參見梁廷枬,〈合省國說卷二卜《海國四說》(1846),北京:中華書局,1993。汪元方,〈請飭停止 增附捐教疏[咸豐元年]>,《皇朝經世文續編》卷二十一吏政四銓選,取自葛士濬輯,《皇朝經世文 續編》,光緒十四年(1888)刊本;光緒辛卯年(1891)上海廣百宋齋刊本。再如「皇上新政昭彰,事事講求實在;弭盜一節,尤為近時切務」。汪元方,〈請整頓捕務因時制宜疏[道光三十年]〉,《皇清道咸同光奏議》卷五十六兵政類保甲,取自王延熙、王樹敏輯,《皇清道咸同光奏議》,光緒壬寅年(1902)上海久敬齋石印本:臺北:文海出版社,1969年影印本。


28.參見該書長達四頁的感謝。而在分析例句方面,特別要感謝高超群先生、吳通福博士和魚宏亮博士所做的大量工作。


29.參見劉青峰、金觀濤(2008 : 479-571 ),附錄二:〈百個現代政治術語詞意彙編〉。


30.參見張仲民先生與我們以下兩輪討論:張仲民(2010年5月23日);金觀濤 ,劉肯峰(2010年5月 30日);張仲民(2010年9月5日);劉青峰 ,金觀瀵(2010年9月19日)。


文章出处: 劉青峰,《觀念史研究與數據庫的建立和應用》,見項潔主編《数位人文研究的新视野:基礎與想像》,臺大出版中心,2011年,“數位人文研究叢書”(3)

相关回顾

对撞机 | 数位人文研究的理论基础

对撞机 | “数字人文研究推介”: 思想史/概念史研究法的数位转向



END


主编 / 陈静

责编 / 付梅溪 顾佳蕙

美编 / 傅春妍


零壹Lab

记录数字媒介之日常

反思科技与人文精神

长按关注

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存