查看原文
其他

刘青峰|以含關鍵詞例句為中心的觀念史研究

劉青峰 零壹Lab 2022-10-08

:此文为刘青峰教授《观念史研究与数据库的建立和应用》一文的第二部分。其它两部分则以“为什么及怎么样建立‘中国近现代思想史研究专业数据库(1830-1930)’”和“引入数据库方法对人文研究的意义”为题分别在同一期内刊发。


作者信息

青峰,香港中文大学中国文化研究名誉研究员;香港中文大学中国文化研究所《二十一世纪》双月刊创刊编辑、前主编。



為什麼可以用關鍵詞研究觀念史?


自從19世紀末觀念史成為一門獨立學科以來,關鍵詞分析就是語言學、語意分析、思想史研究的重要方法之一。例如,1958年雷蒙•威廉士(Raymond Williams, 1921-1988)通過考察「工業」(industry)、「民主」(democracy)、「階級」 (class)、「藝術」(art)和「文化」(culture)等關鍵詞在1780至1950年這一百七十年間的意義變化,來分析英國現代文化的變遷(Williams, 1985)。1973年史蒂文•盧克斯(Steven Lukes)分析「個人主義」(individualism) —詞在19世紀的出現,以及它在英、德、法不同語種中的意義差異(Lukes, 2001)。石約翰(John E. Schrecker)選取《清季外交史料》,統計該文獻中「主權」一詞在每一百頁的使用頻率,來研究1875年到 1894年間,西方主權觀念是如何進入中國的(Schrecker, 1971: 253-254)。[7]


為什麼可以以關鍵詞為中心來作觀念史研究呢?20世紀哲學最重大進展就是實現了語言學轉向。眾所周知,任何觀念的表達、流傳、記錄,以及社會動員轉化為行動都離不開語言。因此,無論是研究新觀念的起源,還是研究社會行動如何反過來改變觀念,都可以找到與這一觀念相對應的關鍵詞。既然某一種在歷史上存在過的普遍觀念轉化為社會行動時,表達觀念必須使用詞彙,那麼,就一定可以找到該觀念的語言學證據。這就是以關鍵詞為中心的觀念史研究的方法論根據。


在中文裡,絕大多數新器物、新事物、新知識、新觀念的傳入,都是與新名詞的出現和使用緊密聯繫在一起的。十分有意思的是「新名詞」這個詞正是出現在引介西學大盛的1903年。為什麼介紹新思想要使用新名詞?當時就有人明確地說:「凡發明一新理,而欲公之於學界政界,不能人人共喻之,則必立一新名詞」。[8]


學術界已積累了大量研究漢語新名詞上的成果。但是,如果要找到觀念變化的語言學證據,就需要有成千上萬條例證,其涉及的文獻量動輒以數千萬字乃至數億字計,超出了任何個體研究者的能力。這時,建立電腦數據庫就成為克服這一瓶頸的有力工具。但是,數位人文研究中電腦數據庫並不是萬能的,必須清醒地認識到 研究者和電腦數據庫各自能與不能的界限何在。


如何找對關鍵詞?


尋找和選取表達某一觀念(或事件、事物)關鍵詞,是觀念史研究中重要的第 一步。數據庫的使用者需要具備這樣的歷史意識:一百多年來中文用語發生了很大的改變,不能用現代漢語去想像詞彙的古典意義。一些沿用至今的術語,其古典與現代意義已有極大差異。例如,「主權」的古典含義是指皇帝的權力,「經濟」指經世濟民之才能「個人」在古詩詞中用於指所愛的人。也不能用當代通用術語去查找相關歷史事件。例如「甲午戰爭」是今天使用的指1894至1895年中日戰爭的術語,但一百多年前的文獻並沒有或極少使用這一術語,用它來查詢本數據庫肯定是沒有意義的。由此可見,數據庫並不能自動給出關鍵詞,這一步是由具有歷史知識和研究問題意識的人文學者做出的。


那麼,在選擇關鍵詞方面,是不是說數據庫對人文學者就沒有多少幫助了呢? 據我們的研究經驗還是有助益。2005年我們在英國History of Political Thought(Exeter,

England)發表了一篇討論中國民主觀念的論文(Jin & Liu,2005),分析了與民主觀念相對應的「民主」、「民權」、「民治」、「德莫克拉西」、「德先生」等一系列關鍵詞。當我們在2007年重寫這篇論文中文稿時,發現2005年的分析中遺漏了「民政」個表達民主觀念的重要關鍵詞。我們是如何發現的呢?在重新閱讀含「民主」例句時,可以看到不少「如前溫利士之民主,……,其熱心民政」[9]這樣同時使用「民主」和「民政」的句子,其中「民政」也是指涉民主觀念的。於是,我們用本數據庫把同一篇文章、同時使用「民主」和「民政」文章都找出來,居然多達406篇,再考察兩詞的意義。從統計看「民政」,在某些年份的使用次數甚至大大超過「民主」(金觀濤、劉青峰,2008 : 257) 。[10]當然,這些例句中的「民政」不一定都是指涉民主觀念的,需要研究者去小心判斷。由於「民政」在現代漢語中保留了其傳統的為民之政的意義,所以容易忽略它在19世紀曾經常用於指涉民主觀念。如同「民政」一樣,我們早期研究中國近代經濟觀念時,也是因為同樣的原因,漏掉了「富強」、「富國」這類指涉近代經濟觀念的關鍵詞。


在查找關鍵詞上,由於中文的特殊性,如同音字特別多、方言很複雜,造成了對某一固定對象會有多個不同的同音(或近似同音)譯名。如Napoleon這個人名中,「拿」有多種寫法,如「嗱」、「那」等;「侖」字寫法也很多,還有「崙」、 「倫」及口字旁的侖等;此外,還有多種簡稱,如「拿皇」,可謂千變萬化。而器物 (電話:特律風)、事物(議會:巴力門、巴厘滿)、概念(民主:德莫克拉西)、學科(經濟:伊科諾迷亞)等音譯詞也是五花八門。政大同學在處理「門羅主義」術 語時,因與「門羅」同音而不同寫法的中文就多達11個。因此在使用中文音譯詞查詢數據庫時,要特別留意的是信息提取不完全的問題。


在關鍵詞選擇上,今後為了從數據庫提取較完整的信息,就必須建立各種類型的詞庫。這些詞庫,如同大大小小的蓄水池,要依靠不同研究者、使用者提供的涓滴貢獻,不斷增加詞庫的容量。詞庫的建設和不斷豐富和整合,對研究者應用數據庫方法將大有助益。


統計圖對研究者的啟發作用


在確定了關鍵詞後,數據庫可以快速生成該關鍵詞歷年使用次數的統計分析。 目前,仍有不少人文研究者懷疑這種量化統計對研究者是否有益。下面,結合我們研究「科學」一詞,談一下關鍵詞統計對研究者的啟發。


如果沒有數據庫,個別學者要研究「科學」一詞在中文裡的使用和流變情況,最多可以閱讀數百萬字乃至千萬字文獻,摘出含該詞的數百條至上千條句子的卡片,再花費大量時間和精力去逐條分析。使用本數據庫,不到一分鐘就可以從一億多字文獻中提取近萬條含「科學」例句,並作出按年使用次數的統計分析。如果要比較兩個相關詞彙長程使用中的變化,對個別研究者則更為困難。例如,我們想要 知道「科學」在什麼年代取代「格致」的使用,只要在本數據庫輸入「科學」or 「格致」,就會分別生成這兩個詞按年代使用次數統計的兩條曲線,如圖1。


1「科學」取代「格致」的歷程(1894-1915)


圖1 一目了然地顯示出,1900年後「科學」一詞突然開始大量使用,並在1904至1905年間超過「格致」的使用次數,「格致」一詞的使用則快速下降。這一宏觀趨勢對研究者的啟示是,為什麼取代現象發生在這一特定年代?另一個相關問題是,同樣大量使用漢字的日本,為什麼在明治時期就開始把science定名為「科學」, 比中文早了約二十年?原來,這與「科學」在中文古文已有固定意思有關「科學」的古典用法中有指涉「科舉」之意。[11]而日本雖然從唐代起就積極引進中華文明,但政治制度上一直沒有實行科舉制,因此日本明治時期就可以使用「科學」作為 science譯名,不會發生用語混亂的問題。因此,中國要到1905年廢科舉前後「科學」作為現代用語才可以通行起來。我們曾就此現象寫過一篇論文,談廢科舉這一 重大事件對「科學」一詞使用的影響(金觀濤、劉青峰,2005)。一旦「科學」一詞 取代了「格致」,今天除了學者,絕大多數人早已不知道「科學」原來是科舉學校的簡稱了。


在此例中,數據庫的統計結果可以把某種較難把握的現象,一目了然、快速地呈現出來,僅此而已。至於為什麼會發生這種現象,則是由人文學者去思考研究的了。


利用數據庫建立分析關鍵詞的句庫


利用本數據庫作觀念史研究的第一步是查找關鍵詞,然後觀察文獻中使用該詞的歷史宏觀走勢的初步統計,再從庫中提取的大量含選定關鍵詞文獻的所有例句作為分析對象。在研判所有例句時,要建立切合研究目標的意義分類的句庫,這是「以含關鍵詞例句為中心」的觀念史研究中最重要,也最花時間和精力的一步。需要說明的是,由於研究目標不同,例如查找與Cemem對應的中文詞彙,就不一定需要作意義分類。對不同的關鍵詞,如何分類,是由研究者根據研究目標並在研讀例句後制訂的,並沒有固定的標準。研究者在例句上做出分類標識後,本數據庫可以自動生成這一關鍵詞的句庫。


現以「民主」一詞為例,談談要如何建立「民主」一詞從古典意義轉變為現代指稱民主觀念主要詞彙的句庫。在分析例句之前,首先需要了解「民主」古典意義並參考學者們已做出的相關研究。「民主」的古典含意是「民之主」,特指皇帝,如「肇命民主,五德初始」,蔡邕注為:「民主,天子也」。[12]我們把帝王別稱這種古典意義列為第一種類型。在現代漢語中「民主」是指涉現代民主觀念,主要意義是「民為主」的各種制度安排;我們把它列為第二種類型。學者有興趣的是「民主」意義為什麼會發生這種現代與古典意義相反的演化?義大利學者馬西尼曾經從語言學角度對「民主」一詞的意義轉化,做出很有趣的分析(Masini,1997: 172-173)。[13]


研究者在審讀大量含「民主」例句時,需要特別關注在什麼情況下、何人、何時以及用什麼樣的方式,使用「民主」一詞時把它與西方現代民主觀念聯繫起來? 在本數據庫,「民主」最早與現代民主觀念相聯繫的用法,出現在1864年美國傳教士丁韙良主譯的《萬國公法》中。其中「民主」一詞沒有單獨使用,而是出現在「民主之國」術語中,是指實行與中國無限君權不同的,君權有所限制的政治制度的國家,由此「民主」通過與實行西方民主制度國家,間接地與民主觀念建立了聯繫 (Wheaton, 1864)。[14]在本數據庫中「民主之國」和「民政之國」分別使用了400餘次和30多次,相當常用。我們把這一新意義——指與中國君主制不同的、實行民主政治制度,列為「民主」的第三種意義類型。


除了「民主之國」(含「民政之國」、「民主法」、「民主黨」等以民主為形容詞、 作為定語的詞組)這種新意義類型,還可以在例句中發現第四種類型。如由美國監理會傳教士林樂知主辦的《萬國公報》,於1874年12月刊登〈選舉民主〉一文介紹美國大選:「美國民主,曰伯理璽天德,自華盛頓為始已百年矣。例以四年換舉,或者在位深得民望者再行接位四年也曾見過。即現今美皇古難得,也已續接四年,是兩次也。而古君在位惠及民茲逢更舉之期,民照又欲再舉古君四年為美主,據云古君已力辭不受矣」。[15]在這短短一段文字中,對president—詞,竟使用了「民主」、「伯理璽天德」、「美皇」和「美主」四種不同的詞彙來翻譯。傳教士和士大夫用語的混亂,十分傳神地表現出他們在選擇一個恰當的中文詞彙來介紹西方民選國家最高政治首腦時,是多麼困惑。這段話中的「民主」一詞仍是古典的「民之主」- 人民統治者之意,不過,在美國他是由選舉產生的。對於兩千年來生活於皇帝世襲君主制下的中國人,這是無法想像的。在這個例句中,通過用「民主」指涉民選最高國家政治首腦與選舉這種民主制度聯繫在一起。19世紀後期直到20世紀初「民主」這用法十分常見。如,唐才常文章中有「北美洲民主林肯,與南美連兵數年」。[16]


由此,可以歸納出「民主」的第四種意義類型——指民選國家最高領袖。


歸納出「民主」四種意義類型後,我們還要進一步觀察作者在使用這些不同意義類型時的價值取向,看他們是如何理解民主的新意義及對它的評價。上述兩例都出現在來華西人的中文著述裡,中國士大夫最早使用「民主」現代意義的是出使歐洲國家的郭嵩燾。他在日記中談到受法國「統領麥馬韓」召見,稱法國政治首腦 (統領)在「西洋民主之國,其名曰伯理璽天德,所居曰雷立賽宮」;接著,又說:「民主立國,無分貴賤上下」[17],可以看出郭嵩燾對「民主之國」到「民主立國」的理解。


1895年甲午戰敗後,士大夫曾熱議是否應該引進西學西制,對民主的評價有讚有眨。堅決反對中國引入民主制度的王仁俊是這樣說的汀仁俊讀西史而嘆曰:華盛頓拿破侖,民主(第四類;正面評價——引者)中之傑出者也」,「然而西人之言曰,彼國行民主法(第三類;中性介紹——引者),則人人有自主之權。自主之權者,各盡其所當為之事,各守其所應有之義。一國之政,悉歸上下議院,民情無不上達,民主(第四類;中性介紹——引者)退位。」這段話表明王仁俊十分了解以個人自主權利為核心的現代民主觀念,但在談到是否要把民主制度引入中國時他說: 「且民主之說,煸我中民,時則有若孫文,幸而辨言亂政不得逞。……然中國行西說,固足以亂中國,彼西國獨不受民主之禍乎。」(句中兩個「民主」都屬第二類; 都是負面評價——引者)[18],一直到19世紀末,大罵民主的士人並不少見。[19]因此,在區分「民主」四種意義類型的同時,研究者還應該分別以+、〇、-記號,來表明作者在使用時對其是贊同、一般性介紹,還是反對的價值取向。作出這些分類標識後,本數據庫可以自動生成「民主」意義類型統計表(見表1)。[20]


從這一統計表就可以清楚地看到,1864年以後,不同於「民主」古典意義的第三種、第四種意義開始出現,並在1896年以後大量使用;也可以看到,「民主」在現代意義上使用時,1897、1898年兩年對其負面評價很多。這些現象,對於研究者來說,是相當重要的參考。建立了含「民主」關鍵詞的句庫後,研究者就可以以此為素材,進入思想史、觀念史的常規寫作分析了。


表1「民主」的意義分類統計( 1864-1915)

分類

君主

民為主或人民統治

和世襲君主制相反的政治制

 度

民選領袖

合計

評價

+

-

+

-

+

0

-

+

-


1864








18





18

1867





1



3





4

1873








2



1


3

1875





5



28





33

1876





1



5





6

1877





1



6

1




8

1878







2

11

1


1


15

1879







5

3





8

1880








9



1


10

1881








10





10

1882








21





21

1883








10





10

1884








3





3

1885








23

2




25

1886


1



1



22





24

1887





2



22



1


25

1888








9





9

1889




6




2





8

1890








16





16

1891








7



2


9

1892


4



1



20





25

1893








48





48

1894








14



1


15

1895








117



39


156

1896




12


1

11

72

3


7


106

1897


5




64

29

155

7

2

13


275

1898






66

20

84

22


9


201

1899


2





12

60

5


31


110

1900




6



2

30

11


1


50

1901




30



15

87



1


133

1902




1

15


6

211



3


236

1903




52


10

34

153



8


257

1904





10

11

9

411



1


442

1905




16

8

20


77

1


1

22

145

1906




58

52

54


114

1


2


281

1907




13

19

3


49

2


1


87

 

續表1

分類

君主

民為主或人民統治

和世襲君主制相反的政治制度

民選領袖

合計

1908




7

12



40





59

1909






22


132





154

1910




8


3


78

1


1


91

1911






31


9

2


9


51

1912






10


43





53

1913






2


186



1


189

1914








39




5

44

1915




10

24

1


157




33

225


隨著對民主理解的加深,在19、20世紀之交,不少維新派人士為了掃清引進民主制度的障礙,往往要借助於西學中源的論述[21]。而且,不同政治觀點的人對現代民主觀念的理解包含了不同的意義,展現出現代民主觀念的不同面向。如有的人是從平等理念出發[22],或大眾參與來理解「民主」,就不一一列出了。在20世紀初,「民主之國」「民主」(指民選國家政治首腦)完成了它們作為指涉民主觀念的過渡時期暫用語的使命,很快不再流行、並被遺忘了。


可見,在建立對關鍵詞意義分類句庫這一個最重要的環節上,數據庫可以自動去做的事相當有限,而人文研究者所花費的時間和精力則十分巨大。我們在使用本數據庫作觀念史研究時,往往要依靠研究團隊,由不同的學者或學生完成某一個關鍵詞的句庫建設。隨著文獻擴充得越多,或者關鍵詞數量特別龐大情況下,研究者建立句庫需花費的時間和精力也越多。因此,以含關鍵詞句子為中心方法的應用,往往需要借助研究團隊的共同工作,這就打破了以往研究者個體工作的模式。



注釋

7.石約翰在此篇文章中統計「主權」二字在《清季外交史料》(1875-1911)中出現的頻率,發現在1875 至1894年間.平均每百頁只出現1次;1895至1899年間平均每百頁出現2.5次:1900年到1901年間,平均每百頁出現8.8次;1902年到1910年間每百頁約22次。


8.〈楚三言集〉《湖北學生界》第五期• 1903年5月27日出刊。東京:湖北留日學生同鄉會:臺北: 中國國民黨中央委員會黨史編纂委員會,1969年影印本。


9.〈論新教皇人品〉,《外交報》第六十五期,1903年12月13日出刊,《外交報彙編》(1902-1911)。上海:普通學書室;臺北:廣文書局.1964年影印本。


10.參見該文中圖7.1「民主」、「民政」的使用次數(1864-1915)。


11.〔宋〕陳亮〈送叔祖主筠州高要薄序>:「自科學之興,世之為士者往往困於一日之程文,甚至於老 死而或不遇。」轉引自漢語大詞典編輯委員會(1986:4749)。


12.〔束漢〕班固〈典引卜收錄於蕭統編、李善注之《文選》(香港:商務,1974 ,頁1067)。


13.馬西尼(Federico Masini)指出,複合詞「民主」由「民」和「主」兩個字組成,搆詞法不同,詞 意剛好相反。如「民」和「主」是偏正結搆•其意思為民之主,它是「民主」的古典意義「民主」是。而在主謂結構中,意為「民為主」或「民作主厂就轉化為現代意義了。其實,文獻中也是如此理解的,如1864年《萬國公法》中:「若君權無限 '則君身與國體無別。……蓋無論其國係君主之、係民主之,無論其君權之有限、無限者•皆借君以代國也。」又如,1867年張德彝在介紹美國歷史時說:「困於英之苛政,遂叛英自立,民主是邦,稱為合眾國 ,又稱花旗國。其中「民主是邦」中民主二字是主謂結構,意為民眾主持這個邦。參見張德彝,《航海述奇》,1867 (長沙:岳麓書社,1985) °


14.如文中提到「若君榷之然所限制者,则钦差所行之事,或准或靡,必俊君命而定,倘君榷有所限,则概由定法之部院会议,裁定後,其君方能施行,民主之國,多由长老院,同议同准,首领方可代圈加用印信」。


15.〈選舉民主〉,《萬國公報》(同治十三年10月12日:1874年12月)’收錄於李天綱(1998)。


16.唐才常,〈交涉學第四〉,《湘學新報》,1897年7月29日,頁44。長沙:湘學報館:臺北:華文書局,1966年影印本。


17.郭嵩燾,〈偷敦與巴黎日記三〉,1877 ,收錄於鍾叔河(1980)。


18.吳縣王仁俊撰,〈實學平議>《實學報》第十三,1897年12月24日。上海:實學報館;北京:中華書局•,1991年影印本。


19.早在19世紀上半葉出版的《英漢字典》裡.把democracy譯為「民政」,解釋是:「民政,眾人管 轄.百姓弄權。」轉引自方維規(2000 : 51)。19世紀末,如陳熾那樣大罵「民主之制,犯上作亂之 濫觴。他日我孔子之教,將大行於西,而西人之所以終底滅亡者,端兆於此」。陳熾,〈《盛世危言》 陳序〉,取自鄭觀應,《盛世危言》,1893 (瀋陽:遼寧人民出版社• 1994)。


20.見高超群先生做的「民主」的意義分類統計(1864-1915);金觀濤、劉青峰(2008 : 253) ,表7.1。 該表尚沒有對「民主」現代意義再作細分類•如分別指「共和」、「憲政」、「平等」或「大眾參與」的不同面向,如繼續做下去'會得到很有意思的結果。


21.到1895年甲午戰敗興起維新思潮後•中國人對民主制度的理解已較明確,並有康 ,梁以及為數不少的士大夫為了掃清引進民主制度的障礙•常探用西學中源策略來談「民主」在中國的起源。梁啟超 對那種說「中國歷古無民主」「頗不謂然」,指出「西史謂民主之局' 起於希臘羅馬 '啟超以為彼之世非民主也。若以彼為民主也,則吾中國古時亦可謂有民主也。」(梁啟超•〈與嚴幼陵先生書> 《飲冰室文集》之一(1896年)他又說:「泰西有今日之民主•則當夏商時含有種子以為起點」(梁啟超,〈論君政民政相嬗之理卜《飲冰室文集》之二•,1896年)。另外還有這樣的例句:「子貢問博施濟眾,孔子告以何事於仁,必推之於堯舜。誡以舜堯為大同之君,地球民主之鼻祖也。」(番禺黎祖徤撰 ,〈駁龔自珍論私上〉,《知新報》第二十六,1897年7月29日):章炳鱗引介日本人的說法: 「白河次郎曰:『縱橫家持君主政體,所謂壓制主義也,老莊派持民主政體,所謂自由主義也』(章炳麟,〈孔第二〉,《訄書》.1901 (上海:古典文學出版社,1958)。


22.例如,譚嗣同:「黜古學,改今制,廢君統,倡民主,變不平等為平等,亦汲汲然動矣」,《仁學》, 鄭州:中州古籍出版社,1998年。又如嚴愎「中國古之井田.故民主之政矣」,其理由是「孔子曰:『有國有家者,不患寡而患不均,不患贫而患不安。……』凡此皆民主平等之法言,而孔子舉而誦之 耳」,原版為1904年出版,收入王栻(1986 : 935)。


文章出处: 劉青峰,《觀念史研究與數據庫的建立和應用》,見項潔主編《数位人文研究的新视野:基礎與想像》,臺大出版中心,2011年,“數位人文研究叢書”(3)


相关回顾

对撞机 | 数位人文研究的理论基础

对撞机 | “数字人文研究推介”: 思想史/概念史研究法的数位转向

END


主编 / 陈静

责编 / 付梅溪 顾佳蕙

美编 / 傅春妍


零壹Lab

记录数字媒介之日常

反思科技与人文精神

长按关注

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存