对撞机 | 习作:《山海经》色彩词的数字人文研究
主编语
此文为艺术学院研究生林文思的练习作业。她参加了台湾大学数位人文中心团队在南大举办DocuSky工作坊,三天时间里系统学习了DocuSky的基本功能,并展开了自己的后续研究。发表该作业一是希望说明,研究生阶段以问题为导向,以数字人文方式介入传统问题研究,是大有希望的;二是想说明以DocuSky为代表的数字人文工具,可以以“minimal tech”好地对接基本的研究开展,而不必须要求较高的技术水平。问对问题,数据思维,才是更重要的。
研究简介
色彩是文字与图像之外的另一种表述思想的方式,中国古籍中随处可见的色彩描述,反映着不同时期的色彩观念,以及背后的社会思想之特质与变迁。《山海经》对山川草木、神仙异兽无不玄言色彩,是研究先秦色彩观念的重要材料。南大艺术学院的李牧老师在《论<山海经>的色彩系统》一文中,首次对《山海经》的色彩描写及各色关系进行专门研究,论述了《山海经》色彩叙述的过渡性、选择性和在先秦典籍中的独特性。
本期推送的研究以数据挖掘的方法开辟了传统《山海经》文本研究之外的新视角,采用MARKUS、DocuSky、Palladio等数字人文文本研究工具,对《山海经》全文色彩词的词频、词缀、共现关系进行了全面统计与分析,并对其中体现的先秦五色观念、色彩与物质的关系、色彩与方位的关系等进行了探讨,对李牧老师的研究工作做了有益补充。研究得出的结论有待进一步考证,但不失为数字人文研究一次有趣尝试。
研究内容
研究背景
1.《山海经》内容与形制
《山海经》是一部述异志怪的古籍,古本创作者和成书年代尚无定论,一说产生于大禹之世,一说当在战国至秦汉之际,历经数千年又形成了许多版本。其以亦图亦文的方式,记载了五百余座山、三百余条河道、一百余种药用动植物、四百余种神怪异兽、四十多个方国、一百多个神话人物,以及大量的远古神话传说。传世《山海经》全书篇幅为三万多字,包含18个章节,分为《山经》、《海外经》、《海内经》、《大荒经》四部分,依南、西、北、东等方位分篇。
2.古籍里的色彩观念
色彩是文字与图像之外的另一种表述思想的方式,每个民族的色彩观念都经历了漫长的演变过程并形成了自己的体系。中国古人对色彩进行过大量哲学诠释与运命附会,尤其是先秦以来逐渐形成的五行色彩系统,反映了古人对宇宙和人伦秩序的独特理解。中国色彩无一专门论著,却散见于诸多古籍,《山海经》中的山川草木、神仙异兽无不玄言色彩。通过研究《山海经》等经典中的色彩词运用现象,或可把握住不同时期的色彩观念,以窥探中国古代社会思想的特质与变迁。
技术路径
1. 研究对象与目的
《山海经》中的色彩词:
色彩词频:探究《山海经》全文的色彩词种类和使用频率,分析其中体现的色彩观念。
色彩词缀词:探究《山海经》全文的色彩词缀词类型,分析其中体现的色彩观念。
色彩词共现:对比《山经》与《海经》之间的色彩词使用情况,分析两文本的关联和差异。对比不同方位的色彩词使用,分析五方色观念的形成情况。
2. 研究材料与工具
研究材料:中华书局 方韬译注 《山海经》
研究工具:
文本标记工具:MARKUS https://dh.chinese-empires.eu/markus/beta/
数位人文研究平台:DocuSky http://docusky.org.tw
数据可视化工具: Palladio http://hdlab.stanford.edu/palladio/
3. 研究思路
文本准备:
下载现有的《山海经》电子文本,转换为UTF-8格式TXT文本;或将纸本进行扫描、OCR,转换为电子文本。
调整格式,使每章节标题、段落顶格,章节间间隔一个空行。
参照正版图书对电子文本进行校对,修改错字。
文本标记:
上传文本至MARKUS,自动标记,将全文分成18章。
关键词标记,载入已知色彩词,利用“词夹子”挖掘更多色彩词。
手动标记,查缺补漏,删除错误标记。
可选择标记其他关键词,如神人名、山名、兽名等。
生成XML文档,上传至DocuSky建库。
色彩词频统计:
使用DocuSky“标记与词条统计分析”工具,从DocuSky中添加已标记的《山海经》文档。
在XML tag settings中选择“色彩”关键词。
生成词频云图和统计表。
使用excel对表格数据作进一步整理和绘图。
使用MARKUS“关键词助手”或DocuSky“词夹子工具”,查看色彩关键词上下文,或在DocuSky库中检索。
色彩词缀词统计:
使用MARKUS“关键词助手”,搜索色彩关键词的缀词。
删除不需要的词组,可对新生成的词组进行标记。
色彩词共现关系:
将《山海经》全文切分为不同部分,如《山经》和《海经》
使用“标记与词条统计分析”工具,对比不同文本的色彩词频。
用Palladio的“Graph”工具制作不同文本色彩词共现关系图。
结果分析
1. 色彩词频分析
1) 单音节色彩词丰富,正色最多,间色较少:
利用Docusky制作《山海经》全文色彩词云和词频统计表,可见《山海经》中使用了885个色彩词,种类不少于30种,基本为单音节,其中赤、白、黄、青、黑五个词出现频率最高。明杨慎《丹铅馀录·间色名》:“青、赤、黄、白、黑,五方正色也。碧、紫、红、绿、流黄,五方之间色也。”甲骨文中至今未发现“青”字,而《山海经》出现频率最高的色彩词已然是后来的五正色,说明古人的色彩观念和认知产生了变化。被贬低为“乱色”的五间色在文中都出现了,“碧”多用于指代青石其物,“流黄”指代河流和地点而不作为色彩词,紫、红、绿出现不超过两次。从词频上看,五正色相对于其他色彩的地位优越性显著。
2) 赤色最多,黑色最少:
将五正色的词频单独制成统计图表(由于“玄”指天的黑色,也属于正色,在一定程度上与“黑”等同,故将“玄”与“黑”合并),可见赤色出现最多,在五正色中所占比例超过1/4,白、黄、青依次减少,黑色最少,只占约1/8。赤、白二色最多,或许是《山海经》所依据的真实世界里赤、白二色最为醒目,或许是时人对赤、白的偏好。东汉王充《论衡》:“白者,殷之色也。赤者,周之气也。” 《山海经》在择色上的特点是否可以推测出其时间接近殷、周。
3) 赤黑青色系,词汇种类多:
进一步将《山海经》中出现的色彩词归为赤、青、白、黄、黑、紫色系和多色系,可见在五色对应的色系中,赤色系色彩词频仍然最高,黑色系仍然最低,但黑色系色彩词种类丰富性与赤色系不相上下。而“青”单独出现的词频虽然排在第四位,但青色系词频仅次于赤,词汇丰富性也远超过白色系和黄色系。
古人在形容相同色彩的不同物质时,常常采用不同的色彩词,如同样是赤色,“赤石”为“丹”,“赤心木”为“朱”,同样是青色,“石之青美者”为“碧”,“青羽雀”为“翠”(东汉许慎《说文解字》)。基本上同一色系的单音节色彩词代表的不是颜色上的细微差异,而是所指物质的差异,说明先秦时期的色彩认知停留在对主要色相和材质的识别上,而对丰富的色调变化不敏感,直到后来双音节色彩词出现才代表了色彩辨识需求和能力提升。
由此看来,赤、黑、青色彩词种类的丰富,在一定程度上反映着这三种色彩在自然界中出现的物质种类比较丰富
4) “五色”已现,“系统”待成:
《山海经》中出现了12次“五采”和3次“五色”,四色、三色等均未出现。已知“五”在中国古代是个重要的观念数字,《尚书》中就有舜对禹说“以五采彰施于五色作服”的记载,古代色彩标准之一是“五色雉”的羽毛,而汉代更是将“五”视为中央之数,因此《山海经》中使用“五采”、“五色”是文化使然。但这里的“五色”究竟是泛指色彩丰富,还是实指赤黄青白黑五种色彩,或者说五色系统在此时是否已经形成?
进一步用Docusky“关键词助手”搜索“五采”和“五色”上下文,发现五色用于形容玉石,五采多用于形容鸟类羽毛,但全文均未指明五色的具体内容。“五色乃清,五味乃馨”一句,五色与五味同时出现,但未对其关系作具体说明,不同于《周礼》等古籍中对五色系统的明确记载。因此,《山海经》应该成书于五色系统正在形成的阶段。
2. 色彩词缀词分析
1)“色彩词+色彩词”的四大类型:
用MARKUS“关键词助手”搜索色彩词的后缀词,发现后缀词主要有色彩词和名词两种。其中两个或多个色彩词连续组合出现的情况又可分为四类:
第一类是正色组合,用以形容某个物体同时具有多种颜色,黑、青、赤、黄四色之间互有搭配;多为两个色彩词组合,如“赤黄”、“赤黑”,也有三个色彩词组合“黑青黄”,用来形容“垩”这种土,以及四个色彩词组合“青黄赤黑”,用以形容色彩斑斓的“蛇”。
第二类是两种相近色彩词组合起来形容一种颜色,如“碧绿”色的水,“苍黑”色的动物,这或许是最早的双音节色彩词。
第三类是形容词性色彩词和名词性色彩词(多为矿物)的组合,如“碧”表示青白色的玉石,而“青碧”则是偏青色的玉石,“茈碧”表示偏紫色的玉石。
第四类是形容地点,如“玄丹之丘”、“黑白之丘”。
2)“色彩+名词”搭配的选择性:
色彩词的后缀词大多为名词。选择词频排在前8位的色彩词——赤、白、黄、青、黑、丹、碧、玄,统计其后缀名词制作成图表。发现《山海经》中色彩词形容的名词主要有“动植物”、“部位”、“矿物”、“地貌”等几大类型。其中,动物有鸟兽虫鱼,植物有草木,矿物有金玉染料,地貌有山川,涵盖面广。
色彩词与名词的搭配具有选择性。“白色”形容的动物种类繁多,似乎经过有意挑选。形容蛇的色彩运用了赤黄青白黑五种,但形容树的只有赤和青,不悖于对自然事物色彩样貌的认知。说明《山海经》一方面旨在志怪述异,另一方面仍遵循现实规律。
从缀词丰富性上看,赤白黄青黑五正色的后缀名词比较丰富,“白”多用于形容动植物的整体色彩,“赤”多用于形容局部部位的色彩。非正色的“丹”、“碧”基本不作为动植物和部位的形容词,相比之下,“玄”作为正色的一种,虽然词频低于“丹”“碧”,形容的名词种类却很丰富。说明色彩词在形容物体时有一定的针对性和局限性,与其自身含义有关,而正色是相对抽象、包容度高的颜色,发展到后来既可作为具体的某种颜色使用,又可作为泛指一类颜色的色系名称使用。
动植物及其部位的色彩描述常出现“有白鸟,青翼,黄尾,玄喙”这样的结构,即色彩之间构成了整体和局部的搭配关系。
此外,《山海经》中还出现了五帝事迹的记载,但只出现“白帝”(少昊)、“黄帝”两个称谓,未将炎帝、颛顼称作“赤帝”、“黑帝”,进一步说明五色系统此时尚未形成。
3. 色彩词共现分析
1)《山经》与《海经》的色彩词对比:
学界一说《山海经》由原本是独立成书及流传、内容目的各异的《山经》和《海经》(含大荒经诸篇)合并而成,而《山经》偏向写实,《海经》多为想象。
为探讨两文本间的关联和差异,将两部分的色彩词分别制作词云,发现《山经》中出现最多的色彩词依次是白、赤、黄、青、黑,《海经》中依次是青、赤、黄、黑、白,与全文词频最高的赤、白、黄、青、黑种类一致,体现了两文本的统一性;但排列不同,“赤”在两个部分都不是词频最高的,因此《山海经》体现“周人尚赤”的说法是不可靠的。
用Palladio制作《山经》和《海经》的色彩词共现关系图,发现虽然两部分篇幅将近,却仅有一半左右的色彩词在两部分同时被运用,《山经》有序多单独运用的色彩词,这为两文本具有一定独立性的观点提供了支持。《山经》的记叙以真实山川为纲,《海经》记载许多海内外奇人异事和神话故事,《海经》色彩描绘理论上更自由多样,然而事实是传统印象中写实性强的文本,色彩词使用更加丰富。
山经
海经
2)“东南西北中”的色彩词对比:
《周礼》:“东方谓之青,南方谓之赤,西方谓之白,北方谓之黑,天谓之玄,地谓之黄。” 《山海经》各章以方位顺序编排,是否方位和色彩间也有这样的对应关系?将《山海经》按方位次序编排的十七个章节分别制成色彩词云图,并按照方位排布成右图,中心为《中山经》,左侧内圈为《西山经》,外圈为《海内西经》、《海外西经》、《大荒西经》,以此类推。由图可知,《山海经》描述的世界中,东部常出现青、碧色,南部常出现赤、朱、丹,这似乎与五方正色的对应关系吻合。但中部赤色最多,西部除了《西山经》白色最多以外白色出现得很少,北部黑色出现得极少,色彩和方位间的对应关系不明显,再一次验证了《山海经》处在五行色系统正在形成的过渡阶段。
3)“上中下阴阳”的色彩词对比:
除了五方和五色的关系,《山海经》中亦有多处关于山之“上下”、“阴阳”或水之“中”,与色彩和物质关系的描述,如“又西五百里曰皇人之山。其上多金玉,其下多青雄黄。皇水出焉,西流注于赤水,其中多丹粟。”,“又东三百七十里曰杻阳之山。其阳多赤金。其阴多白金。”构成了“方位+‘多’+色彩+物质”的词组结构。将上中下阴阳对应色彩词制成云图,发现“上”和“阳”相似,均多金玉、赤金、黄金一类,主色调为黄色;“下”和“阴”相似,均多青雘、青雄黄(青雘和雄黄)、青碧一类,主色调为青色;“中”与前者均不同,多丹粟、白玉、苍玉,恰好为五色中剩下的赤、白、黑色(苍为青黑色)。
总结思考
1. 《山海经》色彩词运用的主要特点
单音节词,正色最多,间色较少。
缀词丰富,尊重现实,有选择性。
五色出现,五方五色,关联性弱。
山经海经,主色类似,求同存异。
2.《山海经》色彩词运用现象的原因
1)文化背景:
先秦时期的色彩认知处于色相与材质识别阶段,五色观念初具雏形,赤、白、黄、青、黑(玄)成为运用广泛、倍受尊崇的色彩,“五”是重要的观念数字,但统筹宇宙知识的五行色系统还未规范成熟。
2)内容特性:
《山海经》记述山川草木、神人异兽,不同于《尚书》、《礼记》记载官方事迹礼仪,色彩运用于描述自然事物,无需强调用色伦理,色彩选择更加自由丰富,也更具有自然写实基础。
3)成书过程:
《山海经》的成书非一时、作者非一人、流传版本多,不同篇章各有意趣,色彩词使用不尽相同,但合并而成的《山海经》又具有内在统一性,各篇章重要色彩词的使用规律及其中体现的色彩观念保持一致。
3. 《山海经》色彩词的后续研究
1)将《山海经》以段分节,研究各山石草木、异兽神灵的色彩面貌,关注色彩与物质的关系,以及描述同一物体时色彩之间的搭配关系。
2)研究《山海经》与《尚书》、《论语》、《礼记》、《诗经》等先秦文本间色彩词运用的联系和差异,分析色彩观念的演变和《山海经》文本的特殊性。
鸣谢
指导老师:南京大学艺术学院 陈静副教授
南京大学艺术学院 李牧副教授
李牧.论《山海经》的色彩系统[J].文化遗产,2019(01):90-100.
台湾大学数位人文研究中心 洪一梅博士
台湾大学数位人文研究中心 胡其瑞博士
Docusky数位人文学术研究平台
http://docusky.org.tw
MARKUS文本标记工具
https://dh.chinese-empires.eu/markus/beta/
Palladio数据可视化工具
http://hdlab.stanford.edu/palladio/
作者简介
林文思,南京大学艺术学院艺术学理论专业,硕士研究生二年级。研究方向主要为中国传统色彩、非物质文化遗产等。
END
主编 / 陈静
责编 / 顾佳蕙
美编 / 张家伟