为人文社科研究插上数字羽翼
The following article is from 中国社会科学网 Author 段丹洁 阮益嫘
数字技术使人类生活方式发生了翻天覆地的变化,而数字化应用也给人文社科研究带来了巨大的驱动力。记录与保存、创新与传承、传播与发展,人文社科研究利用数字化技术将实物载体或理论成果,以多元化的形式储存于数字空间,在一定程度上打破了研究的时空局限。徜徉数字的汪洋大海,如何放宽学术视野,拓展研究路径,成为很多人文社科学者关注的焦点。
一直以来,资料离散和时空分离是古代文学研究的两大难题,中南民族大学数字人文资源研究中心主任王兆鹏表示,数字技术将改变古代文学资料查询检索方式,实现从电子文献的分词定位检索到结构化数据库的分类提取,从点状检索到网状关联,从逐条拷贝到分类打包。数字技术还可以自动对比识别作品间的互文关系,重建古代文学的历史现场,提供古代文学阅读欣赏的崭新体验。
“唐宋文学编年地图”就是一张可以看懂唐宋诗人一生的特殊地图。登录该地图平台,我们可以跟随苏轼的“步伐”,看到他意气风发时的作品,也可以感受到其被贬后,在黄州留下《赤壁赋》的心情。点击切换洛阳,便可发现有57位诗人曾在此留下了603首诗歌,其中不乏《次北固山下》《芙蓉楼送辛渐》等名篇。借助地图,我们可以更深入地感受到韩愈“一封朝奏九重天,夕贬潮阳路八千”的痛苦,还能了解韩愈南贬途中经行之地的地形地貌。
正是数字化技术让历史上一群人、一代人的活动轨迹同时呈现,一个时期的文学生态、文坛活动图景由此得以还原性建构。王兆鹏告诉记者,过去我们可能只知道一个或几个作家曾经在某地的经历和作品,有了“唐宋文学编年地图”,我们就可以了解某个时间点或者时间段内所有作家的活动轨迹。“与全文检索数据库仅能提供字词检索最大的不同是,文学编年地图可以提供更多考量维度,提供更多知识点。”王兆鹏说。
钱锺书先生早在1984年就在中国社会科学院倡导把计算机技术引入中国古典文献的搜集、疏证和整理中。记者了解到,近20多年来,我国在古籍文献数字化和古籍数据库建设方面成就巨大,在一定意义上推动了学术的发展。但这些数据库的主体内容除全文检索外,并没有完成更深入的工作。因此,对古籍文献数据库进行升级换代势在必行。
新一代信息技术和人工智能技术等,能够高效抓取研究所需要的数据资料,通过智能化的信息挖掘,帮助学者从数据中发现现象或事物的本质和彼此间的逻辑关联。中国社会科学院数量经济与技术经济研究所研究员李金华表示,数字化背景下,需要用全新的思维、全新的方法处理资料和选择数据,以此获得有价值的信息。学者科学解读复杂信息所蕴含的真义,准确把握经济、社会、文化发展的规律、特征和趋势走向,从而提升人文社会科学的研究水平和研究质量。
千年莫高,艺术瑰宝。当敦煌文化搭乘数字化列车跨入新时代的发展轨道时,“数字敦煌”实现了跨越时空的穿梭。
记者登录“数字敦煌”资源库,30个经典洞窟,4430平方米绝美壁画,穿越10个朝代呈现眼前。人们不仅可以通过VR全方位细细欣赏这些石窟,甚至能比直接走进洞窟获得更为震撼的沉浸式艺术体验,同时还大大减少了人体、空气流动以及湿度变化对壁画的伤害。
敦煌文化遗产数字化工程积累的海量学术文献资料与高保真数字资源,为敦煌文化遗产的保护、研究和传播提供了良好的基础保障。近年来,武汉大学与敦煌研究院通力合作,围绕敦煌智慧数据资源建设与服务应用开展了一系列探索性工作。武汉大学大数据研究院常务副院长王晓光告诉记者,智慧数据和智能计算理念的兴起,为敦煌文化遗产的创造性转化和创新性发展提供了可能。敦煌智慧数据资源建设的主要内容,包括敦煌文化遗产主题词表构建与关联数据发布、敦煌文化遗产本体模型设计与应用、敦煌壁画图像与遗书文本的深度语义标注、敦煌数字资产管理与数字叙事系统开发、敦煌文化遗产知识图谱构建与应用服务、敦煌遗书数字化复原与数字记忆再造等。
“敦煌智慧数据资源建设与服务工作,继承了‘数字敦煌’项目的建设目标,不仅能够进一步支撑敦煌相关的历史、文学、艺术等学术研究的数字化转型,也有利于促进敦煌文化遗产的保护、传承和传播工作,提升大众对敦煌文化遗产相关知识的理解和认知水平,也为在国际上讲好中国故事和利用先进技术实现文化遗产保护的中国方案提供了支撑。”王晓光说。
数字图书馆和数字出版的发展,使得数字形态的学术文献资源成为学术研究的主流。如今,学者足不出户就可以获得全球各大图书馆的稀有文献资料。数字化应用给人文社科研究既带来了文献资料获取的丰富性和便利性,也带来了方法和范式的变革。
“随着海量数字资源的产生和积累,人类文化遗产的范畴也在扩展,并引发了新的人文学术问题,如数字遗产、数字记忆等。”王晓光谈道,在大规模数字文献资料和专题数据库支撑下,文本挖掘、社会网络分析、情感计算、数字化模拟复原分析等各种新兴研究方法和研究手段的应用,改变了以往以人文学者个体分析和阐释分析为主的范式。通过文献资料的数据化和语义化建模,增强了文献资料的功能可供性,同时也借助各种分析性软件工具和数字平台,提升了人文学者获取、分析、比对的效率。
人类现有的知识将陆续转化为数字形式,再加上数字世界原生的知识(如互联网本身),人们已从知识匮乏变成知识过盛。《数字人文》编委桑海表示,数字时代人文领域的知识转型,一种是呈现式,即把现有知识通过数字化方式呈现,即知识表示;另一种是研究式,即借助数字化方式发现新知,即知识发现。知识表示的数字化,呼唤与之相应的知识发现方式。知识发现方式的变化,反过来又引发了知识表示的进一步变革。到最后,实质都是把阅读文献的主体从人变成机器,进而可以用数字技术进行文本分析。他列举了两篇数字人文研究的文章。一篇是对科幻小说叙事形式的研究(刘洋:《对科幻小说叙事形式的识别与分析》,《数字人文》2020年第4期),以算法区分“展示”和“告知”两种叙事形式,发现主流文学的叙事节奏普遍快于科幻小说,为叙事分析提供了新的视角。另外一篇在计量文学史视角下分析经济学、种族和美国战后小说(丹尼·辛尼金,苏真,杰西卡·扬:《经济学、种族和美国战后小说:一部计量文学史》,李毅翔译,徐曦校译,《数字人文》2020年第4期)。文章通过对近五千部美国当代小说进行建模分析发现,20世纪70年代中期白人男性写的小说中经济学语言增长明显,该研究的样本体量令传统研究难以望其项背。
上海社会科学院社会学研究所研究员陶希东进一步表示,数字时代,人文社科研究无论在理论研究还是方法论上都面临数字化转型,在理念和思维上也出现了新的变化,如数据库建设和应用风行、定性与定量研究并重、从知识关联中探寻新的研究结论等。同时,网络问卷、大数据分析等现代研究方式,使得学者获取资料的效率极大提高,样本代表性进一步增强。
尽管目前人文社科数字化还缺乏成熟成果,但已展现出令人鼓舞的潜力。桑海介绍了关于中国古典诗歌声律统计分析与研究的一些新进展,提出通过对古典诗歌语料库中的声律现象进行统计分析,找出声律现象的规律。若此研究能在大数据基础上进行全面统计分析,相信会使执着于局部规律的旧说失去其有效性,并对整个学科发展产生更大影响。
面对大数据和数字处理技术给人文社会科学研究提供的丰富素材和研究新模式、新思路,李金华提出,要辩证对待数字技术在人文社会科学研究中的应用,避免科学研究对软件、分析技术的依赖,避免研究成果陷入信息的孤岛。他说,人文社会科学研究的是人的思想、情感、观念、精神、价值,研究的是人以及人与人之间的关系,人文社会科学成果是有思想、有温度、有价值取向的。应保持人文社会科学研究的独立性、严肃性和人性光辉,推动人文社会科学研究科学性和批判性的协调发展。
在陶希东看来,数字化浪潮下人文社科发展主要有两条路径,一是顺应数字化社会的趋势和规律,围绕国家数字经济、数字治理、数字社会发展中碰到的重大问题,不断拓展研究领域;二是转变和更新传统的研究方法,在融合利用现代科技手段上下功夫,增强研究成果的理论性、科学性、指导性。此外,还要重视人文社科领域数字化人才的培养,主动组织开展普适性学习,更要实施专业化培训,提高在研究中对数字化技术的利用能力。
“数据、技术终究是工具,核心是人,数字化技术不论如何发展,人文社科领域研究始终要坚守‘思想创新、观点创新’的初心,要以产生‘伟大思想’为荣、‘出大师’为要。”陶希东说。
谈及对人文社科数字化应用发展的期待,王晓光表示,面对数字文明的兴起,人文社科的数字化转型应该加快行动步伐,积极开展数据驱动与理论驱动的研究范式的探索性融合。学术研究只有走在数字化文明发展的前沿,才能指引社会发展的方向,规避文明建设的陷阱。期待高等教育与科研界加快数字化应用步伐,在反思与审慎批判中,创新学术研究与文化传承手段,并借助“新文科”建设良机,推动“三大体系”建设。
数字技术的应用与赋能有望触发人文社科研究在知识基础、方法论和评价体系等多方面的反思与进步,借助数字的羽翼,一个学科大碰撞、知识大融通的时代正在到来。
数字使人文更新
投稿邮箱:dh2020@tsinghua.edu.cn
数字人文门户网站:www.dhlib.cn