查看原文
其他

智慧博物馆发展中的数字人文建设——以上海博物馆的实践为例

刘健 数字人文研究
2024-09-09




转载请注明“刊载于《数字人文研究》2022年第3期”;参考文献格式:刘健.智慧博物馆发展中的数字人文建设——以上海博物馆的实践为例[J]. 数字人文研究, 2022, 2(03): 39-46. 全文已在知网、万方及编辑部网站(http://dhc.ruc.edu.cn)上发表,此处注释及参考文献从略。




摘要:智慧博物馆概念的出现已经有近10年了,在智慧博物馆建设的实践中,采集了大量数据后,对数据的运用却显得不那么尽如人意,在某种程度上这可以说是智慧博物馆建设所面临的一个瓶颈。如何突破这一滞碍,并从数据的采集、管理、挖掘上入手,形成博物馆知识生产和组织服务的新模式,使智慧管理、智慧保护、智慧服务等智慧博物馆的核心功能得以稳固运行,在这方面,人文学界新兴的数字人文研究提供了很好的方法和工具,可供借鉴。

关键词:智慧博物馆;数字人文;数据关联;可视化

作者简介:刘健,上海博物馆信息中心副主任、研究馆员,Email:shanghailiujian@sina.com。



0.


引言

    2012年开始,“智慧博物馆”一词开始在文博界内出现,并迅速走红,几乎成为博物馆数字化建设的代名词。按时任国家文物局副局长宋新潮先生的说法,“智慧博物馆以多模态感知‘数据’替代数字博物馆的集中式静态采集‘数字’,并以此为基础,建立更加全面、深入和广泛的互联互通,消除信息孤岛,使人与人、人与物、物与物之间形成系统化的协同工作方式,从而形成更为深入的智能化博物馆运作体系”。其实,所谓博物馆“信息化”“数字化”“智慧化”,提法虽然不相同,但本质并没有改变,只是在不同阶段,为适应阶段性要求下的不同任务而有不同的侧重和强调而已。宋先生所给出的“基于角色(Role)、对象(Object)、活动(Activity)、数据(Data)四个维度的智慧博物馆特征模型”中,数据无疑是智慧博物馆之所以能够成立的基石。当博物馆的各类数据——藏品数据、业务数据、管理数据、研究数据、观众数据等——纷纷成为数据库中的沉淀数据以后,如何用好这些数据、发挥它们的价值,是智慧博物馆建设必须重视和面对的问题。正如安来顺先生所言:“当信息成为博物馆收藏、研究、展示和传播的关键要素的时候,数字化更直接将信息或数据置于博物馆的核心”,但在智慧博物馆的实践中,对各类数据的运用却显得不那么尽如人意,在某种程度上这也可以说是智慧博物馆建设所面临的一个瓶颈。要突破这一滞碍,就必须回归到“知识机构”这一博物馆的核心属性,从数据的采集、管理、挖掘上入手,形成博物馆知识生产和组织服务的新模式。也唯有在此基础上,智慧管理、智慧保护、智慧服务等智慧博物馆的核心功能才能得以稳固运行。而在这方面,新兴的数字人文为我们提供了很好的方法和工具。数字人文研究“致力于促进文化信息资源的广泛获取和管理、创新科研数据的处理和研究方法、促进学术沟通、加强学习和教学同时提升文化信息资源的公众影响力”,这正是博物馆的数据应用所需要的,无论是在研究、展示、教育这些重点业务,还是在一般的工作上,都是如此,博物馆所累积的大量数据资料正是数字人文可以大展身手的基础资料源。也就是说,当博物馆置身于数字社会,面对数字化转型的需要,从智慧博物馆的功能出发,就必须引入新的手段和方法进行探索,从而改变博物馆原有的业务生态,就目前来看,数字人文无疑是一个比较好的选择。

    本文将通过对数字人文与博物馆关系的介绍,探究利用数字人文驱动智慧博物馆发展的意义所在;并以上海博物馆的数字人文实践为例,清楚直观地展现博物馆如何运用数字人文的方法来提高自己的数字展示和传播水平。


1.


博物馆与数字人文

    什么是数字人文。武汉大学王晓光教授认为,数字人文“是一个将现代计算机和网络技术深入应用于传统的人文研究与教学的新型跨学科研究领域,它的产生与发展得益于数字技术的进步及其在科学领域的普及应用”。这一定义反映出了数字人文的学科性、多样性和开放性的特征。从某种意义上可以说,数字人文是充满活力的数字技术与传统人文研究之间相互砥砺、不断对话的结果。说起传统的人文研究,很多人都会想起唐代韩偓的诗句:“白首穷经通秘义”,读书人对典籍文献进行细读和考据的场景跃然纸上。拜当代计算机技术发展所赐,数据库成为现代研究者查找资料的主要数据来源。在数字人文的语境里,除了数据库之外,人们还可以借助更多的数字手段改变研究方式,如地理信息系统、图像识别技术的应用,计算机文本分析、社会网络分析等新型研究方法的引入,遥读、开源、众包等理念上的革新,为人文研究者提供了新的研究视角、研究方法和研究工具,也在一定程度上改变了人文领域的知识生产和交流的模式。多年来,在计算机和网络技术的支撑下,数字人文研究给人文科学范式和人文知识传播带来了积极的变化和影响。作为博物馆业者,尤其是从事智慧博物馆建设的人士,绝不能无视这一趋势。

    作为一个以物(藏品)为主要收藏、研究、展示对象的知识机构,博物馆的业务生态基本上围绕物而展开。即使是研究,也是以藏品本体的价值描述和阐释为主的单一学科研究范式,并没有完全摆脱金石学的遗绪和考证传统,与目前的多学科的融合研究的趋势差距很大;在人文类博物馆,单打独斗的个体研究也还是一种常态,学术孤岛现象普遍存在;博物馆的研究和阐释成为馆内研究人员的专利,社会公众一般很难涉足或参与。这就涉及博物馆的开放性问题了。虽然经过多年的数字化建设,博物馆积累了大量的以藏品为核心的数字资源,但自身的应用有限,而且开放程度极差,馆外学者也因无法取得数字材料而失去了研究的权利。因此,博物馆非常有必要改变传统的业务生态,将业务与数字技术结合,创造出多学科融合、以技术与人文碰撞带动博物馆的新型发展,数字人文可以在其中发挥较大的作用。至少,在方法论层面,博物馆有必要借助于已成为知识生产重要方式之一的数字人文,以研究展示为导向,以数字思维及跨学科的知识整合方法介入自身传统的专业研究活动,形成基于数字内容的知识生产与传播链。文物藏品研究这样的领域,其进步不是基于新材料的发现,就是依靠新技术方法的运用。对博物馆而言,除了考古新发现,就文献等来说,发现新材料已经变得越来越不容易,但以数字人文为代表的新技术对人文研究的介入,如便利和快速的数据清洗和处理,为从文献中挖掘出新材料带来了更多的可能性。这是一方面。另一方面,数字人文还提供了研究方法上的更多样化的选择以及由此产生的新的路径,从而带来种种变化,比如研究领域的扩展,研究视角的更新,等等。极而言之,数字人文所带来的影响,在某种程度上或许使得传统人文科学在新的时代看到了突破困境的曙光,这也是新文科大行其道的原因。马云说,“物联网、人工智能将驱动‘新制造’”,那么我们同样可以说,数字人文将给博物馆带来以一系列技术方法为基础的、以互通互联的数据聚集平台为重心的、以多元融合为特质的博物馆“新研究”。当然,说“新研究”,并非是要否定传统的研究手段和方法,至少在目前阶段,数字人文由于其自身的不成熟,还远远不能撼动传统研究的地位。即使在数字人文成长、强大起来以后,它也只是人文研究重要的一翼,并不会完全替代传统的研究。但即便就现在而言,且不论它所取得的实际成果,仅其所代表的方法论意义,就值得我们重视。在方法论的层面,就如同文艺复兴时期曾经出现过的那些有趣的交融,数字人文反映出科技与人文在一个新的层面上的再次融合,它所带来的将是一种方法论和研究范式上的创新,可以帮助博物馆实现研究、展示、传播等业务的升级和创新发展。这又体现了数字社会的一种需要:当数据成为一种必不可少的要素,当让数据说话成为一种习惯,利用数字技术对数据对象进行分析处理就是一件理所当然的事情了。从这个角度而言,数字人文不但是一种描述或呈现的方法(人文成果的数字化),更是一种研究方法:它能够帮助人们发现问题,在此基础上,还能够研究问题甚至解决问题。如果真能达到后者的目标,那么,这种变化对博物馆的业务改革无疑是革命性的。

    这里还必须提到数字人文的一个特性,就是开放性。没有数据的开放获取,数字人文研究大概就会成为无本之木。开放性已经成为数字人文领域的一个重要思想,这与互联网时代的核心理念也是天然契合的。智慧博物馆建设开展以来,藏品数据的采集和管理是各个馆都在做的一件事。仅全国移动文物普查中,统一标准登录文物完整信息的国有可移动文物就有2661万件/套,登录文物照片达5000万张,数据总量超过了140TB(数据来源:“第一次全国可移动文物普查工作报告”),这也是智慧博物馆建设最大的基础性成果。一般而言,在互联网时代,这应该是一件令人欢欣鼓舞的事情。近年来,荷兰国立博物馆大方地将12.5万件藏品的高清图放到互联网上,供大众随意下载;大都会艺术博物馆也开放很多藏品的高清图像资源;尤其是台北故宫在其网站上设Open Data专区,高清藏品图片无需申请,不限用途,不需付费,大众可直接下载使用。国内博物馆是否也可照此办理呢?但事实上,那些因此以为借由智慧博物馆建设的发展,而能加快国内博物馆数据资源的共享和普及的人士,却往往失望。造成这一状况的原因并不在技术和资源本身,而是在博物馆人的固有思维上。保守的心态、相对孤立的环境和学术利益的驱动造成了博物馆人对资源开放的普遍的不接受。要解决这一问题,首先需要博物馆人员,尤其是管理者开放性思维的建立。开放性思维的建立不会是一件自然而然的事,必须要有一定的外部诱因和压力才能有效促成,而数字人文由于其本身的开放性,恰好可以担当这一角色。

    总之,数字社会给博物馆各项业务都带来了前所未有的挑战。一方面是需求的不断多样化和科技化,另一方面博物馆的很多业务流程和工作方法很大程度仍停留在传统的经验主义架构之内,未能充分地发挥自身的固有功能。数字人文研究的实践给博物馆带来了崭新的启示与机遇,并能够涵盖博物馆业务收藏、研究及展示的全流程,对实现博物馆智慧化的目标具有重要的意义。


2.


上海博物馆的数字人文实践

    近年来,在图情界高涨的数字人文建设热情的影响下,以及国外博物馆一些成功项目的感召下,上海博物馆也开始了自己的数字人文的实践。首先我们对博物馆数字人文的特点进行了分析,认为由博物馆的实物性特征所带来的源于图像本体的排比和深度分析,应该是博物馆数字人文相较于图情界和高校社科类数字人文的一个主要的特点,也是博物馆数字人文研究能否有所发展的一个关键。从博物馆的业务面及与智慧博物馆的结合出发,我们将上海博物馆的数字人文实践定位在研究和展示两个方面,即在学术研究基础上的数据可视化展示,希冀以研究保证展示的科学性。用灵动和直观的数据可视化方式做展示,可以化复杂为简单,化抽象为具体,化隐性为显性,从而增加知识的可接受度和可及性。数字人文的介入也可使博物馆的知识以一种有组织、有体系的方式来进行表达与传播,并以此在泛滥的沉浸式之外为博物馆的知识性数字展示找到一条途径。为此,我们进行了多种数字化阐释方式的尝试。


2.1 解析型阐释

    实际上,上海博物馆很早就开始在知识传播方面进行积极的尝试。比如在2013年,上海博物馆网站就借鉴国外数字化专题报道的形式,将文字、图片、音频、视频、动画、三维模型等融于一体,创建了国内第一个藏品深度解读栏目——《每月一珍》。它把一件藏品的信息彻底揉碎之后再进行有效的组合表达,通过在一个网页中嵌入多种多媒体内容的形式进行信息的分解表达,自然而生动地开展对藏品的多维度解读,将在陈列现场可能看不到的东西更全面、深入、清晰地呈现出来(图1)。

图1  “每月一珍”之牺尊界面(局部)


2.2 关联型阐释

    在网络化、数字化的环境下,观众的探索欲和自我表达的要求越来越强烈,而数字人文强大的数据聚集能力和无所不在的数据关联,使我们得以在博物馆线上展览的解析型阐释模式之外,开始进行探索型阐释的尝试,即除了在相关主题下面叙述展品的构造、用途以及展品背后的故事,还试图让观众在一堆有序甚至无序的数据之中,通过关系性数据的比较,进行互动、观察、操作,以达到探索、发现的目的。2017年的“遗我双鲤鱼——上海博物馆藏明代吴门文人书札精品展”的网展,是我们以数字人文的一些方法和手段进行线上展览设计的初步尝试。为了凸显明代文人生活的多面性,设计了“见字如面”版块,即摘录书札中一些有趣的生活用语,如“缺银两”“放鸽子”“下午喝一杯”等,利用数据工具制作成“词云”作为“见字如面”版块的入口,目的是用这些当代人熟悉的、直白的生活用语拉近观众与古代文人书札之间的距离。此展的另一个独特栏目则是根据明代吴门人物关系图所设计的“云中谁寄锦书来”版块。我们利用“数字人文”的理念和方法创建了一幅吴门文人的可视化互动关系图。关系图用了李清照《一剪梅》的词意,以灿若星空的样式诗意地表达当年吴门文人群英荟萃的生态(图2),把原展中已有的错综复杂的线性关系图转化为可视、多维度而又不失观赏性的数字化形态的星空结构关系图。同时我们还充分利用“图像的诠释”功能,通过位置排列、色彩变化和球体大小等可视化元素,反映人物间的关系类型和疏远亲近,数字人文的特点得以充分展现。观众可以用鼠标作为揭秘工具,直观而又灵动地了解和思考明代吴门文人之间关系变化的社会现实空间。

图2   “遗我双鲤鱼网展”之人物关系网络图


2.3 发现型阐释

    2018年年底的“董其昌数字人文展示项目”,是我们正式以数字人文的名义开展的一个探索。和以往博物馆展示围绕文物藏品进行铺陈的传统做法不同,这一项目选择了以人物为中心,在收集大量图像和文本数据的基础上,按照数字人文的研究思路,以时、地、人、事、物对数据进行细颗粒的分类并重新组合,由此探究和展现董其昌一生的艺术历程以及其作为一个文人的游艺趣味。同时与实体展聚焦于作品及创作不同,该展示更多地关注创作的成因,并通过知识点的梳理和可视化的效果,意图为观众呈现一个更丰满的、社会化和生活化程度更高的董其昌。数字人文研究常用的一些技术方法,如文本分析、时空分析、社会网络分析、地理信息技术(GIS)等均在这一项目中得到了应用,以对数据进行分析并进行可视化转换。

    我们所开发的这一系统不只是一个简单的可视化展示系统,而是基于学术而产生的一个知识系统,在这个系统中收纳了无数与董其昌及其作品相关的知识点,正是这些知识点构成了一幅可见的知识网,使观众得以在其中漫游。最重要的是,它还是一个发现系统,我们收集、整理、展示了大量的数据,有心的观众可以通过对数据的深入观察和比对,去发现问题进而解答问题,既能学到知识,又能得到方法。比如董其昌生平大事的可视化列表(图3)。它将董氏82年的人生经历逐年开列,并汇集其纪年作品数据形成曲线相参照,映射出其个人经历与艺术创作的关系。同时,这张年表容纳了董氏所生活年代的重大历史事件和文化艺术事件,力图以一种更为广阔的视野考察社会环境和文化思潮对董其昌艺术理念及创作的影响。这张年表还罗列了同时期欧洲历史与文艺的重大事件,将中国艺术史置于整个世界艺术史的框架中予以观照,比较同一时代不同文明中社会制度、文化走向与艺术发展的不同理念和方式,希望反映中国艺术乃至文化的独特性及其在世界历史中不可或缺的地位。这一设计最大限度地利用了专业研究的深度信息,并以一种扁平化的方式加以直接反映,既可俯瞰全局,又能谛视细节,形成了系统与元素的并置展示,宏大叙事与个案描述的互相融合。


图3  董其昌大事作品年表(横排)


    该项目还将人工智能引入到书画研究和展示,为国内博物馆中首次。藏品实物信息的研究是博物馆数字人文研究中个性最为突出的部分。实物的形态、尺度、色彩、装饰元素构成、位置关系、语义指向、主题内涵、表达手法等具有独立于文本的信息,这些与对其进行描述、评论的文本信息之间的关联共同构成了关于藏品实物的完整信息。而机器学习技术可以帮助研究人员更好地把握、分析研究董其昌作品的特征。因此,我们在作品栏目中对董其昌书画作品数字图像本体的分析做了一些探索:尝试引入机器学习技术,以人工智能分辨中国古代绘画的元素及特征,初步形成了素材数据抓取和聚类的自动化模式(图4)。


图4  董其昌项目之作品机器学习界面


2.4 综合型阐释

    在“董其昌数字人文展示项目”引起业内反响的同时,我们实际也面临着选择,我们有过延续董同一模式,做“吴门画派”或者是“清代四王”项目的考虑,但最终,持续创新的想法还是主导了我们的行动。经过反思,我们认识到,董其昌项目聚焦于人物本身,这是它的优势,但在某种程度上也导致了它的缺憾,即在人、事、物、空间四者之中,太过集中于人及其作品,而对于造就人的社会和自然环境有些漠视。于是,就有了“宋徽宗和他的时代”这一项目的最初构想。从董其昌到宋徽宗,不仅是一个由点到面的扩展,而是在试图改变博物馆原有的较为单一保守的研究视野和方式,试图融入诸如社会学等多学科的内容,使观众能更多维地看待宋代文化奇景之所以能够产生的社会基础。项目基于文物知识概念模型,面向不同类型用户,分析文物知识组织方式。通过对各类数据进行语义标引和文本分词,以及对人、事、物、地、时数据做全面整合关联,力求能做到博物馆数字化展示人、物与社会之结合的理想目标,为文物知识的聚合、叙事、传播技术研究及创新应用提供经验。

    “宋徽宗和他的时代”项目由综合主页及“大事”“人物”“作品”“经济”“文献”等七个版块组成,试图以人、事、物与时空、社会面的结合实现数据的知识化、结构化和可视化的呈现,从而揭示出北宋文化艺术超逸拔群的背后原因。项目需要围绕各个版块进行合理的内容策划,而围绕这些内容的资料组织、可视化设计即是本项目的难点。宋徽宗专题涉及非常庞杂的资料,包含历史、艺术、经济等诸多领域,且来源于各个渠道,需要有较好的信息组织和处理能力。同时,需要在开发设计中具备良好的数据分析能力,并可熟练使用可视化技术方法。

    综合主页以时间为经、空间为纬,由古代文献记载、文物及相关学术成果资源转化成的可读数据经多对多的关联,组成了以人、事、物为坐标的动态时空型知识地图(图5),从而呈现宋徽宗54年人生所反映的北宋末年整体的社会发展趋势、重大事件节点以及相关文物例证,使原来茕茕孑立的知识点之间的关系及相互的层级得以浮现。“大事”版块分为图谱化总览页面和时空地图页面两种形式,以呈现综合、分类两个阐释类型。综合大事页面(图6)采用比较传统的时间轴和地图相结合的方式,将北宋末年中国及欧洲历史、文艺发展的进程并陈于一个画面之中,反映中华文明的区域性特征及在世界范围内的独特成就与位置。分类大事页面通过和战、灾异(图7)、文艺三个角度,多元聚焦并揭示北宋末年的政治、经济、文化情况,探讨了北宋末年安全环境、自然环境、文化环境对于历史发展的直接或间接影响。在这一版块中,需要能把数据或信息编码为图形中的可视对象(例如点、线或条),以将之向用户清晰有效传达的技术。我们采用统计图形、图表、信息图和其他可视化工具,使数字数据可以使用点、线或条来编码,以视觉传达定量消息,有效地帮助用户对数据进行分析和推理。“人物”版块,一是以“变法人物”关系图谱概要呈现徽宗时期错综复杂的政治派系及其内在的关联规律;二是以“文艺地图”的形式体现北宋文学、书法、绘画等方面著名艺术家的时空分布规律(图8),创作流行趋势及具体作品实例;三是以“行迹图”的形式对徽宗时期最具代表性的文艺人物苏轼和李清照分别进行个案展现,反映徽宗早期北宋文化特点、其对徽宗艺术的影响,徽宗时期艺术的发展流变及对南宋文艺发展的深远影响。对于宋徽宗本人,则将其本事、家族(图9)及作品数据集作为一个独立的展示单元,并与“作品”等版块形成互联,显示出既独立又整体的展示风格。

图5  “宋徽宗与他的时代”综合主页界面


图6 “宋徽宗与他的时代”大事主页界面


图7  “宋徽宗与他的时代”灾疫大事界面


图8  “宋徽宗与他的时代”北宋文艺地理界面


图9  “宋徽宗与他的时代“北宋帝系关系图界面


    作为古代艺术博物馆,艺术作品版块当然不可或缺,这次作品展示我们改变了原来的瀑布流方式以及传统的分类形式,转变为在对作品进行分类标注的基础上,以主题聚类的形式将之呈现(图10),以实例展现北宋末年艺术发展的大致面貌。为此还专门梳理了上博藏品管理系统中书画类文物采用的本地标准化术语,映射国际文物领域元数据标准《艺术品描述类目》(CDWA),分别构建了针对宋代书画类文物的本体、主题分词词表,通过分析文物相关的人、时、事、地、物等概念属性,建立书画文物知识概念模型(图11),并进一步形成《书画类文物知识组织表达模型规范》行业标准文稿。我们还尝试完成了书画文物的知识图谱。当然,想要把数据关联起来,根据相关原则,数据要求为 RDF 格式。目前上海博物馆已有的数据库均为关系型数据库,属于结构化数据,所以需要通过“D2R”(Database to RDF)将关系型数据库的数据转换为虚拟的RDF数据进行访问。主要分为两步,一是生成Mapping文件,第二步便是通过Mapping文件对关系型数据库进行转化和访问。在构建书画文物专题知识图谱过程中,需要整理书画中的花鸟、人物等元素,同时需要提取印章、题跋等信息,从而丰富书画文物知识。由于一件书画文物往往有着大量上述信息,依靠传统人工提取虽然精度较高,但是需要花费大量时间,无法满足知识图谱应用需要。因此引入深度学习技术,对书画文物的视觉主题元素、印章、题跋元素进行信息提取和语义化的聚类,最终形成智能化关联和呈现(图12)。与此同时,我们还引入目前主流的数据库管理技术,合理安排宋徽宗作品以及其作品中所含有的元素等之间的逻辑关系,以方便对各个作品及元素进行查询和管理。

图10 “宋徽宗与他的时代”北宋绘画主题聚类界面


图11  书画文物知识本体基本数据模型


图12 “宋徽宗与他的时代”作品及相关元素聚类展示界面


    以上实践对于上海博物馆来说,突破了国内智慧博物馆建设同质化的桎梏,让传统的知识体系和数字化的知识系统在博物馆中形成了竞争性的多层次知识结构,也给社会提供一种新的博物馆传播形式的选择,可以进一步的满足公众对知识探索、学习的需要。这一切,在形成了上博智慧化建设新的上升空间的同时,也对我们的数字资源质量、人员的知识背景和水平以及思维理念等都提出了新的要求,需要我们积极勇敢地去努力面对。


3.


结语

    从上海博物馆的数字人文实践来看,确实,博物馆的智慧化建设在融入了数字人文之后,可以形成基于数字环境下的博物馆研究和展示的新思路。它能高效整合原有的博物馆研究的数据资源,打破研究与展示的壁垒,形成知识生产的和服务的新范式:以知识传导为目标,以数据呈现为手段,引导观众探索、参与,自主学习、自我发现、自行获得。同时,它也拓展了传统展示的外延,提供了由观看向阅读转换的参观/学习新方式。当然,由于博物馆信息数据数量大、样本量小,类型复杂、非结构化,采集、关联、分析、呈现难度大,因此,如果要在博物馆中推广数字人文研究,那需要更进一步地做好数据的基础工作,比如建立通用的标准,以实现数据的可扩展、可交换;建立相关的语料库、知识库;对数据进行清洗、挖掘、标注等工作。只有基础工作扎实了,数字人文在智慧博物馆乃至博物馆整体业务建设中的应用才会广阔。




排版:刘子涵

校对:魏寒秋


继续滑动看下一个
数字人文研究
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存