视域 | 当线装书“遭遇”数字化,古籍数字化“良方”何在?
点击社会科学报关注我们
随着信息化时代的到来,各种数字化项目应运而生。国内关于人文社科类数字化项目的讨论,以古籍类居多。从实际运行来看,数字化项目有独特之处,现有的运作模式常常不能顾及,因此带来了各种各样的问题。
原文 :《探寻人文数字化难题的“良方”》
作者 | 洛阳师范学院副教授 王国强
图片 | 网络
当线装书遭遇数字化
基于文化遗产保护、文化传播、商业运作和学术研究等各方面的考虑,世界各国和地区均在不同层面推出了围绕人文社科成果数字化的种种举措。
美国数字资源数量丰富、开放度高,不仅有闻名遐迩的谷歌数字图书馆和互联网档案,还有美国国会图书馆和纽约公共图书馆的标杆式数字资源,此外还包括数量庞大的各大学图书馆数字特藏。法国有国家图书馆的“Gallica”数字图书馆,而旨在保存和展示欧洲丰富文化遗产的“Europeana”数字图书馆,是欧洲各国在数字化时代共同努力的一种体现。日本国会图书馆曾向国会申请巨款对馆藏进行数字化,日本的博物馆系统推出了“e国宝”和“ColBase”。
相较而言,我国在人文社科资源的数字化方面与上述国家和地区还存在相当的差距,但国内尤其是大陆地区最近几年正在发力,在数字资源建设的意识和成果方面均有诸多可喜的变化。
首先是意识方面的变化,在中文古籍数字化方面有最为明显的体现。荣新江在《数字化关系到国家命脉》一文中指出,“数字化是一个国家战略,是一个国家的命脉”,古籍的数字化“会带来一个古籍重新发现的时代”,“我们不论做什么研究,都有可能在无意之中发现很重要的研究素材”。杜泽逊在《古籍数字化解古人未解之题》一文中认为,“有了数字化和网络传递的技术,可以跨国、跨地区,在自己家里、在研究室里,查看异国异地的藏品”,解决了古籍在传统方式下基于安全等考虑所产生的不易获取等问题。两位教授谈论的是古籍,但可视为关于数字化意识改变的显例。
在数字化方面的成果也有显著的变化。除了商业化运作的数据库,图书馆和档案馆等文化机构也在不断进步。比如古籍方面,截至2019年10月28日,“全国古籍普查登记基本数据库”已累计发布217家单位的普查数据772861条7447203册。国家图书馆联合多家图书馆和博物馆通过“中华古籍库”等平台发布古籍7万余部(件)。档案系统可以第一历史档案馆和第二历史档案馆为例,前者馆内档案信息化平台开放的数字化档案已近440万件,后者则公开了北洋政府档案4500余条2万4千余画幅。
数字化工作遭遇诸多难题
在肯定我国人文社科资源数字化方面的变化和成果的同时,我们也应该看到目前存在的问题。
资金往往存在较大缺口。数字化项目的建设周期一般比较长,需要不断投入,对资金的要求很高。商业公司能够在数字化方面不断成长,资金投入是关键因素,但商业公司往往采用订购的方式,开放度有限。从学术研究、文化传播等角度看,开放获取类资源更为重要,此时就不得不考虑资金问题。虽然近些年来的国家社科基金等资助了一些人文社科类的数字化项目,但在资金投入上参照的是一般的基础研究项目;加上资助周期同样参照基础研究项目,只有三到五年左右,滚动资助的几率很小,导致资金往往存在较大缺口。
缺乏规划和协调。在数字化建设的起步阶段,一般以本机构收藏的特色文献为重点,我国人文社科类数字化项目建设也不例外。这种各自为战的模式很难兼顾其他。非商业机构在资金不足的情况下运作项目时,就不得不考虑成本问题,因而常常不能保证质量。缺乏规划和协调还导致重复建设的情况比较严重。
利用率较低。这个问题在商业数据库和开放获取类资源中都不同程度地存在。商业数据库主要的障碍在获取,该类数据库一般需要订购才能使用。开放获取类资源则过于分散、多样,阅读和下载的方式也各不相同,了解和利用需要花费较多的时间。
开放度较低。目前内地的数字化项目以商业类为主流,诸如“中国知网”“万方数据”“读秀”“超星网”等。至于与商业类数据库秉承不同理念的开放获取类资源,目前仍在发展之中,很难与其平分秋色。故总体而言,数字化项目的开放度相对较低,人文社科领域的数字化资源亦然。
学术界参与度有待提高。数字化项目除了技术问题之外,还要考虑各种资源的专业性等问题,需要技术人员和各领域专家的长期合作与交流,在此基础上建成的数据库方可达到理想效果。由于受考核方式等多种因素的影响,周期长、投入大的数字化工作引不起学术界的参与热情,这对数字化的发展非常不利。
单列或增设数字化项目专项基金
通过设立专项基金,配合有针对性的管理举措,再加上平台化的整合,应该可以在相当程度上解决人文社科类数字化项目中长期存在的上述问题。
在国家、各部委和地方的基金项目中单列或增设数字化项目专项基金,同时欢迎社会各界以捐赠等方式成立同类基金,共同致力于数字化基金的多元化,这可以在相当程度上解决数字化项目资金缺乏这一主要问题。所谓专项,除了单列、专用之外,还应包括有针对性的管理、规划、验收和展示等一揽子计划与措施。
在管理上,数字化基金必须坚持专款专用,并制定适应数字化项目特点的各种举措。数字化项目基金的资助额度、周期等均应有所调整。数字化项目的资助额度应该根据项目本身的实际情况,由申请人提出预算,专家委员会和基金办公室审核后立项拨付,不预设资助额度,不设硬性指标,资助周期也应相应延长,并且鼓励对顺利完成且需要进一步提升、拓展的项目进行滚动资助。
各级各类数字化专项基金还应通过发布指南等方式对数字化项目进行长远规划,协调全国或本部门、地区各机构之间的具体工作。规划和协调方可保证数字化工作的有序推进,同时避免重复建设等问题。基金的专家委员会还应制定出数字化工作的标准流程和各项指标要求,引导数字化工作实现标准化。
在标准化的基础上,整合资源并实现平台化,是提高数字化资源利用率的有效手段之一。受基金资助的项目可以采取分散建设、平台整合的方式展示项目成果。具体而言,至少有以下阶段和要求:申请项目时,申请者的所属单位必须承诺,将来授权项目负责人建设网站并提供必要支持;项目完成时,主持人需要在单位的网站上开辟相应栏目,按照基金的标准并结合专业考订资料、上传数据并建成数据库;验收合格后,项目组需要按约定向基金管理办公室提供网站接口或数据资料,为将来的整合作好准备。按照类型或部门进行平台化建设,就是将某一类或某个基金支持的所有数字化资源整合为一个可以一站式检索、浏览的网站。
此外,秉持开放获取的理念,受基金支持的数字化成果原则上应该向所有互联网用户开放。数字化项目专项基金的设立也可以在相当程度上提高学术界的参与度,从而大大推进数字化工作。
文章为社会科学报“思想工坊”融媒体原创出品,原载于社会科学报第1722期第5版,未经允许禁止转载,文中内容仅代表作者观点,不代表本报立场。
拓展阅读