查看原文
其他

建设国家文化大数据体系项目《中国古籍图典数据库》的思考和探索

欢迎关注 国家图书馆出版社
2024-09-14


4月28日上午,中国公共关系协会文化大数据产业委员会在京召开线上专题座谈会,邀请部分在国家文化大数据体系建设中成绩突出的成员单位,围绕如何落实《关于推进实施国家文化数字化战略的意见》提出的重点任务进行研讨。国家图书馆出版社社长魏崇结合国家文化大数据体系项目《中国古籍图典数据库》建设情况作汇报发言。



近期,中办、国办印发《关于推进实施国家文化数字化战略的意见》(以下简称《意见》),对在新时代实施国家文化数字化战略的总体要求、重点任务、保障措施、组织实施进行了部署,这是新时代党和国家对建设国家文化强国、提升国家文化软实力的重大战略举措。
近年以来,国家图书馆出版社在推进数字出版、融合出版以及文化大数据体系建设等方面做出了一些探索,下面结合国家文化大数据体系项目《中国古籍图典数据库》建设谈一下对《意见》落实的思考。

1

文化数字化是时代主题是新时代的国家战略

数字化是时代主题、时代大势,根据对“国民经济和社会发展十四五规划纲要”的统计,“数字化”出现了25次,与“数字化”的如数字社会、数字孪生、数字技术等出现了60多次。文化数字化也已经过多年来的建设与实践,各级各类文化机构在开展数字化中都有一定的积累,包括公共文化数字化建设和文化产业数字化成果,但与新时代建设文化强国的总要求,按照与当代文化相适应、与现代社会相协调的角度来看也存在不足。
新出台的《意见》将“文化数字化”提升为国家战略,做出了顶层设计,规划了内容、平台、产业化等八大重点任务,任务明确、重点突出、保障有力,必将推动国家文化大数据体系建设进一步提速。其中对国家文化大数据体系建设的目标确定为“物理分布、逻辑互联、快速链接、高效搜索、全面共享、重点集成”,这必将极大发挥各方合力,整合资源,激发活力,极大提升文化服务供给、更好让文化成果全民共享。《意见》规划的路线图、时间表,将文化资源数据化,进而产品化、商品化的过程,最大程度激发各个参与方面参与热情,激发活力,发挥合力,实现效益。

2

古籍数字化是出版融合发展的内在要求是开展文化数字化的重要内容

古籍是中华文化传承的重要载体,新时代以来,古籍工作越来越受到党和国家重视。4月11日,中办国办印发了《关于推进新时代古籍工作的意见》,意见在“加快古籍资源转化利用”中提出“推进古籍数字化”,要“统筹实施国家古籍数字化工程。积极对接国家文化大数据体系,加强古籍数据流通和协同管理,实现古籍数字化资源汇聚共享。”这其中的要求与文化数字化战略一以贯之、相互契合。
国图出版社是古籍专业社,我们在传统出版方面先后整理出版了《中华再造善本》《中华传统文化百部经典》《永乐大典》《国家图书馆藏敦煌遗书》等一批规模宏大、影响深远的重要文献。同时,在开展数字出版时也重点在“推进古籍数字化”方面做出探索,2014年以来陆续建设了“中华再造善本数据库”“中国历史人物传记资源库”“中国古籍影印丛书查询系统”等古籍数字产品。这些产品通过拍摄图片、文字识别、建设数字化档案等方式,把碎片化的信息聚合起来,实现文献数字化、可视化,作为重要的古籍再生性保护手段,既有利于中华优秀传统文化保护,也拓展了传承与传播的路径。

中国历史文献总库

同时在单个产品建设基础上,“十三五”以来我们不断推进数字出版产品逐步系列化、规模化,在“古籍文本结构化、知识体系化、利用智能化”上不断探索。2021年我们启动了一站式总平台“中国历史文献总库平台”建设,按照1+4+N总体思路分步建设,1是一个总平台,中国历史文献总库实现一个平台、一套标准、一站式可跨库检索;4是4个资源型大型数据库:中华再造善本库、民国图书库、近代报纸库、民国期刊库;N是若干个专题库、知识库,包括红色文献库、图书馆学库、永乐大典库、鲁迅手稿库、中华医藏库等。已建设完成的“珍贵古籍数字资源应用平台”入选国家新闻出版广电总局首批“新闻出版产业示范项目”,“近代报纸数据库”入选国家新闻出版署2020年数字出版精品遴选推荐计划。
下一步我们将在国家古籍数字化工程支持下,做好“《永乐大典》高清影像数据库”“古籍印谱知识与印章识别系统”等示范性古籍数字产品。

3

融入国家文化大数据体系建设《中国古籍图典数据库》的建设与探索

《意见》在重点任务中指出,要关联形成中华文化数据库,聚焦“中华优秀传统文化,提取具有历史传承价值的中华文化元素、符号和标识,丰富中华民族文化基因的当代表达”。

中国古籍图典数据库

2020年,中央文改办发布《关于做好国家文化大数据体系建设工作的通知》,在精神指引下,我们结合之前在古籍图片类资源积累和产品建设的基础上,策划了《基于历代典籍整理的中国传统文化图典深度标引与素材库建设》项目,让中国传统文化图像素材成为中华传统素材库的组成部分。这个项目对标国家文化大数据体系要求,在已有资源基础上进行了从内容到运营方式的提升,目前已经完成一期建设,二期项目正在加紧建设之中。

国家文化大数据体系是一项具有开创性的系统工程,既是一个文化数据生产的平台,同时也是一个文化运营的平台,通过大数据体系,能够让我们的文化产品与其他的文化相互关联,形成一个完整有机的体系,通过平台与文化产权交易系统的对接,实现文化资产的产权交易,让参与者能够产生持续生产的动力,能够保证大数据具有吸引力与生命力。

由于大数据平台上包含有不同类型、不同来源的系统,数据之间通过关联相互联系,因此标准化是整个平台的基础。我们在项目建设之初,就按照国家文化大数据体系建设的统一部署、统一要求开展,从实践来看,文化大数据统一平台、统一接口、统一标准,对推动我们具体工作顺利实施、发挥效益有重要意义。同时,针对中华传统图像素材设计了一系列的分类及加工标准,今后相似的资源可以采用这些作为依据,在保证标准性同时提升了复用便利和示范价值。

在具体建设上,项目依托历代中华古籍,从中整理搜集约12万幅插图,逐一深度标引、分类,将具有价值的内容解析为单独的图像素材,实现传统文化元素的新解析、再创作,成为新的文化元素,为文化创意产业、文化大数据提供新的资源。一期已搜集整理了古籍中的各类插图八万余张,对每张图片都进行了精细加工和深度标引,每张图都标明图片名称、来源书名称、作者、年代、分类、图片风格和推荐、列举图片可能应用的场景。从设计师使用的角度出发,凡是图片元素可适用于现代设计的,都进行了标引定位、标签词说明和图中文字的识别和录入。

一期我们将部分数据通过国家文化大数据体系底层关联集成系统上传,利用底层关联系统,除了可以进行数据管理,还可以设立交易规则,为今后文化数据的运营提供了基础。关联系统也正在不断进行升级,随着今后交易系统的开展,也会增加更多素材到文化大数据平台。

将插图中的元素进行深度解析

目前国家文化大数据建设已进入加速阶段,我们一方面要将已经建设完成的“图典深度标引”项目成果与国家文化大数据做好专网对接,协助大数据体系建设;另一方面图典数据库作为我们社的标杆性“文化数字化”产品,我们将持续增加资源数量和标深度,做好数据关联。同时做好资源产品化,实现文化消费,拓展使用范围,目前项目已经与深圳文交所、成都数字文交所进行了接洽,将于近期在相关平台开展商业运营,在保证社会效益优先的同时,努力达到两个效益相统一。

疫情条件下对各行业都提出了新的挑战,特别是对于出版这样的传统文化产业挑战更为明显,但从另外的角度,这也是加快数字化、加快融合发展转型的重要契机,我们更应该积极探索传统文化行业数字化转型发展之路。让文化不囿于书,不囿于室,给文化插上数字羽翼,推动传统文化业态在新时代的转型升级。我们愿意长期坚持、久久为功,在国家文化大数据体系总体规划下继续努力,为国家文化数字化战略做出新的贡献。


EN



■ 文章来源:国家图书馆出版社

编辑、监制 | 隋阳   审核 | 弘文


继续滑动看下一个
国家图书馆出版社
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存