弘文十年 | 数字出版十年回顾
数字出版十年回顾
文 / 王涛
21世纪的前10年间,在经历了21世纪之初的互联网泡沫之后,互联网由虚转实,互联网经济蓬勃发展,方兴未艾。彼时依靠图书起家的亚马逊迅速成长为互联网庞然巨物,在令传统出版业的同仁们咋舌的同时也点燃了出版人的热情——出版的时代已经开始变了。无数的出版人为即将到来的新时代激情澎湃,要在新的数字领域开疆辟土,数字出版理所当然地成为选择,一时间纸质出版将死言论此起彼伏。亚马逊将其第一款阅读器命名为kindle,寓意着它是一个火种,如同火带给人类新的文明一般,它将改变人类文明的发展历程。当时数字出版的热烈气氛或多或少地影响到了所有人,不管是自觉或不自觉。
2012年,国图社作为一个深耕古籍影印事业的专业出版社,在整个环境的影响下,对于数字出版也开始从关注到主动尝试。2012年国图社数字出版部正式成立,但当时数字出版部尚未独立,而是由营销部加挂数字出版部的牌子,工作人员也是由营销部人员兼任,人员仅有4人,当时数字出版部的主要工作是探索数字出版,在此期间数字出版部也以数字出版的形式成功地申报了文化产业发展专项资金项目——珍贵古籍资源应用平台。文化产业发展专项申报的成功,对于数字出版部今后的发展意义重大,这笔资金有效地缓解了出版社发展数字出版的经济压力,也是因为这笔资金,给了出版社发展数字出版的新思路,让出版社可以投入更多的人力和物力进行试错。文化产业发展专项资金在整个出版业的数字转型中发挥了巨大的作用,很多的项目和人才都是在当时发展起来的,为今天的数字出版打下了基础。在此期间,数字部还成功地申请到了科技部科技支撑计划的子课题,这也是出版社第一次承担科技部的项目。除此之外,数字出版部还第一次完成了资源数字化;第一次进行了数字版权的交易;第一次进行数字资源的销售。这些工作成绩,也增强了社领导对于数字出版的信心,从而决定将数字出版部独立。
2013年数字出版部从营销部独立,并从图书馆学编辑室和古籍编辑室抽调两名编辑,加上原有的两名营销部人员成立了新的部门。成立之初,可以说是一张白纸,所有人员都没有数字出版的工作经历,一切都是摸着石头过河。数字部成立之初,给数字部定下的发展方向是数据库,原因很简单,国图社的优势是历史资源,而就出版图书的品种是弱项,加之出版的主要方向是专业出版,大众类的图书基本没有任何优势。当时杭州国家数字出版产业基地刚刚成立,依托手机的电子书风头正劲,据说具有资源优势的出版社光版权费就可以收入几百上千万,当时我们也是非常羡慕,但因受限于资源,只能将数据库作为了发展方向。十年之后,我们为当时的选择感到庆幸,因为从10年的发展来看,依靠电子书尚不足以支撑起国图社的数字出版。我们曾经将几十种图书的电子版权销售给几家单位,其销售收入最终连投入的成本都没有收回。
2014—2015年,社里为了培养数字出版人才,参加了新闻出版研究院组织的数字人才培养班,组织人员远赴美国参加数字出版的学习,短短的两个星期,确实让数字出版的眼界打开,对于数字出版的信息也是在那个时期开始建立的。而2014年起,数字出版部开展了连续8年的项目申报工作,主要是文化产业发展专项和国有资本金项目,总共获批财政部8个项目,累计申报资金超过8000万元。此外,数字出版还参与科技部科技支撑计划子课题一个,文化部科技创新项目一个,文化部文化科技支撑计划一项,同时还获得北京市各类项目6个。其中还获得了文化产业专项奖励一项和北京市专项奖励一项。当然如此众多项目的获批,并不是因为国图社的数字出版工作做的多么好,最核心的因素是因为国图社可依靠国家图书馆乃至全国图书馆界的丰富馆藏,这是最好的文献资源宝库。
项目申报是国图社数字出版的重要工作,但是对数字出版的考核是按照绩效来考核的,从2013年起,数字出版部边完成申报项目的建设,边开展面向市场的数据库建设。2014年开始建设数字出版部第一个数据库产品《中华再造善本数据库》,利用国图社最重要的图书《中华再造善本》,进行了数字化并按照数字产品使用的需要增加了印章检索等功能,借助《中华再造善本》的品牌,市场销售情况不错。
在推出《中华再造善本数据库》的第二年,经过社里的多方论证,鉴于当时古籍全文化的高昂成本和爱如生等一系列民营古籍数据库已经占据了大部分市场,决定将当时尚没有充分开发的民国图书资源作为今后发展的重点。于是从2015年起,策划利用5年的时间,建设《民国图书数据库》,计划收书30万种。即使在今天看来,建设这样一个大型数据库的难度也非常之高,但是当时出于无知者无畏,数字出版部一头扎进了《民国图书数据库》的建设当中。
数据库的建设和图书编辑的最大区别时处理文献的数量,当处理文献的数量以百倍千倍的程度增加的时候,原有的文献处理方式根本无法适应,例如书目查重,每次的查重都要将数以万计的图书从我们已经有的十几万册图书中区分出来是否已经购买,而且书名还会因为各种原因不能一一匹配,手工查找是不现实的,最初采用excel进行匹配因为数量过于巨大而导致崩溃,查重仅仅是一个小的环节,而后面还有检查、修图、入库等一系更加复杂工作。2015年,数字部在一个专业技术人员都没有的情况下,完成了1500万页民国图书图片的加工,这主要来自两方面:一方面是从工作中学习,也是在此期间学习了编程和网站开发;另一方面是全体同事的努力,加班加点,这也成了数字出版部的一个传统,在此也感谢所有数字出版部现在和曾经的同事的付出。《民国图书数据库》的建设的难点在于全,除了数字部努力寻找资源以外,社领导也为获取资源做了很多工作,此外民国编辑室也提供了很多的帮助,为我们获取资源提供了很多的线索。通过7年的努力,我们的民国图书已经收录近23万种图书,同时在文献处理方面建立了一系列的工具库,为之后加工数字资源提供了基础。
《民国图书数据库》在建设走向正轨之后,后续的产品开发摆上了议题,当时经过多方论证,我们继续沿着民国文献开发的方向,推出了《民国报纸数据库》,它是继《民国图书数据库》之后的又一个主力产品。《民国报纸数据库》吸收了前期开发的经验和教训,在文献的深度加工上下了功夫,结合了报纸和使用者的需要,推出后获得了好评。
2021年《民国报纸数据库》入选国家新闻出版署数字出版精品遴选计划,这也是对数字出版多年工作的一个肯定。《民国报纸数据库》目前完成了六期建设,2022年底建设完七期,将收录民国报纸超过500种。此外还建设了《民国期刊数据库》,这样就将当年最初规划的“中国历史文献总库”的主体搭建出来。
2019年,正值国图110周年,习总书记在给国图老专家回信中强调要坚持正确政治方向,弘扬优秀传统文化。为落实回信精神,我们将建设《中国历史文献总库》平台项目,将以往的各个时代、各种类型的历史文献整合到一个统一平台,今后用户可以更加方便全面的获取历史文献。
2020年,数字出版也迎来了一个新的机遇——国家文化大数据建设,以古籍图典素材作为切入点,对中国传统文化中的图案进行深度标引,建设中华传统文化素材库,2021年加入深圳文化产权交易所的国家文化大数据首批参与名单当中,成为第一批国家文化大数据体系的探路者。
经过10年的发展,数字出版部由原来只有4人的小部门发展为今天的13人,数据库产品从0增加到11个,回款数量从最初的40万增加到近2000万,这是多年来数字出版部不断辛勤努力的结果,也是国图出版社积极开拓创新的成果。
当然,数字出版的理想不仅也不能满足现状,未来我们将要搭建的一个涵盖能够涵盖所有历史文献的元宇宙,在这个“宇宙”,每一个历史文献通过各种关系相互交织,这是一个令人激动的宏大的目标。国图社数字出版发起于青萍之末,但只要奋勇向前,不负韶光,终将有一日会翱翔于激水之上。期待国图社数字出版的下一个10年。
弘文
『相关阅读』
弘文十年 | 一位国际友人与《永乐大典》的不解之缘——记英国牛津大学博德利图书馆何大伟先生
弘文十年 | 赓续传统文化 展现时代内涵——《中华传统文化百部经典》完成六十种出版
建设国家文化大数据体系项目《中国古籍图典数据库》的思考和探索
■ 文章来源:国家图书馆出版社数字出版部
数据库购买请联系发行部:010-88003146