当期荐读 2021年第4期|智慧图书馆数据标准体系研究
ISSN 1003-2797
CN 42-1085/G2
双月刊
同行评审期刊
卢小宾① 洪先锋①② 蒋玲③
①中国人民大学信息资源管理学院,北京,100872;
②中国人民大学图书馆,北京,100872;
③中国人民大学评价研究中心,北京,100872
目的/意义
对智慧图书馆建设中的数据标准体系展开讨论,以期从数据标准化的视角探讨智慧图书馆在经历概念辨析、体系构建、模式创新后的“智慧”落地问题。
研究设计/方法
以智慧图书馆视域下的数据标准体系为研究对象,结合大数据理论和数据生命周期理论提出智慧图书馆数据标准体系,并通过质性分析方法对标准体系框架搭建和内容建设展开讨论。
结论/发现
智慧图书馆数据标准体系建设的关键在于充分融合图书馆内的资源数据、管理数据和用户数据,围绕数据生命周期模型构建科学的体系框架,同时从组织性数据标准、管理性数据标准和使用性数据标准三个方面深化标准体系的内容建设。
创新/价值
从标准体系研究的视角,结合智慧图书馆大数据环境和数据生命周期模型,构建了智慧图书馆数据标准体系框架,就标准体系内容建设展开深入分析,相关结论能够为我国智慧图书馆数据标准体系建设提供参考。
关键词
智慧图书馆 数据体系
数据标准体系 大数据 数据生命周期
1
引言
智慧图书馆(Smart Library)最早于2003年由芬兰学者Aittola提出,最初是指一种在图书馆内不受空间制约且能够被感知的移动图书馆服务[1]。此后国内图书馆学界专家从不同研究视角给出了智慧图书馆的定义:严栋认为智慧图书馆就是通过新一代信息技术来改变用户和图书馆系统信息资源交互的方式,提高交互的明确性、灵活性和响应速度,从而实现智慧化服务和管理的创新模式[2];王世伟将智慧图书馆定义为具有“全面感知、立体互联、信息共享”特征的新型图书馆[3];初景利认为智慧图书馆应该是通过人机交互的耦合方式致力于实现知识服务的高级图书馆形态[4]。目前,智慧图书馆作为图书馆未来发展趋势和形态成为广泛共识,关于智慧图书馆理论与实践的研究已然成为图书情报领域的重点课题之一。其中,智慧图书馆建设标准能有效衔接智慧图书馆研究理论与建设实践,真正实现图书馆“智慧”的落地生根,开始得到越来越多研究者的重视和关注。
2
数据标准体系的内涵与功能
重视智慧图书馆标准体系建设是智慧图书馆从理论探讨走向实践应用的重要标志。智慧图书馆标准体系涵盖图书馆业务、数据、服务、技术和产品的建设、维护与管理,可以进一步细分为业务标准、数据标准、服务标准、技术标准等,共同为图书馆智慧化转型提供标准支撑[5]。数据标准体系针对图书馆内拥有或产生的数据进行操作层面的标准化定义,实现数据操作的有序性,从而指导智慧图书馆数据管理实践,不仅是智慧图书馆标准体系的重要组成部分,而且能够有效解决当前大数据环境下智慧图书馆所面临的数据治理难题,理顺“数据-信息-知识”的价值实现逻辑。如果说智慧图书馆的“智慧”之源是馆内的数据及对其开展的治理分析,那么数据标准体系建设就是图书馆智慧化转型建设的“快捷通道”。然而,当前关于智慧图书馆标准体系的探讨尚处于起步阶段,针对数据这个智慧图书馆核心要素的标准体系也未展开足够研究。因此,从数据标准规范体系建设的角度探讨智慧图书馆建设,进而在智慧图书馆建设理论与实践上给予针对性的指导,具有较强的理论和现实意义。
2.1 概念界定
在图书馆中,狭义上的数据标准一般指的是元数据标准,在传统图书馆领域内特指资源描述的相关标准或规范,如MARC(机读编目格式标准)、RDF(资源描述框架)、国家图书馆核心元数据标准等。而智慧图书馆语境下的数据标准则是广义上的数据标准,数据对象不仅是各类纸本、电子、网络资源,还包括图书馆各类基础设施数据、传感数据以及服务中产生的各种业务数据和读者使用数据;数据操作也不仅限于对数据进行描述、加工、交换,而且包含围绕数据生命周期开展的数据传输、数据存储、数据融合、数据保护、数据清档、数据再利用等操作。因此,广义上的数据标准体系是建立在智慧图书馆大数据和数据管理生命周期上的包含概念术语定义、格式编码、框架体系和操作规范等的标准化集合。
2.2 数据标准体系功能
在智慧图书馆视域下开展数据标准体系的探讨,至少在以下两个方面具有重要的现实意义:
(1)科学的数据标准体系可以帮助图书馆实施规范管理。图书馆实现智慧的基础是利用物联网、大数据、人工智能等新兴信息技术建立起来的泛在式的馆内数据感知体系和以服务为导向的数据管理体系。然而,大数据在给图书馆服务能力带来质的变化的同时,也给图书馆带来了巨大的挑战,一方面,数据量的指数增长和数据格式不断丰富,数据一致性问题、数据质量问题、数据融合与集成问题日益突出,要求图书馆对数据管理方式进行必要的更新与升级,建立涵盖海量多格式数据描述、采集、存储、分析等一系列过程的新标准,既是图书馆管理能力适应当前环境变化的必要途径,也是图书馆规范化管理的应有之举;另一方面,大数据所带来的“原生性”问题也日益凸显,如各系统间的“数据孤岛”问题、敏感或隐私数据采集分析的伦理问题等,这些方面目前尚缺乏完善的法律制度,需要将数据融合标准、隐私数据处理与保护规范等纳入数据标准体系中,以解决智慧图书馆在大数据时代所面临的新问题。
(2)科学的数据标准体系可以帮助图书馆实现数据增值。随着信息革命的深入推进,数据已经成为一种基础性战略资源。国际著名咨询公司麦肯锡曾在《大数据,是下一轮创新、竞争和生产力的前沿》的专题研究报告中提出,“海量数据的运用将成为未来竞争和增长的基础”[6]。近年来,“数据资产”也屡屡成为组织治理领域的热门话题。对图书馆而言,当前所拥有的数据沉睡在不同的系统和平台中,价值有待进一步的挖掘,如资源数据能够帮助研究人员随时获取所需要的知识,但当前资源数据海量有余而整合不足,用户获取知识却经常陷入知识迷宫中;科学研究数据能够成为“第四范式”下的研究要素,能够有效提高科研效率,但当前科学研究数据管理仍缺乏科学有效的指导而妨碍了科学数据的交换与共享;读者行为数据是研究用户以及开展“以用户为中心”服务的基础要素,但当前读者行为数据分布分散。因此,只有依托科学的数据标准体系,才能行之有效地对智慧图书馆内蕴含的数据宝藏进行充分挖掘,才能真正实现数据增值。
3
研究现状分析
智慧图书馆数据标准体系研究是伴随着数字图书馆、数据治理、智慧城市、智慧图书馆等研究逐渐深入而开展的,经历了从认识数据价值到开展数据治理、从探讨标准规范到注重体系协同的发展历程,构成了智慧图书馆数据标准化体系探索的思想沿革与研究脉络。
从以“数据资产”“数据驱动”为代表的数据价值研究转向要素独立的数据管理与治理研究。智慧图书馆概念提出以来,专家学者开始从多方面探讨智慧图书馆的建设问题,起初因更多关注技术应用和跨系统互联操作,常陷入“智慧还是智能”的争议和讨论中。随着大数据和人工智能时代的到来,数据所能产生的价值被更多关注,研究人员开始聚焦图书馆大数据的智慧表达与价值实现,如樊伟红等人[7]提出大数据可以帮助图书馆建立各类知识服务及业务建设的风险模型、开展图书馆用户流失分析及价值分析、帮助图书馆建立新型知识服务引擎等;吴敏慧[8]提出大数据应用将成为图书馆服务创新的重要依托,并提出图书馆在大数据时代利用大数据做好信息服务的5点对策;李艳等人[9]提出基于“大数据+微服务”的模式能够对图书馆个性化服务提供技术支撑,同时为科学决策提供充足依据;徐潇洁等人[10]探讨了未来图书馆基于数据驱动建立以“知识管理”“智慧空间”和“智慧管理”为核心,以智慧服务为目的的智慧图书馆服务框架。然而,在价值认同转向价值实现的过程中,研究人员发现比大数据高效利用先到来的是大数据混乱,除传统资源描述数据仍保持较高的规范水准外,图书馆内其他数据多源异构、体系混乱、数据孤岛、标准不一的问题层出不穷,因此治理思想开始正式进入智慧图书馆数据相关研究中。如顾立平[11]基于数据驱动新科学生产方式的背景提出图书馆应当从数据获取治理、数据共享治理、数据重用治理、数据加值治理4个方面对科学数据开展治理活动,并称数据治理是科学研究范式变迁下图书馆事业新的发展机遇;包冬梅等人[12]提出高校图书馆是以数据为核心业务的知识服务机构,应当以数据治理思想带动服务创新和价值创造,并参考国际权威机构数据治理框架提出高校图书馆数据治理框架(CALib框架);刘洁璇[13]认为数据治理能够保证图书馆数据的有效性、可访问性、高质量及安全性,方便读者获取利用,实现知识资源合理布局,并提出未来图书馆数据治理的发展趋势。图书馆中数据管理与治理思想的形成,为数据标准化实践提供了基础,进而催生了数据标准体系的构建。
从面向图书馆特定业务的标准内容探讨转向图书馆整体智慧语境下的标准体系研究。随着智慧图书馆概念、框架、服务模式等愈加成熟,智慧图书馆建设中面向特定业务或实现单一功能的标准规范探讨开始得到业内专家学者的重视。在隐私保护与利用等数据伦理方面,陆康等人[14]提出智慧图书馆应当从制度层、技术层、主体层三个方面构建数据伦理规范体系,从而保障数据隐私、数据共享等问题的有效解决;在研究数据分享与发现方面,朱玲[15]深入分析了八种元数据标准的内容特征,总结了研究数据元数据标准在未来的发展趋势。随后,智慧图书馆研究领域的专家从更为宏观的层面思考标准体系的协同,进而实现整体层面的智慧。如卢小宾等人[16]从智慧图书馆建设标准的采选出发,提出智慧图书馆应建立包含资源建设、用户服务、信息技术的标准体系,并在智慧图书馆建设标准采选和制定上提出建议;刘炜等人[17]在智慧图书馆标准体系框架中提出数据规范应包括数据接口规范、数据质量控制、关联数据发布、数据挖掘规范和可视化规范。
目前,有关智慧图书馆标准规范的研究尚处于起步阶段,至于数据标准体系方面,则缺乏深入的系统性研究,仅在智慧图书馆标准体系中关注数据标准或根据概念列出数据标准框架,并未从智慧图书馆数据本体出发,结合数据流和数据操作,系统探究数据标准体系框架构建及内容制定等问题。因此,目前所形成的数据标准研究成果无法在智慧图书馆整体建设上予以有效指导。数据生命周期作为数据治理在数据层的重要模型基础,系统关注组织内各类数据的“产生、传播、使用、维护、归档/删除”过程,能够对数据本体及数据操作进行全景呈现,与智慧图书馆数据标准体系的研究需求逻辑相匹配,能够有效弥补当前相关研究存在的系统性问题。鉴于此,基于生命周期理论构建数据标准体系,进而为智慧图书馆建设中面向数据要素的治理提供指导,具有一定的必要性和科学性。
4
数据标准体系框架构建
阮冈纳赞[18]在“图书馆学五定律”中将图书馆表述为“一个不断生长着的有机体”。在智慧图书馆建设中,数据就是这个有机体的“血液”,科学的数据标准体系能够保障这个有机体发挥更大的生命力,而基于智慧图书馆数据体系和数据生命周期所构建的数据标准体系框架则是实现体系整体建设的逻辑基础,具有重要的理论指导价值。
4.1 智慧图书馆数据体系
智慧图书馆中究竟包含哪些数据,数据都有哪些特点要求?这是智慧图书馆数据标准研究中的基础问题。传统图书馆中的数据通常指以不同载体形态存在的资源数据、资源描述数据以及用户服务中的用户数据和服务数据等。这些数据虽然也已存于不同的管理系统中,但形式各异、标准不一、缺乏联动,仅能在单一业务层面支持图书馆管理与服务,无法充分实现数据价值,而根据智慧图书馆的概念和建设内涵,需要进一步明晰智慧图书馆语境下馆内数据的类型、特点以及与之相关的智慧图书馆建设内容,即不仅需要在资源数据中新增诸如新媒体资源数据、科学数据以及数据集新型资源数据,在管理数据、用户数据等方面新增诸如空间数据、行业监测数据等重要相关数据,而且需要充分梳理辨析各类数据在智慧图书馆建设中所扮演的角色,以馆内“全数据”为对象,在数据整体层面思考涵盖智慧图书馆活动全方位、立体化的综合数据体系(如表1所示)。
4.2 数据生命周期管理
根据DCC(Digital Curation Center)模型[19]、DataONE(DataONE Date Lifecycle)模型[20]等成熟模型和储节旺[21]、王芳等[22]学者关于数据生命周期的相关研究,结合智慧图书馆数据类型和特点,研究提出智慧图书馆中数据生命周期管理应当包含数据产生与采集-数据编码-数据存储-数据服务-数据分析挖掘-数据再利用六个阶段(如表2所示)。需要说明的是,本表仅列举图书馆中关注度较高的数据对象作为示例,并未穷尽数据生命周期各阶段所包含的所有图书馆数据。
4.3 数据标准体系框架构建
数据生命周期管理定义了数据在智慧图书馆内从产生到再利用各个阶段的任务目标和具体活动,研究基于数据生命周期建立智慧图书馆数据标准体系(如图1所示),并制定不同阶段所对应的数据相关操作标准,将为智慧图书馆数据规范化管理和利用提供有效指导。
数据产生与采集阶段对应着智慧图书馆内各类数据的产生和收集,大致有以下两种方式:一种是在图书馆外部产生,图书馆以购买、租用、征集和接入访问等方式将数据纳入可供管理服务的数据体系中,如资源数据、用户自然数据等;另一种是在图书馆内部产生,图书馆通过人工或系统记录,将数据纳入数据体系,如业务数据、服务数据等。作为数据生命周期管理的起点,该阶段需要在三个层面开展标准规范治理:其一是建立智慧图书馆领域知识模型以及术语表,厘清数据标准体系内的逻辑关联;其二是建立数据筛选与采集标准,明确智慧图书馆数据采集需要遵循的基本原则,即哪些数据是需要采集的、采集的周期和频率如何确定等;其三是针对数据自动采集制定的数据接口规范。
数据编码阶段指的是对采集到的数据进行统一编码处理,不仅包括图书馆传统意义上对资源进行标准化描述著录,进而开展资源管理、信息检索和知识发现等活动,而且包含对其他数据类型进行统一化标引,为实现数据融合、数据共享和数据互操作提供底层支持。因此,该阶段需要制定的标准主要包括各类资源元数据描述规范(如RDF、OWL等)以及数据互操作规范。
数据存储阶段的主要目标是将经过规范处理后的数据保存在图书馆存储设备中。在智慧图书馆语境下,该阶段主要解决两大核心问题:一是利用云存储、分布式存储技术实现硬件存储资源虚拟化,使按需存取、弹性调度成为可能,从而显著提高存储效率;二是通过数据加密、数据备份等方式解决数据安全问题。从标准规范的角度而言,包括存储技术规范和存储管理规范,如数据分级存储规范、数据长期保存标准、数据中心存储灾备指导以及应急准备响应预案等。
数据服务阶段将数据通过某种途径提供给相关主体,如向用户提供各类资源获取访问、向机构提供竞争情报或科学研究方面的支撑数据等。这一阶段尚未对数据进行深层次的加工,更关注数据的全面准确和可用性,因而涉及数据开放、数据共享和数据发布的标准,以及因此产生的数据引用、数据权保护和隐私保护相关的规范。
数据分析挖掘阶段指采用统计分析、数据挖掘、机器学习等方法,面向智慧管理和智慧服务,对馆内数据进行深层次的分析挖掘。这个阶段需要建立有关大数据分析的应用指导,如分析模型、分析算法、分析流程和分析工具的参考文档,从而有效指导将数据转化为知识和智慧的实践。
数据再利用阶段是智慧图书馆区别于传统图书馆数据管理的重要环节。智慧图书馆对原始数据进行编码、组织、分析等操作后,形成的数据产品将成为新的“数据源”,可以进入下一个生命周期中。尤其是在以数据驱动的科学研究中,研究将直接基于对已有数据的整合、加工所形成的数据基础。在这个过程中,智慧图书馆需要建立数据价值评估体系对数据的价值做出鉴定。
5
数据标准体系内容建设
相关标准是数据标准体系的内容,也是数据标准体系建设的重中之重。根据智慧图书馆数据生命周期管理中对数据的操作类型,数据标准可以分为组织性数据标准、管理性数据标准和使用性数据标准三类,因此笔者拟通过分析这三类标准内容的建设情况,提出我国智慧图书馆数据标准体系内容建设时应采取的策略,为我国智慧图书馆建设提供建议和参考。
5.1 组织性数据标准
组织性数据标准主要指的是数据描述、数据编码中的标准,在智慧图书馆数据生命周期管理的数据编码阶段,起到规范数据表达的作用。根据智慧图书馆内数据类型的不同,又可以进一步细化为数字资源描述标准和通用数据编码标准。
在数字资源描述标准上,图书馆经过多年工作实践,尤其数字图书馆的蓬勃发展,已经形成了相对成熟严密的标准体系,按标准内容可以分为专门资源描述标准与规范、专门数字对象描述规范、基本元数据标准规范等。近年来,国内外相关组织及机构都归口制定了不少资源描述标准,部分标准示例如表3所示。这些描述规则满足了当前图书馆内各类资源的数字化表示需要,也为资源组织和检索发现提供了基础保障。近年来,随着人工智能技术的发展,开始出现基于语义网的“资源知识化描述规则”研究[23-24],这类标准面向知识融合与知识发现,是未来资源描述标准的研究方向。
在通用数据编码标准上,相关标准规范常见于通用数据规范性表达和融合交换领域,如《数据分类指南》[25]提供了在大数据分类过程及分类视角、分类维度和分类方法等方面的建议和指导;《非结构化数据表示规范(GB/T 32909)》[26]规定了文本、音频、视频、图像等非结构化数据的统一数据表示,为非结构化数据在平台系统中的编码表示提供可参考的规范;《智慧城市数据融合第2部分:数据编码规范》[27]针对规范智慧城市数据融合过程中不同来源的数据标识符处理,提出具备唯一标识特征的“智慧城市数据标识符”。智慧图书馆中通用性数据编码标准应当基于信息技术的一般性规范,参考智慧城市在数据融合、领域数据集表示方面的经验做法,结合智慧图书馆内的大数据体系框架,开展本地化编制。
综上,在组织性数据标准建设上,必须关注新型数据、应用创新技术、借鉴先行经验。一方面,应充分发挥在资源描述上的丰富经验和在知识组织上的学科优势,对所有纳入图书馆知识服务的资源数据重新展开研究思考,不断更新资源描述规则,以有效衔接当前数字化、网络化知识服务的新需求,尤其是新技术引领下对新资源类型的描述规则,如多媒体资源描述、面向知识融合的语义化描述规则等,需要各级各类标准编制机构及时关注、充分合作,在标准化描述与组织层面进行补充;另一方面,尤其需要持续关注并引入计算机科学、数据科学等对通用数据描述上的研究进展,以及智慧地球、智慧城市等对通用数据应用上的先行经验,编制智慧图书馆内通用数据操作的相关标准,如智慧图书馆数据编码规范、智慧图书馆标识符集等文档,补齐当前图书馆系统之间缺乏联动、数据之间缺乏关联的短板,使数据能够在不同生命周期阶段中充分流动以实现价值。
5.2 管理性数据标准
管理性数据标准是规范数据管理活动的重要准则,衔接数据生命周期中数据产生和数据分析、再利用阶段,这类数据标准的编制主体较为多元,针对的数据生命周期阶段和数据操作也不尽相同,包括数据筛选标准、数据存储标准、数据质量管理标准、数据评估标准等。
数据筛选标准在智慧图书馆数据采集阶段判断哪些数据需要收集,因为并非所有在智慧图书馆运行中产生的数据都有价值,也并非所有的数据都可以随意收集处理,如用户个人数据,在《中华人民共和国个人信息保护法》中对获取、处理个人信息做了明确规定,如处理个人信息需满足的前提条件和需履行的告知义务,尤其是敏感个人信息,必须经个人单独同意、书面同意甚至行政许可[28]。美国50个州和1个特区的图书馆在图书馆立法或州立法中采取不同方式对用户隐私数据获取与使用加以规范[29]。在数据筛选标准上,《智慧城市数据融合第5部分:市政基础设施数据元素(GB/T 36625.5-2019)》中对智慧城市系统中采集的市政基础设施数据规定了筛选标准,规定将满足智慧管理需要、智慧应用扩展和数据汇聚融合三个特征的数据纳入智慧城市数据中[30]。
数据存储标准主要解决智慧图书馆在扩展数据源后形成的有别于传统本地存储策略的数据安全保存问题,尤其是面临数据指数增长带来存储设备投入激增、边缘计算架构下新型分布式存储模式和数据安全问题频发的三重挑战时,更需要在智慧图书馆构建中思考数据的存储以及标准化问题。当然,这一部分的标准主要由相关信息技术协会拟定,智慧图书馆采选适用于馆内数据容量及特点,系统架构和存储模式的数据存储标准。这方面已有的成熟标准较多,关于云存储标准和国家标准也在积极研究制定中。2015年,电子科技大学承担的“面向海量数据云存储标准体系建设”项目通过验收,标志着我国首个系统完善的云存储标准体系诞生,形成了《基于块设备的私有云存储系统词汇》《基于块设备的私有云存储系统业务流程》等13项地方标准[31];全国信息技术标准化技术委员会也在推动《数据存储与容灾备份设备国家标准》及《标准化白皮书》的编制[32]。
数据质量管理也是数据管理中的重要环节,相关标准能够有效避免智慧图书馆内数据不准确、不一致、不完整、不规范、时效性差、可用性低等问题,对智慧图书馆内数据质量控制具有显著意义。标准可分为通用数据质量标准和专业领域数据质量标准。在通用数据质量标准方面,应当遵循信息技术机构对数据质量标准的定义规则(如表4所示)。在专业领域数据质量标准上,需要围绕智慧图书馆内的数据类型和特点,制定智慧图书馆领域的数据质量标准,这方面可参考中国林业科学研究院针对林业领域制定的《林业专题空间数据质量控制标准》[33]、公安部针对公安系统信息化制定的《公安信息化数据质量管理规范》[34]等,通过对本专业领域内数据质量要素的分析提出具体的质量规范。
数据评估标准可对智慧图书馆内数据价值开展客观科学的评估,指导数据再利用活动开展,实现馆内数据资产化管理。数据价值评估当前尚无成熟标准,但学界已经对政府数据、科学数据、社会数据以及图书馆内数据价值开展了深入的研究(如表5所示),提出了数据的价值构成、价值鉴定与评估模型等。
管理性数据标准是智慧图书馆内数据质量的重要保证,但长期以来却始终被图书馆界所忽视,不仅智慧图书馆研究中鲜有针对性的研究成果,而且在智慧图书馆建设实践中缺乏自主性思考,常被各类图书馆管理系统的数据管理逻辑和方法主导,最终导致图书馆内数据价值转化率长期偏低。通过分析智慧图书馆中各类管理性数据标准的内涵和在其他专业、领域内的标准内容,我们认为智慧图书馆建设必须在数据整体价值实现的逻辑基础上,认真思考数据生命周期各阶段对数据的不同操作需要遵循的原则和标准,充分借鉴其他领域关于数据管理标准的研究,坚持适当引进和本地化编制相结合,如引入、编制智慧图书馆数据采集和筛选标准、存储标准、质量管理标准和评价标准等,不断丰富完善以形成智慧图书馆建设领域内的管理性数据标准体系。
5.3 使用性数据标准
使用性数据标准是对数据使用行为的规范,根据数据生命周期可分为数据共享标准和数据分析标准。
图书馆内数据共享标准可以从三个层面制定:一是馆内数据跨系统、跨流程共享。以智慧图书馆平台内数据共享规范为主,主要表现形式为数据访问权限控制。二是馆际或与其他机构的统计数据共享。该类标准主要由图书馆行业主管部门或行业协会根据图书馆事业统计需求制定,包含统计项、统计指标等,国际标准化组织信息与文献标准化技术委员会(ISO/TC46)下设统计与绩效评估分委会(SC8),制定了关于图书馆数据统计的相关标准11项[44],国内通常以图书馆事实数据库的形式开展馆际数据共享。三是面向社会提供的知识数据共享。以科学数据共享为例,已形成了宏观引导和微观指导相结合的相对完整的指标体系,如2018年国务院印发的《科学数据管理办法》[45]中提出“政府预算资金资助形成的科学数据应当按照开放为常态、不开放为例外的原则,由主管部门组织编制科学数据资源目录,有关目录和数据应及时接入国家数据共享交换平台,面向社会和相关部门开放共享”;《信息技术科学数据引用(GB/T 35297-2017)》从引用规范上对科学数据的共享行为进行标准化要求。
图书馆内数据分析标准主要针对馆内开展大数据分析时的分析模型使用、算法应用方面以及解决“算法黑箱、数据伦理、歧视偏见、隐私自由”等问题的相关指导。一方面,图书馆需要根据需求编制“图书馆大数据分析挖掘指南”,对各类数据分析、内容挖掘提供模型、流程和工具的参考文档;另一方面,图书馆需要根据对数据隐私政策、人工智能算法的理解和掌握,将对以上问题形成的解决方案体现在图书馆员行为规范中。
6
结语
当前,在经历了数字图书馆、智能图书馆的发展沉淀,移动互联网、大数据、云计算、人工智能的技术洗礼后,图书馆已经处在新的发展阶段,面临前所未有的发展机遇。智慧图书馆是什么的问题已得到初步解答,接下来更重要的问题是智慧图书馆如何实现、如何落地。智慧图书馆数据标准的研究与实践是回答这个问题的关键,应当在准确把握图书馆大数据特点的基础上,结合数据生命周期管理理论,构建符合智慧图书馆建设需求的数据标准体系,涵盖数据流在图书馆管理生命周期中的各个阶段,并参考借鉴现有的国际、国家及行业标准,着手制定智慧图书馆数据标准,助力我国智慧图书馆的建设与发展。
作者贡献说明
卢小宾:提出研究思路,设计研究方案,论文撰写、修订与定稿;
洪先锋:确定研究框架和研究提纲,开展网络调研、内容分析,撰写论文;
蒋 玲:标准文本内容分析。
参考文献
*本文原载于《图书情报知识》2021年第4期50-61页
版权归《图书情报知识》所有,欢迎转发到朋友圈,转载请联系后台。
制版编辑 | 卢慧质
--END--
当期荐读 2021年第2期 | 未成年人阅读素养培育模式研究——以芬兰“快乐阅读项目”为例
当期荐读 2021年第2期 | 芬兰阅读服务专业人才培养的特色与启示
当期荐读 2021年第2期|播客:阅读推广的芬兰经验
当期荐读 2021年第2期 | 事件视角的图书馆发展风险研究(内含视频摘要)
当期荐读 2021年第1期 | 统筹压力与数据驱动能力下省级政府互联网服务能力均衡化研究