走向科学数据开放共享 | 社会科学报
“开放为常态,不开放为例外”已成为公共资助形成的科学数据共享与利用的基本原则。为什么要实施科学数据开放共享?如何实施科学数据开放共享?国家社科基金优秀项目“开放科学环境下的科学数据开放共享机制与对策研究”(18ATQ007)指出,科学数据开放共享是开放科学时代的必然选择,我国需要建立健全科学数据开放共享机制。
原文 :《走向科学数据开放共享》
作者 | 上海大学文化遗产与信息管理学院教授 盛小平
图片 | 网络
科学数据开放共享是在互联网时代、共享经济时代、数字经济时代、大数据时代蓬勃发展起来的,得到了E-Science与科学2.0理论、数据经济理论、科学数据共享理论的支撑,出现在开放获取运动、开放数据运动、开放科学运动及科学研究范式向数据密集型科学(Data-intensive Science)转变的实践中。科学数据开放共享既是开放科学时代的迫切需求,也是我国发展数字经济的现实选择,对于推动实施国家大数据战略、实现数据驱动创新的科学研究范式转变和促进我国数字经济发展至关重要。
实现科学数据开放共享至关重要
实证研究证明,科学数据开放共享能够产生诸多正向利益,主要包括:一是政治与社会利益,如改进政府决策,提高政府科学管理水平,提高政府服务效率,提高公民满意度,有利于平等利用数据,建立公民对政府的信任,改进公民服务,创新公共服务,提高公共投资的社会效益等;二是经济利益,如有利于发挥科学数据的经济价值,有利于流程改进、产品创新、服务创新,有利于促进社会经济的可持续发展等;三是研究利益,如发挥科学数据的社会价值,提高数据资源的利用率,激励创新和增强科技创新能力,降低研究成本,减少重复研究,提高投资效益,降低伪造和不准确数据的发生率,提高科学研究效率,加强跨学科和跨机构研究,促进公民参与科学研究,促进知识转移,提高作者和研究机构的声誉,提高国家科技竞争力等。
然而,目前科学数据开放共享还面临许多障碍,这包括:一是法律与资金障碍,如亟需完善科学数据开放共享法律体系,存在科学数据开放共享的安全与隐私问题,缺乏足够的科学数据开放共享资金投入等;二是管理与实施障碍,如亟需有效的科学数据开放共享管理机制与协调机制,缺少科学数据开放共享政策、计划、指南、标准、途径与专业人才,以及共享数据的激励机制等;三是技术障碍,如亟需加强科学数据的完整性、准确性和及时性,存在科学数据格式不标准和数据软件不兼容问题,缺乏科学数据开放共享平台或系统与辅助工具等;四是认知障碍,如研究者或是担心科学数据被别人误解或误用,或是担心存在研究错误而受到批评,或是担心泄露数据中的隐私信息等;五是成本障碍,如搜集、提交和存储科学数据的时间成本与人力成本较高,提供、传递、维护和管理科学数据的时间成本与人力成本较高等;六是用户障碍,如数据用户缺乏数据获取能力、数据处理能力、合理利用科学数据的知识及创建和保存元数据的知识等。
建立健全科学数据开放共享机制
为充分发挥科学数据开放共享的正向利益,解决目前面临的许多问题,亟需建立健全科学数据开放共享机制,主要包括科学数据开放共享的动力机制、合作机制、治理机制与保障机制。
科学数据开放共享的动力机制需要解决不同利益相关者参与科学数据开放共享的动力、责任与作用等关键问题。科学数据开放共享涉及众多利益相关者,主要包括政府、研究人员、研究机构、研究资助机构、图书馆或档案馆、数据中心、出版商、专业协会或学会、用户、企业等。通过明确这些不同利益相关者在科学数据开放共享中的不同责任与作用及参与科学数据共享的动力,构建科学数据开放共享的动力机制。
科学数据开放共享的合作机制需要解决利益相关者如何开展科学数据开放共享合作或协作的问题。事实上,在开放科学领域,公众科学项目研究很好地体现了开放共享合作,它可以在全社会推广科学数据开放共享的理念,营造开放合作的氛围,不仅为科学数据开放共享合作提供平台与资源支撑,还为科学数据开放共享提供新的方式与途径。通过分析国内科学数据开放共享主题的作者合作关系,发现国内科学数据开放共享研究中的相关作者合作整体网络密度较低,分散性较强,连通性较弱,这意味着相关作者之间的科学数据共享和交流互动存在一定障碍。通过对Plos One施引文献网络特征的分析,发现开放共享合作成果数量、作者合作率与机构合作率均呈现逐年递增的发展态势。然而,无论在机构层面还是在作者层面,对现有开放研究数据的合作利用范围都较为局限。
科学数据开放共享的治理机制需要解决科学数据开放共享中的数据权利治理、数据质量治理、数据安全治理与数据隐私治理等核心问题。其中,数据权利治理重点解决科学数据开放共享中的数据权利确权、侵权与维权三方面问题,需要从法律、技术与管理三个维度构建科学数据开放共享数据权利治理框架与治理体系。数据质量治理重点解决科学数据开放共享中的数据正确性、完整性、及时性、可靠性、一致性、开放性、互操作性和可重用性问题,通过构建科学数据开放共享活动、科学数据质量问题、科学数据质量治理措施三位一体的科学数据开放共享数据质量治理模型,从政策法规、组织管理、技术与平台、利益相关者四个方面实施科学数据开放共享中的数据质量治理。数据安全治理重点解决科学数据开放共享中的数据机密性、完整性和可用性问题,通过构建数据安全需求、科学数据开放共享价值链、科学数据安全治理措施三位一体的科学数据开放共享数据安全治理模型,从法律、管理与技术三方面实施科学数据开放共享中的数据安全治理。数据隐私治理重点解决科学数据开放共享中的数据隐私和数据隐私权问题。关于数据隐私治理的21部国内法律法规(国家层次的)虽然确立了与数据隐私治理相关的权利、义务、责任,但是没有有效解决数据开放与个人隐私保护之间、公众知情权与个人隐私权之间、个人数据跨境传输与隐私保护之间的冲突问题,我国应该制定《隐私法》以建立健全我国数据隐私治理的法律体系,进一步完善《个人信息保护法》以完善我国数据隐私治理机制。
科学数据开放共享保障机制需要解决为科学数据开放共享活动提供相关支持和保障的各种要素及其相互关联与作用的问题。科学数据开放共享关键成功要素包括个人因素、制度因素、基础设施因素、数据因素、资金因素和组织因素,这六类要素构成了由微观层次、中观层次、宏观层次组成的科学数据开放共享保障机制。在微观层次,主要强调与机构数据开放共享相关的组织文化、机构对科学数据开放共享行为的激励、机构科学数据开放共享平台建设、数据处理与保护技术应用、机构数据管理政策及其相互关联和相互作用。在中观层次,主要强调区域或行业平台建设、区域或行业组织文化与组织激励、区域或行业数据管理政策法规及其相互关联和相互作用。在宏观层次,主要强调国家科学数据管理政策法规、国家级科学数据共享平台和国家科学数据中心及其作用。因此,可以从制度因素、组织因素、基础设施因素、数据因素、资金因素、个人因素六个方面采取相关措施来为科学数据开放共享提供不同维度的保障。
文章为社会科学报“思想工坊”融媒体原创出品,原载于社会科学报第1808期第5版,未经允许禁止转载,文中内容仅代表作者观点,不代表本报立场。
拓展阅读