查看原文
其他

当期荐读 2021年第6期 | 面向科研诚信的科研数据管理保存:逻辑关联、作用机制与实现策略(内含视频摘要)

邢文明 陈继丽等 图书情报知识 2023-08-28

     ISSN 1003-2797

     CN 42-1085/G2

     双月刊

     同行评审期刊



邢文明  陈继丽  王张华

 (湘潭大学公共管理学院,湘潭,411105)


目的/意义

从科研诚信角度出发,探讨科研数据管理保存对于推进科研诚信建设的作用,以期促进我国的科研诚信建设。

研究设计/方法

基于文献综述和逻辑推演,对问题进行剖析。

结论/发现

论述了科研数据的管理保存与科研诚信的逻辑关联及其作用机制,并提出加强科研数据的管理保存以推进科研诚信建设的建议。

创新/价值

为相关部门通过科研数据管理保存来推进科研诚信建设提供参考依据。

关键词

科研数据 科研诚信 科研数据管理保存 

科研行为规范



科研诚信是科技创新的基石,是实施创新驱动发展战略、建设创新型国家和世界科技强国的重要基础,决定着国家和民族的未来。同时,科研诚信也是我国社会信用体系建设的重要内容之一,对于增强社会公众的诚信意识,营造优良信用环境,加强和创新社会治理方式,提升国家整体竞争力,促进社会发展与文明进步都具有重要意义。近年来,我国科研诚信建设在工作机制、制度规范、教育引导、监督惩戒等方面取得了显著成效,但整体上仍存在一些短板和薄弱环节,学术不端、浮夸浮躁、急功近利等不良倾向依然存在,违背科研诚信要求的行为也时有发生,亟待进一步加强科研诚信建设,以加速我国的科技创新和知识发现。科研诚信建设的核心是制度化,而制度的有效发挥离不开相关机制的支撑。随着数据密集型研究范式的快速发展[1],科学研究越来越多地建立在科研数据的收集、整理、处理、分析的基础上。科研数据既是科学研究的基础,又在科研过程中被分析利用,成为科研生命周期中重要的过程性和阶段性资料,贯穿于科研发现的整个过程,因而也可作为记录科研过程的一种重要的原始资料,用于后续验证科研结果,追溯和还原科研过程。因此,对科研过程中收集和处理的不同阶段的科研数据资料进行管理,不仅有助于将来的再利用,也有助于加强和完善科研过程管理,规范科研行为,防范和减少科研不端行为,推进科研诚信建设。基于此,本文认为,科研数据管理保存是加强科研过程管理,规范科研行为,保障科研诚信的重要制度基石。


1 科研数据管理保存与科研诚信的逻辑关联

1.1

科研数据管理:两种不同视角

科研数据管理是指在科学数据生命周期内对科研数据持续进行的组织和管理活动,它涉及研究项目生命周期内研究数据的日常管理,以及在项目完成后如何保存和共享研究数据(如将数据存放在存储库中以便长期存档和访问)等内容[2]。对于科研数据管理的兴起和发展,国内外主要有两种视点:


(1)促进科研数据共享/再利用。随着科研信息化的快速发展和大数据时代的到来,数据在科学研究过程中扮演着越来越重要的角色:它既是科学研究的基础,也是一种重要的科研产出。通过对科研过程中产生的数据和相关资料进行管理,有助于促进其共享与再利用,从整体上降低科研成本,提升科研效益,提高科研创新的效率。如世界经合组织(OECD)发布的《公共资助的科研数据开放存取宣言》(Declaration on Access to Research Data from Public Funding)指出:科研数据的开放获取和无障碍利用将极大地促进科研发展与创新,并有助于促使由公共投资产生的数据的价值最大化[3]。英国研究理事会(Research Council UK,RCUK)制定的《关于数据政策的共同原则》(RCUK Common Principles on Data Policy)指出:由政府资助产生的科研数据是一种公共财富,是为了公众利益而产生的,应确保在不违背知识产权的前提下,以最少限制、及时和负责任的方式提供公开获取[4]


(2)推进科研行为规范与诚信建设。随着大数据时代的到来和数据密集型科研范式的发展,数据逐渐渗透到科学研究的每一个环节,成为贯穿科学研究全过程的“线索”。英国数据存档中心(UK Data Archive)提出的“科研数据生命周期模型”(如图1所示)很好地说明了这一点。在此背景下,各国科研管理部门纷纷将科研数据管理作为规范科研过程和科研人员行为,提高科研工作的规范性与透明性,保障科研工作质量的重要措施纳入相关政策。如澳大利亚研究委员会发布的《澳大利亚负责任研究行为准则》(Australian Code for the Responsible Conduct of Research)指出:妥善管理和保存科研数据是负责任研究行为的重要内容[5]。欧洲科学院联盟于2017年公布的最新《欧洲科研诚信行为准则》(European Code of Conduct for Research Integrity)指出,科研人员、研究机构和组织应确保对所有数据和研究材料(包括未发表的材料)进行恰当的管理,并在合理的时间内进行安全保存[6]


由此可见,科研数据管理有着多方面的价值与目标:一方面有助于数据的共享/再利用,从而提升科研透明度,进而增加科研不端行为被发现的机会;另一方面,科研数据管理有助于促进科研行为规范,提升科研工作的规范性,从而减少和避免科研不端行为,这些都为科研诚信建设奠定了良好基础。


1.2

科研数据保存:推进科研诚信与科研

不端行为治理的重要措施

如果缺乏充分的事实依据和证据支持,科研管理部门很难对科研不端行为进行认定和处理。同样,当科研人员受到科研不端的质疑和指控时,如果缺少充足的证据证明自己的“清白”,也会百口莫辩。借鉴法学的证据留存思想和档案学的原始记录理论,人们逐渐认识到:保存科研过程的原始记录对于处理科研不端行为和推进科研诚信建设具有重要的意义。随着数据密集型科研范式的到来,科研数据在科研过程中扮演着越来越重要甚至是关键核心的角色,通过保存以科研数据为核心的原始科研过程资料和相关记录,有助于为处理科研不端行为提供证据支撑。因而,为了更好地预防和治理科研不端行为,越来越多的科研管理部门要求科研人员在研究项目(或论文)结束时对研究过程中产生和处理的科研数据进行妥善保管或提交到指定地方加以保存,以便将来需要时进行查验。如加拿大三大联邦科研资助机构——加拿大卫生研究院(CIHR)、自然科学与工程研究理事会(NSERC)及社会科学与人文科学研究理事会(SSHRC)联合发布的《三机构框架:负责任的研究行为》(Tri-Agency Framework: Responsible Conduct of Research)指出:研究人员应根据相关资助协议、机构政策、法律法规或学科专业标准,以允许他人验证或重复研究结果的方式,完整、准确地保存研究记录(数据、方法、结果/发现,包括图表和图像)[8]。《欧洲科研诚信行为准则》指出:研究机构和组织应建立适当的基础设施,以管理和保存各种形式的数据和研究材料(包括定性和定量的协议、过程、数据、其他研究人工制品和相关元数据),这些都是再现性、可追溯性和问责制所必需的[6]。我国中共中央办公厅、国务院办公厅印发的《关于进一步弘扬科学家精神加强作风和学风建设的意见》也指出,论文等科研成果发表后1个月内,要将所涉及的实验记录、实验数据等原始数据资料交给所在单位统一管理,留存备查[9]


分析发现,这些政策从推进科研诚信的制度建设出发,着重强调研究项目(或论文)结束后对科研过程中产生的以科研数据为核心的研究记录进行保存,以便留存备查。然而,如果没有在研究过程中对数据做良好“管理”,在研究结束时很可能因缺失关键数据或记录而无法进行有效“保存”。可见,科研数据的保存必须建立在科研数据管理的前提与基础上,没有良好的管理便没有良好的保存。因而,尽管科研数据管理和科研数据保存两个概念的侧重点有所不同,但两者却有着紧密的逻辑与实践关联。这里,笔者倾向于使用科研数据管理保存来概括科研诚信视域的数据管理与保存实践。


1.3

科研诚信:加强和重视行为规范

对于科研诚信的概念,目前国内外尚未形成统一的意见,笔者梳理了国内外代表性的官方机构发布的相关政策中对“科研诚信”的表述(如表1所示)。


由表1可知,尽管不同机构对科研诚信的界定不完全一致,但概括起来主要包括两方面的内容:一是道德操守方面,要求科研人员在思想上坚守诚实守信、严谨认真、负责任、公正透明的道德规范;二是行为规范方面,要求科研人员在项目申请、数据采集与处理、结果的记录与报告、成果引用与出版、学术交流与同行评审等方面严格遵守相关行为规范,确保科研过程规范、透明、可查验[15]。在现实中,个人的思想道德往往难以界定和监督,但行为却是外显的且易于进行约束。因此,各国政府、科研管理部门和科技界、学术界越来越注重制定和实施科研行为准则规范,运用制度的力量对科研人员的行为进行规范和约束,用“他律”来支持和补充科研人员的“自律”,从而促进科研诚信建设[16]。如英国医学研究委员会(Medical Research Council, MRC)2012年7月发布的《良好研究实践:原则与指南》(Good Research Practice: Principles and Guidelines)指出:由MRC资助的研究产生的所有研究数据必须在其整个生命周期内进行有效管理,以确保完整性、安全性和质量,以了解做了哪些工作、如何做的、为何这样做,并允许对研究工作进行回顾性评估和重现,并在可能的情况下支持新的研究和数据共享[17]


1.4

过程与行为管理:两者的桥梁纽带

由上述分析可知,在大数据时代和数据密集型科研范式下,科研数据作为科技创新的基础和支撑、科学研究过程的参与者和科研工作者态度行为的记录者,受到越来越多的重视,各国纷纷将科研数据管理作为重要战略加以推进,以实现多重目标:一是便于将来进行共享和再利用,进而从整体上降低科研成本,同时也有助于增加科研不端行为被发现的机会,减少和避免科研不端行为的出现;二是对科研过程中产生的科研数据和原始资料进行整理、记录和保存,完善科研过程记录,提高科研工作的规范性和可查验性,在保障科研工作质量的同时震慑和防范科研不端行为。同时,随着全球对于科研诚信的治理逐渐从事后惩戒转向事前教育、事中约束规范与监督,通过规范科研过程与科研行为以促进科研诚信建设,越来越多的国家和机构将科研数据管理作为规范科研行为、促进科研诚信的重要措施,纳入科研诚信相关政策中。这充分说明了科研数据的管理保存是促进和实现科研行为规范,进而实现科研诚信的重要途径(如图2所示)。



2 科研数据管理保存促进科研诚信的作用机制

科研数据管理主要指对科研过程中搜集和产生的数据进行组织整理、保存,并进行分享、分析和再利用的一系列活动[18],它具有避免数据丢失、验证科研成果、提升科研成果的曝光度和影响力、促进科研数据共享、提高科研效率等多重价值[19]。将科研数据的管理保存纳入科研管理规范和相关政策,不仅有助于规范科研人员的行为,培养其良好科研习惯,同时也有助于完善科研记录,促进数据共享和再利用,提升科研透明度,增加科研不端行为被发现的机会,震慑和防范科研不端行为,从而有助于科研诚信的制度建设。


2.1

规范科研行为,培养良好科研精神

与科研习惯

随着当前科学研究逐渐进入数据密集型研究范式阶段,新的科研发现和科技创新越来越多地建立在数据的搜集、整理、处理分析的基础上。可以说,与数据相关的工作正在逐渐成为科学研究的核心内容。而如何对待和处理科研数据,则直接反映了科研人员的学术态度和对科研诚信的认知[20]。科研数据的管理与保存逐渐被纳入科研过程规范,成为科研工作的一部分,这有助于培养科研人员严谨认真的科研态度、求真务实的治学精神,帮助其克服虚浮急躁的心理,最终形成良好行为习惯,将科研数据的管理与保存视为一种自然而然的事情,内化为一种自觉意识和习惯,最终成为学术界的共识,形成科研诚信与学术规范的良好环境氛围。


2.2

推进科研透明,增加科研不端行为

被发现的机会

作为科研成果的重要组成部分,科研数据的管理保存有助于促进其将来的再利用,这不仅在一定程度上推动了学术的开放透明,也增加了科研不端行为被发现的机会。当研究者员采取编造、捏造、篡改、筛选实验数据等不端行为时,得出的研究结果注定无法确保它的可重复性。当数据被其他人员利用时,如果基于作者提供的数据和相关方法/程序/步骤无法复现论文中的研究结果,则有可能受到科研不端的质疑或指控。例如,2014年,震惊世界的日本科学家小保方晴子论文造假事件,起因就是其他科学家发现其实验不具备可重复性。因而,数据的共享/再利用是发现科研不端行为,推进科研诚信的重要途径之一。鉴于此,越来越多的国际知名学术期刊要求科研人员在论文投稿时或论文最终发表后将支撑论文的相关数据上传到指定数据存储库[21]。如Elsevier[22]、Springer Nature[23]、Taylor & Francis[24]、Wiley[25]等都制定了科研数据政策,鼓励或要求科研数据开放共享。由此可见,推动科研数据的管理保存有助于推进科研透明,增加科研不端行为被发现的机会,从而有助于震慑和防范科研不端企图,促进科研诚信建设。


2.3

完善科研记录,为处理科研不端

提供证据支撑

由于科研数据既是科学研究的基础和“原材料”,又是科研报告/论文的重要支撑,是一种重要的“科研成果”,不同阶段的科研数据构成了对科研过程的真实记录,因而可以成为科研档案的重要组成部分。对科研数据进行管理和归档保存,意味着科研过程被记录下来,科学研究中的任何疏忽、瑕疵特别是编造、伪造、篡改行为都会被记录下来,成为日后被追责的证据,这对所有科研人员都具有很好的警示教育和约束规范意义。正因为如此,国内外纷纷将科研数据的管理作为完善科研记录,加强科研诚信的重要内容。例如,美国食品药品监督管理局(FDA)发布的《数据可靠性与CGMP合规行业指南》将科研数据作为完善科研过程记录的重要内容[26];英国牛津大学制定的《研究数据与记录管理政策》(Policy on the Management of Research Data and Records)指出,学校和研究人员都负有准确、完整、真实、可靠地保存科研数据及相关记录的责任[27];我国最新发布的《科学技术研究档案管理规定》也将科研数据纳入科研档案的定义中,并对科研档案的规范化管理提出了更高要求[28]。在处理有关科研不端的质疑或举报时,这些被保存的“科研数据”就成为最有效力的原始证据资料。这就要求所有科研人员都必须严格遵循有关科研/学术的规范和行为准则,杜绝舞弊侥幸心理,扎实走好科研过程中的每一步,并及时对相关资料进行整理和存档,以备后续查验。因而,科研数据的管理保存有助于完善科研过程记录和科研档案资料,为将来的科研不端审查和处理提供证据支撑,从而震慑科研不端企图,推动科研诚信建设。



3 加强科研数据管理保存,

推进科研诚信的建议

从科研数据的管理保存出发,推进科研诚信建设,国内外已形成一些共识,即一方面要强化制度建设,建立健全保障科研诚信的学术行为规范;另一方面要加强教育引导,营造自觉遵守科研诚信的学术氛围;再次要推动科研数据的管理保存,实现科研过程的可追溯和科研结果的可验证;同时还要推动科研数据的开放共享,建设透明开放的科研生态体系。


3.1

将科研数据的管理保存纳入科研行为

规范,推进科研诚信的制度建设

由上述分析可知,科研数据的管理是保存的前提,只有前期对科研数据进行良好管理,才能对数据进行完整、准确的保存。笔者调研发现,目前我国有关科研诚信和学术规范的政策较多强调保存科研过程中产生的数据和相关资料以备将来查验,较少关注数据的管理。而国外的相关政策都注重管理与保存并重,强调基于“管理”的“保存”(如表2所示)。因而,我国在制定相关政策时,应将科研数据的管理纳入政策内容,通过良好的管理促进有效的保存,这也有助于促进科研过程与行为规范,助力科研诚信建设。


3.2

加强教育培训,引导科研人员正确

恰当管理保存科研数据

随着全球范围的学术不端事件层出不穷,科研管理部门逐渐发现,仅对科研失信行为进行事后查处难以从根本上杜绝科研不端行为,还应通过对科研诚信和科研行为规范的教育引导来强化事前预防。因而,推行良好和规范的科研行为教育正逐渐成为科研不端行为治理体系中的重要组成部分。目前,国内外已有一些高校尝试开展以科研数据管理为核心内容的科研诚信教育,如美国伊利诺伊大学香槟分校的图书情报研究生院开发了“数据管理教育项目”(Data Curation Education Program,DCEP)[36],北卡罗莱纳大学教堂山分校和爱丁堡大学共同在Coursera上开设了“科研数据管理与共享”(Research Data Management and Sharing)课程。同时,一些高校图书馆在科研数据管理教育方面进行了积极探索,围绕数据采集方法、采集规范、处理规范、数据类型、数据格式、数据关联、数据组织、数据存储、数据保护、数据共享、撰写科研数据管理计划等方面开展多种形式的培训课程[37-38]。但调研发现,这些课程的重点大多是管理科研数据以便于将来的共享和再利用,专门面向科研规范和学术诚信的科研数据管理与保存的培训尚不多见。因而,应尽快开发相关课程和培训内容,引导科研人员科学、规范地管理和保存科研过程中产生的科研数据及相关资料,促进科研诚信建设。


3.3

完善基础设施与服务,为科研数据

管理保存提供基础支撑

科研数据的保存离不开相关基础设施特别是数据存储库/中心的支持。欧美发达国家较早认识到科研数据的巨大价值,已建设形成了一批国家级的科学数据中心或高水平数据储存库,如美国国立生物信息技术中心建立和维护的GenBank(基因银行),目前已是世界上最权威的基因序列登记数据库之一。我国也逐步启动科学数据储存库的建设,自2004年起,科技部、财政部先后在基础科学、农业、林业、海洋、气象、地震、地球系统科学、人口与健康8个领域支持建成了国家科技资源共享服务平台。但我国的科研数据存储库建设由于起步晚,一是数量较少,无法满足实际需求,二是已有存储库存在信息化建设水平不均衡、数据缺乏统一标准、数据共享及价值挖掘不足等问题[39]。随着我国《科学数据管理办法》[40]、《关于进一步弘扬科学家精神加强作风和学风建设的意见》[9]、《高等学校预防与处理学术不端行为办法》[34]、《科学技术研究档案管理规定》[28]等系列法规制度的出台和实施,一方面要求各类科技计划项目产生的科学数据必须进行强制性汇交,另一方面要求各单位必须妥善保管本单位科研人员产出的各类科研数据和相关研究资料。在此背景下,通过各种途径汇集的科研数据资源将呈海量增长趋势。为此,我国必须加快建设一批高水平的科研数据存储与服务中心,为科研数据的保存提供支持。


3.4

推动科研数据的开放共享,

建设透明开放的科研体系

开放科研数据(OpenResearchData,ORD)是指除有法律或道德限制的那部分数据外,将科研数据通过互联网发布,使其可被免费、自由地访问、挖掘、开发、复制和传播利用[41]。开放科研数据有助于提高科研效率,提升科研过程的严谨性、有效性和可重复性,促进科研人员之间更有效地沟通和协作,提升研究影响力,增强公众对科研成果的信任等[42]。与科研数据开放相比,科研数据的保存与存档对科研不端行为仅具有震慑作用,数据存档仅指保存数据以“备查”,如果科研不端行为没有被发现和揭发,科研管理部门很难对每个研究项目的科研数据一一核查,部分侥幸者仍可能会铤而走险。而科研数据开放则是主动将数据公之于众,供公众广泛使用和验证,对科研数据的质量和规范性都有着更高的要求。从这个意义上来说,推动科研数据的开放与共享,对于促进科技创新和科研诚信建设都有着重要而长远的意义。如2016年7月,英国高等教育资助委员会(Higher Education Funding Council for England)、英国研究理事会(Research Councils UK)、英国大学联盟(Universities UK)和惠康基金会(Wellcome Trust)联合发布《开放科研数据协议》(Concordat on Open Research Data),并指出:“开放科研数据对于实现科学研究的开放、负责、透明,推动科研诚信与科研规范,助推国家科技创新与经济增长,促进公众对于科学研究事业的信任与支持都具有重要的作用和意义。”[43]尽管我国在开放科学的理论探讨方面已有不少成果,但与国外相比,我国开放科学在顶层战略的设计、政策体系、开放共享实践都存在着一定的差距。因此,我国应进一步提高认识,着重从顶层设计、政策体系、基础设施等方面推进我国开放科学的进程,从而为科研诚信建设提供更好的支持与保障。



4 结语

加强过程管理,强化制度建设,从源头上遏制和防范科研不端行为,已成为国际社会加强科研诚信建设的普遍共识。在数据密集型科研范式的背景下,不同阶段和形态的科研数据扮演着科学研究的基础资料、科研过程的记录者、科研成果的重要组成部分等多重角色。推进科研数据的管理保存不仅有助于培养科研人员严谨认真的科研态度、求真务实的治学精神,形成良好行为习惯和行为规范,从整体上促进科研规范和科研诚信建设,同时也有助于完善科研过程资料和记录,震慑心存侥幸者,从而在一定程度上减少和防范科研不端行为,促进科研诚信的制度建设。基于此,本文认为应从政策上将科研数据的管理保存纳入科研管理规范,在实践层面建设完善的数据管理保存基础设施与服务,并进一步推动科研数据的开放共享,建设透明开放的科研体系,以从整体上推进科研诚信建设,为我国的创新驱动发展战略提供支撑和保障。



作者贡献说明

邢文明:提出研究思路,设计研究方案,论文成稿与修订;

陈继丽:资料收集与论文起草;王张华:提出论文框架和思路优化建议。



参考文献


*本文原载于《图书情报知识》2021年第6期4-10

版权归《图书情报知识》所有,欢迎转发到朋友圈,转载请联系后台。


制版编辑 | 卢慧质


--END--


当期荐读 2021年第6期 | “以人为本”的数据科学教育:图书情报学科的新发展(内含视频摘要)

当期荐读 2021年第6期 | 信息贫富分化的“时间悖论” ——基于个人信息世界边界要素的实证检验(内含视频摘要)

当期荐读 2021年第5期 | 文旅融合背景下国产游戏创新与推广的模式探索:基于《原神》的案例分析

当期荐读 2021年第5期| 后疫情时代信息科学发展的新机遇—韩国延世大学图书馆与信息科学系前系主任Min Song教授学术访谈

当期荐读 2021年第5期|老年人阅读的异质性动机 ——基于生产性老龄化视角的解读(内含升级版视频摘要)


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存