查看原文
其他

当期荐读 2021年第3期 | 云环境中学术数据安全事件的风险致因及其检视——以事故致因理论为视角

文禹衡 戴文怡 信息资源管理学报 2024-01-09

图源 | The Internet


文禹衡 戴文怡

(湘潭大学知识产权学院, 湘潭, 411105)



摘 要

引入事故致因理论,以此为视角审视云环境中学术数据安全事件的风险致因。基于云环境分析学术数据安全事件与风险之间的关系,为学术数据安全事件发生前的预防与发生后的应急提供参考和依据。在“环境-物-人”的框架内,将云环境中学术数据安全事件的风险致因类型化,并以学术数据泄露、丢失、篡改和滥用的安全事件为例进行检视。云环境中学术数据安全事件的风险致因有环境致因(云环境)、物的致因(硬件错误、固件错误、软件缺陷等)和人的致因(安全意识、操作行为、管理行为、滥用行为),而某一具体安全事件的发生可能是单致因、双致因甚至是多致因作用的结果。

[关键词]

学术数据 安全事件 事故致因 云环境 数据管理 数据泄露 数据篡改



1 引言


随着信息技术和数字技术的发展,人类在网络空间的活动和生产进入了新的环境——云计算环境(简称“云环境”)。一般而言,云计算是一种通过网络(主要是互联网)提供计算资源的、可根据用户需求扩大或缩小规模的效用服务(utility service)[1]。在云环境中,数据丢失、黑客攻击等因素导致数据安全事件经常发生,动辄上亿的数据丢失、数据泄露等事故已经屡见不鲜。学术数据不仅面临网络环境中的传统安全风险,也面临云环境中的新型安全风险,例如梵蒂冈使徒图书馆(Vatican Apostolic Library)每月都会发生100次黑客在线攻击,惠州慈云图书馆图书检索系统注入漏洞导致包括书的类别、用户资料等在内的数据泄露。

当前,国内相关研究成果主要集中在学术信息资源安全的需求与保障[2]、控制与管理[3]、保障的标准化[4]、国家政策体系[5]、联盟建设[6]、体系构建[7-9]、体制建设[10]、保障机制[11-14]、政府治理[15]、组织现状[16],以及数字学术信息资源的云存储安全保障[17-20],数字学术信息资源安全风险[21]及其防范[22]、用户安全与权益保障[23];国外只有极少数研究针对学术信息系统的安全性并提出双因素认证(2FA)的安全架构[24],大多数的相关研究集中在云中数据的安全性,例如基于不同位置服务器增强数据云存储的安全性[25]、基于RSA加密算法实现云计算中数据的安全性[26]、基于模糊关联技术提高云环境下的数据安全性[27-28]、基于云计算采用框架(CCAF)确保数据安全[29],以及云端数据的完整性[30]、云环境事件处理模型[31]。可见,国内相关研究成果主要停留在学术信息资源的安全体系、体制、机制、政策、组织和治理等宏观方面,而国外相关研究成果主要集中在云环境中的数据安全性方面,尽管也涉及数字学术信息资源的云存储或学术信息系统安全性问题,但缺乏研究云环境中学术数据安全事件风险致因的成果。

鉴于此,拟从“事故致因理论”视角审视云环境中学术数据安全事件的风险致因,有助于从不同角度、环节发现学术数据安全事件的原因,提前掌握导致学术数据安全事件发生的潜在风险,对于学术数据安全事件发生前的预防和发生后的应急都至关重要。



2 事故致因理论及其适用于数据安全领域的契合性


归纳事故致因理论的主要类型及要义,在理解安全、事故、风险之间互动关系的基础上,阐明该理论在数据安全领域的应用具有很强的契合性。


2.1 事故致因理论的主要类型及要义


当前的事故致因理论研究成果相当丰富,通过梳理17种事故致因理论[32],可以归纳出其导致事故发生的因素主要有人的因素、物的因素、环境因素、媒介因素、管理因素、机器因素等,其中大部分事故致因理论都涉及到人的因素。在不同的理论中,这些因素被重视的程度并不一样,有的事故致因理论强调单因素,有的强调双因素,有的强调多因素。分析各种事故致因理论的要义可以发现,事故不会凭空发生,而是在特定领域出现,因而基于不同领域事故而提出的事故致因理论也会各有侧重。事故致因理论的提出是基于特定的社会基础,而事故的发生源于特定的风险,可以推导出——风险的产生也源自于特定的社会基础,会随社会基础的改变而发生改变。当社会发生大变革时,风险致因也会发生改变,这种改变的程度可能是前所未有的,此时构建与其相适应的理论模型并以此指导社会实践就变得尤为重要。当进入云计算时代,随之产生的特定风险,在云计算时代之前不曾出现过,那么在云计算时代的事故致因理论是否要有所更新呢?答案是肯定的。不过,构建云计算时代的事故致因理论并不是一蹴而就,因而有必要解构事故致因理论并归纳其基本要义。

导致事故发生的因素类型有多种,归纳起来无非是人的因素、物的因素和环境的因素。人与物的存在都离不开所处的环境,人的不安全状态和行为、物的不安全状态、环境的不安全状态,既可以单独导致事故的发生,也可以联合导致事故的发生,只不过因素联合导致事故比因素单独导致事故的发生概率要大。基于人、物、环境这三个基本事故致因,会产生不同的事故致因组合,引发不同程度的事故风险,并且事故风险引发事故发生的概率也会出现差异化倾向,直接影响事故发生结果的严重程度。此外,还应当注意管理的因素可以归入到人的因素,人的因素除了人自身的智力、身体等缺陷问题,也包括人的行为,而管理是人的具体行为的表现之一;机器因素可以归入到物的因素,物是人们生产活动作用的对象,包括生产设备和生产材料等,机器只不过是物的一种;媒介因素可以归入到环境因素,除了人(主体)和物(客体)以外,环境是主体和客体所处的空间,媒介是空间内的一种传递或连接的载体。值得注意的是,现代社会的事故致因已经不再局限于单独的因素,人、物、环境三个因素或其中两个因素在特定场景中组合形成的多因素才是事故发生的致因。


2.2 数据安全领域应用事故致因理论的契合性


安全、风险和事故在非学术语境中经常被等同使用,但在学术概念上有所区别。在《当代汉语词典》中,安全、事故和风险的词义各有侧重。安全,是指没有危险,不受威胁,不出事故;事故,是指意外的损失或灾祸(多指在生产、工作上发生的);风险,是指可能发生的危险[33]。安全是对特定事件的一种正面评价,事故是对特定事件的一种负面评价。风险是危险所处的一种潜在状态,其特别强调可能性,即危险最终是否发生是不确定的。因此,存在风险并不必然导致事故发生,事故发生则必然在发生前就潜藏着某种风险。风险与事故、危险源被视为安全科学的三个最基本概念[34],意味着风险可以被置于安全科学的体系之中。安全科学是预防事故的科学,将学术数据安全置于安全科学体系中加以审视,有助于运用安全科学的理论来深入研究学术数据安全风险,实现学术数据安全。安全科学、安全业务活动的目的是预防事故,必须借助于事故致因理论这一工具找到事故的确切原因,之后才能达到有效预防的目的,可以说事故致因理论是安全科学的唯一理论主线[35]

任何事故的发生离不开所处的社会,无论是工业化社会,还是信息化社会,抑或是当前的数字化社会,有些事故无论在哪种社会时期都会发生,而有些事故仅在特定的社会时期发生。经典事故致因理论是基于当时的社会基础和时代背景而建立的,主要适用于Safety领域(强调无意而为)。当前的数据安全研究,除了Safety领域以外,还包括Security领域(强调蓄意而为),那么事故致因理论是否还能适用于数据安全事件研究领域呢?首先,数据安全事件的发生,除了具有“人故意而为之”因素(Security领域)以外,同样也存在“人过失而为之”“物”和“环境”等多方面因素(Safety领域);其次,社会总是往前发展的,尽管任何理论的构建都具有时代的局限性,但是不能因此就放弃对理论的拓展适用,毕竟任何理论本身应具有解释力,对有关新事物的研究应该起到指导作用,事故致因理论是安全科学的理论主线,对于相关的安全事件本身就具有很强的解释力;再次,安全科学领域近年来强调同时关注Safety & Security风险,由此已将事故的说法拓展到安全事件,而安全事件可以涵盖包括数据安全、信息安全和网络安全在内的所有安全领域;最后,在数据安全领域内应用事故致因理论,并不是将事故致因理论照搬到数据安全领域,也不是选取诸如海因里希事故因果连锁理论或轨迹交叉论等某种具体理论来解释问题,而是从事故致因理论的不同学说中归纳出人的因素、物的因素、环境的因素的一般性原理,以此为基础来解释数据安全事件的风险致因,为构建数据安全风险致因理论寻找理论支持。因此,在将事故致因理论应用于数据安全领域的基础上,探究学术数据安全事件的风险致因理论就具备了可行性。



3 云环境中学术数据安全事件的风险致因类型化


分析事故致因理论可知,其核心要义在于人的因素、物的因素和环境的因素。数据采集、数据传输、数据存储、数据处理、数据交易、数据销毁这六个阶段共同构成了数据生存周期[36],其中任一节点存在数据安全风险,都可能会导致数据丢失、数据泄露等安全事件。因此,数据安全事件的发生必须考虑环境的因素,否则就难以全面揭示数据安全事件的致因以及数据安全领域的潜在风险。在数据生存周期中,任何一个环节都离不开人的参与,即便是机器自动进行数据采集、传输、存储、处理、交换和销毁,也仍然是依靠人的控制,因此人的因素是导致数据安全事件的原因之一。事故致因理论中的“物”,不能狭义地理解为法律意义上的“物”,它指向的是事件发生的物质基础,通常也是事件发生的本身或直接载体,当涉及数据安全时也面临着同样的问题,由于数据应用的广泛性、数据流动的快捷性、数据获取的便利性,以及数据的高价值性等都是以数据作为载体实现的,因此物的因素是导致数据安全事件的原因之一。总之,就云环境中学术数据安全而言,可以在“环境-物-人”的框架内展开分析,进而揭示其风险致因类型。


3.1 环境致因:云环境所致的学术数据安全事件风险


环境的不安全状态,是潜藏风险和诱发事故的外部因素。学术数据所处的环境已经发生了巨大的变革,在纸质文献时期,学术数据存储和传播载体主要是纸,除了因火灾、水患等造成纸本毁损以外,几乎不存在学术数据安全的问题;在电子文献时期,纸质文献电子化成为趋势,学术数据存储载体主要是特定的、不联网的存储设备或数据库,而传播载体除了纸质报刊图书外,还以电子文献方式出现,除非发生存储载体毁损导致数据丢失,一般很难出现数据安全事件,在这种环境下学术数据安全问题并不严重;在数字文献时代,文献数字化逐渐成为趋势,学术数据存储载体虽未发生改变,但是学术数据库联网以供外部访问成为常态,存储的组织形式也发生了改变——云计算分布式存储开始应用于数字学术资源建设,当学术数据被置于云环境中,那么云环境所带来的风险也随之产生。

云计算服务可分为基础设施即服务(IaaS)、平台即服务(PaaS)和软件即服务(SaaS),云安全联盟发布了《云计算的11类顶级威胁》(2020年4月更新),按照调查结果的重要程度排序分别为数据泄露,配置错误和变更控制不足,缺乏云安全架构和策略,身份、凭证、访问和密钥管理不足,账户劫持,内部威胁,不安全的接口和API,控制平面薄弱,元结构和应用程序结构失效,有限的云使用可见性,滥用及违法使用云服务[37]。这意味着,云计算本身就处于安全风险之中,那么云环境中的学术数据也会因此而面临安全风险,这就是环境不安全带来的安全风险。例如,云环境中的数据泄露在顶级威胁中排第一位,一旦在基础设施、平台和软件的外部或内部任一层面出现漏洞,都将导致学术数据面临被泄露的风险。


3.2 物的致因:静默数据损坏所致的学术数据安全事件风险


物的不安全状态,是潜藏风险和诱发事故的内部因素。这里的“物”通常是指事故发生的本身或直接载体,也就是学术数据本身或存储数据的介质。静默数据损坏是存储系统中最难解决的数据一致性问题之一,但是云服务提供商并未对此足够关注,直到腾讯云的数据丢失事件才将焦点引至静默数据损坏上来。数据在存储系统传输中,经过了多个部件、多种传输通道和复杂的软件处理过程,其中任意一个环节发生错误都可能会导致数据错误,但是这种错误一般无法被立即检测出来,而是通过后续应用的数据访问过程才发现数据已经出错,这种很难在数据发生错误那一刻被检查出来的错误,被称为静默数据损坏。通俗理解,静默数据损坏并不是外部因素所致,而是数据自身的原因所致。

一项针对NetApp数据库中150万个硬盘驱动器的学术研究发现,在32个月内8.5%的SATA磁盘会产生静默损坏,即便以验证数据和RAID奇偶校验是否匹配就可以捕获这些类型的错误,但是后台验证过程中仍然错过了13%的错误[38]。也就是说,数据静默损坏并不必然会在第一时间内被发现,所以潜在着数据丢失的风险。在数字学术领域,静默数据损坏也具有强大的破坏力。例如,学术数据发生了静默数据损坏,可能会导致处于加密状态的学术数据在未经备份的情况下严重损坏,产生学术数据安全事件,导致该学术数据不可恢复,进而浪费了大量的学术资源。在静默数据损坏致因下,学术数据安全事件发生的物的致因主要分为以下几类:①由内存、CPU、硬盘、数据传输链路等引发的硬件错误;②由主机总线适配器、硬盘等引发的固件错误;③由系统软件、操作系统、应用程序等引发的软件缺陷;④诸如电磁等其他因素。


3.3 人的致因:管理操作所致的学术数据安全事件风险


在数据安全领域中,人的不安全状态主要是人的行为不安全状态,是独立于外部因素(环境)和内部因素(物)之外的因素。在传统的事故中,人的因素是最常见的致因,这一点在数据安全领域也毫不例外。即便是具有专业知识和技能的人士,也不能避免人的致因而引发数据安全事件。人的致因主要表现在数据安全风险意识,以及对数据的管理、操作或滥用方面。

(1)安全风险意识缺乏,主要是指有关主体缺乏数据安全知识和观念。观念决定行为,如果没有安全意识,有关主体并不能意识到自己的行为潜在着风险。Ponemon研究所四月份的报告显示,只有一半的企业知道其云计算服务提供商如何保护其数据,而只有略高于三分之一的企业已经进行了尽职调查[39]。安全风险意识缺乏的主体,不仅包括云计算服务提供商,还包括云服务用户。云服务提供商工作人员缺乏数据安全知识和意识,容易造成过失删除数据、越权访问数据,或不按规定给下级权限同事授权访问等;云服务用户缺乏数据安全意识,往往表现在设置密码口令过于简单,不进行或不及时进行数据备份。

(2)管理不当,主要是指云服务提供商的管理行为对数据安全造成风险,主要表现在:①授权管理不当。一方面是过度授权,在进行授权时没有遵循最小授权原则,用户可以超权限访问数据内容,从而埋下了数据安全隐患,因为外部用户并非都是善意的,仅给用户授予最低权限,能够有效降低数据安全风险;另一方面是未及时解除授权,在员工调岗或离岗后并未及时解除其访问权限,调岗或离岗员工获取内部数据而导致数据泄露。②密码管理不当。一方面,弱密码存在被破解的风险,容易导致数据泄露事故;另一方面,未区分重要数据(账户和密码等)和一般数据,未对重要数据进行相适的安全加密,大量的数据泄露事件的主要原因都是未对重要数据施以加密措施。③备份管理不及时。尽管在数据安全领域,备份是防范数据安全的第一准则,但重大数据安全事件仍然频发,说明云服务提供商在数据备份管理方面并未严格执行到位。

(3)操作行为,主要是指云服务提供商工作人员的操作行为对数据安全造成风险,同时还包括黑客实施的相关行为所造成的风险。其一,过失导致删除操作,主要包括误删除Oracle软件、空格、数据文件、脚本文件、目录中挂载等;其二,故意实施删除或篡改操作,这种情况一般是在公司未及时解除离职工作人员访问权限的情况下发生;其三,还有来自于外部的黑客攻击,在云计算服务实践中,因供应商操作失误导致数据丢失的安全事件逐渐减少,但是恶意攻击者永久删除或修改云端数据的情况却屡见不鲜。

(4)滥用行为,主要是指云服务提供商或其内部员工在客户不知情的情况下擅自利用云端数据。学术数据一般都是开放供社会成员获取的,但是每个人获取的总量是有限的,尚难以达到海量学术数据的体量,而且学术数据一般都不会直接涉及任何秘密信息,故不会带来一般意义上的风险。但是,海量学术数据集中起来,利用大数据的相关关系,很容易从中挖掘出军事、党政、民生、意识形态、社会金融、核心产业、关键技术等领域的情报,云服务提供商或其内部员工利用大数据挖掘技术擅自对云端的学术数据进行全样本分析,就可以轻易获取需要的情报。所以,就全域学术数据而言,关系到国家总体安全的方方面面,而学术数据被滥用所导致的风险往往也最为严重。



4 云环境中学术数据安全事件的风险致因检视


事故致因理论大体经历了从单因素理论(如早期的事故频发倾向论)到双因素理论(如连锁论)、三因素理论(如流行病学理论),最后到多因素理论(如复杂系统因果模型)的发展历程[40]。这是人类认识事故致因的深入过程,每个理论都有其适用的场景,每一场事故的发生也并不必然是单致因、双致因、三致因,更有可能是多致因,对于云环境中学术数据安全风险生成也是一样的。如果将前述的三大类致因(暂不考虑其下细分的各类具体因素)视为一个集合,云环境中学术数据安全风险生成就相当于在该集合中取致因加以组合。本文所称的单致因、双致因、多致因导致学术数据安全事件,并不是指前述事故致因理论,而是指向环境致因、人的致因、物的致因中的一个或多个。需要说明的是,每一个致因之下由于存在多种具体的因素,而且这些因素并不是穷尽列举,故该部分所称的单致因并不仅仅指单因素,有可能是一种致因下的一个因素或多个因素,该部分所称的多致因至少包含两个因素(见表1)。


表1 云环境中学术数据安全风险致因及其因素类型


在云环境中,学术数据安全事件的风险生成除了一般性规律以外,特定学术数据安全事件的风险致因还有其特殊性,不同学术数据安全事件的风险致因并非完全一样,下面以学术数据的泄露、丢失、篡改和滥用等事件为例,对各事件中的风险致因进行检视。


4.1 学术数据泄露事件中的风险致因检视


在云环境中,物的致因一般不会导致数据泄露,主要是人的致因单独造成的。如果说学术数据泄露风险主要是环境致因和人的致因共同产生的,那是因为所处的云环境本身的不安全,增加了学术数据泄露的概率。

(1)环境致因导致学术数据泄露风险。在传统网络技术环境中,学术数据存储在本地数据中心,本地数据中心不仅安全防护会高一些,而且对外开放的接口比较少,也就是说开放的接口暴露在网络空间所带来的风险很低。据调查,企业无论是出于合规还是安全的考虑,都会把一些工作负载保留在本地,约三分之一的受访企业表示,将构建一个新的传统本地数据中心以满足需求,这是本地数据中心仍受重视的有效力证[41]。但是,云环境中既存在传统技术漏洞,也会存在新技术漏洞,在为多租户泛在连接和资源共享的同时,也会导致云环境中数据面临更严重的安全问题。《2018年中国互联网网络安全报告》显示,云平台成为网络攻击发生的重灾区。也就是说,将学术数据置于云环境中,就等于将其置于了不特定的风险之中。

(2)人的致因导致学术数据泄露风险。其一,在授权管理方面,过度授权和未及时解除授权都会导致数据泄露风险,后者潜藏的风险远远高于前者。正常授权的不同主体被授权访问的权限级别是不一样的,访问授权与访问者的责任度、信任度成正比,需要承担的责任越大、被信任的程度越高,获取的访问权限等级授权就越高,反之亦然。过度授权让原先没有访问权限的主体获取了访问权限,但是却没有直接承担相应程度的责任,因此,在使用过程中就没有更强的动力去确保云服务器中学术数据的安全性,由此牺牲数据的安全性而获得更高的工作效率。在云服务提供商经营中,为了工作方便和灵活性,往往未按照公司保密性规程而给下一级权限员工过度授权,由此催生了“影子IT”——很多员工使用其账户时甚至没让公司的IT部门知道,从而极大地增加了云环境中的数据安全风险,这比云环境自身特性所致的潜在风险还要大。尽管未按程序获得了职责外的高一级访问权限,也是基于其上一级主管的信任,即便这种私人之间的信任具有一定强度,但却比按照公司规章制度所授予的信任要脆弱。未及时解除授权,是指当原来具有某一级访问权限的主体调离原工作岗位或离职,而其访问权限却未及时被解除,此类员工一旦私下访问或存储学术数据,就将学术数据置于不可控风险之中,这种情况出现的学术数据泄露往往是有意而为之。其二,在密码管理方面,无论是云服务提供商还是用户,无密码、弱密码、密码保护等级不高均会造成学术数据安全风险。

(3)黑客攻击导致学术数据泄露风险。黑客攻击导致学术数据泄露同时包含人的致因和环境致因,一方面,云环境为黑客攻击提供了“便利”;另一方面,黑客的操作行为会侵入相应的数据存储中心拷贝或删除学术数据。


4.2 学术数据丢失事件中的风险致因检视


在云环境中,学术数据丢失风险主要是物的致因或人的致因,此二者单独起作用就可以造成学术数据丢失风险。如果说环境致因也有关联,则体现在整个云环境本身的不安全,进而增加了人的致因造成学术数据丢失风险的概率。

(1)物的致因导致学术数据丢失风险。其一,因为内存、CPU、硬盘以及数据传输链路等情况都可能引发硬件错误;其二,因主机总线适配器、硬盘等导致固件错误;其三,因系统软件、操作软件、应用程序等导致软件缺陷;其四,电磁造成元器件损坏。无论是何种因素,都是因物理设备、软件等发生损害而导致存储在其中的学术数据发生丢失风险。

(2)人的致因导致学术数据丢失风险。无论是过失删除,还是故意删除,都是导致云环境中学术数据丢失的直接原因。过失删除一般都是在岗的云服务工作人员错误操作所致,还有通过技术手段恢复学术数据的可能性。但是故意删除可能是离岗、调岗的云服务工作人员或黑客等蓄意而为,其共同特点都是反复擦除物理存储设备上的学术数据,因而很难通过技术手段恢复。如果云服务提供商或用户都没有对被删除的学术数据及时备份,该数据就会永久丢失。

总之,在人的致因中,人的主观因素导致的客观错误会诱发不同严重程度的后果。因此,加强对人的致因的管理和控制,在一定程度上比物的致因更加重要。


4.3 学术数据篡改事件中的风险致因检视


在云环境中,物的致因不会导致学术数据篡改,学术数据篡改风险主要是人的致因造成的。如果说是人的致因和环境致因共同造成的,那么环境致因主要体现在整个云环境本身的不安全,从而增加了学术数据被篡改的概率。学术数据篡改风险发生的前提是行为人能够接触到学术数据,如同前述数据泄露、数据丢失中人的致因那样,有关主体在实施数据篡改行为时,可能是因为授权管理不当、密码管理不当而接触学术数据,也可能是采用黑客攻击手段而接触学术数据,故不再赘述。


4.4 学术数据滥用事件中的风险致因检视


在云环境中,物的致因不会导致学术数据滥用,学术数据滥用风险的产生是人的致因和环境致因共同造成的。此中的云环境致因不像前述的体现在整个云环境本身的不安全,而是学术数据滥用的必要因素。

(1)云环境让学术数据滥用成为可能。尽管云端中的学术数据是分布在不同资源设备节点中或特定地域的物理服务器中,但正是因为云环境中资源池的存在,以及云计算的特征是按需提供服务,让有关主体调动海量学术数据成为可能。而且,云计算服务具有低成本优势,无需支付很大成本就可以获得使用,这为恶意攻击者提供了便利性。在数据滥用成为一种行业常态化的当下,学术数据同样也存在被滥用的风险,只不过这种滥用并非一般主体所能够实施。

(2)云服务提供商或其工作人员等主体在用户不知情的情况下访问并利用云端学术数据。尽管自欧盟《通用数据保护条例》(GDPR)实施以来,很多国家逐渐制定并颁布了数据保护法等法律法规,禁止大量收集和长期存储个人数据,但是对于非个人数据采集和二次利用却是鼓励或处于“无为规则”状态。由于学术数据中公开的个人数据(作者信息等)都已经被授权,或者说学术数据天然具有公开性(除涉密的情形外),这就意味着学术数据可以进行二次利用以实现新价值。在当前的业态规则下,获取特定学术数据(或学术作品)不会具体通知作者,因为此类通知成本太高而无法实现,学术数据通常是允许付费后自由下载。

目前业界实践中,个体用户通过正常渠道获得大批量学术数据是很难实现的。例如,在中国知网下载达到一定数量之后,就会被视为非正常下载行为且IP地址被禁止下载,意味着个人用户几乎不可能在云端调用海量学术数据进行二次情报提取。然而,对于云服务提供商或其工作人员,以及大数据公司、政府机构而言,获取海量学术数据并提取其中的情报并非难事。云服务提供商或其工作人员实际上控制着云端的学术数据,云服务提供商可以在用户毫不知情的情况下、云服务工作人员在公司不知情的情况下,调用云端的海量学术数据;诸如大数据公司等企业,可通过购买数据或使用爬虫技术等手段获取海量学术数据,或利用黑客技术直接侵入存储学术数据的服务器复制或利用学术数据;对于政府机构而言,在涉及国家安全等重大事件时,可以根据法规政策赋予的权限,合法地获取全部学术数据,尤其当云服务器在本国领土之外时,其他国家可以在其相关法律授权下直接访问、获取该云端的所有学术数据。



5 结语


以典型学术数据安全事件为例进行检视可知,在云环境中,各“致因”单独或联合作用,会导致各类学术数据安全事件风险的产生。人的致因可以单独导致学术数据泄露、丢失、篡改的事件发生,物的致因可以单独导致学术数据丢失事件发生,学术数据滥用事件的发生需要人的致因和环境致因共同起作用,而环境致因在学术数据泄露和篡改事件中不是必要因素,只不过是增加了学术数据泄露或篡改事件发生的概率(见表2)。环境致因不会单独地、直接地造成学术数据安全事件,但是会将学术数据置于风险之中或与其他因素共同造成学术数据安全事件。在物的致因中,任一因素都可能导致学术数据安全事件,也可能将学术数据置于风险之中。在人的致因中,除了操作行为因素可能直接导致学术数据安全事件以外,安全意识、操作行为、管理行为、滥用行为等因素都可能将学术数据置于风险之中。总之,在云环境中,三大致因类型中的任何一种致因或两种及其以上的致因,都可能导致学术数据安全事件。


表2 典型学术数据安全事件的风险致因组合


整体而言,当前的云环境中数据安全研究似乎尚未找到恰当的理论支持,或者说学术数据安全问题没有在具体的学科体系中得到妥当的安放,导致当前相关研究处于碎片化阶段。尽管事故致因理论经常被应用于工业安全领域,但也出现了在信息安全事件中应用事故致因理论[42]的尝试。就学术数据安全事件的风险防控而言,也应该积极尝试拓展事故致因理论,或许能为云环境中学术数据安全事件致因理论的构建找到突破口。



参考文献



作者简介

文禹衡, 讲师、硕士生导师, 研究方向为数据安全与治理, jsjmyh@163.com;

戴文怡, 硕士生, 研究方向为数据安全与治理。


*原文载于《信息资源管理学报》2021年第3期,欢迎个人转发,公众号转载请联系后台。


* 引用格式

文禹衡, 戴文怡. 云环境中学术数据安全事件的风险致因及其检视——以事故致因理论为视角[J]. 信息资源管理学报, 2021, 11(3): 50-58.



往期 · 推荐

当期目录 | 2021年第3期

当期荐读 2021年第3期 • 专题前言 | 数据治理制度建设

当期荐读 2021年第3期 | 澳大利亚数据泄露通知制度及其启示

当期荐读 2021年第3期 | 国际个人数据跨境流动治理模式及我国借鉴研究

当期荐读 2021年第3期 | 欧美数据垄断的治理模式比较及对我国的借鉴研究



制版编辑 | 王阿凤

审核 | 于阿媛



长按识别二维码关注我们

信息资源管理学报

微信号

xxzyglxb



分享、在看与点赞

只要你点,我们就是胖友


继续滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存