许瀚文等|美国数据权利研究的综述——基于Citespace的文献计量分析
上海政法学院人工智能法学院学生
要目
一、美国数据权利研究的统计与分析二、美国数据权利研究的重点和发展趋势三、数据权利目前研究的观点及成果总结四、美国数据权利研究的评述及其对中国的启示数据权利涉及个人信息、隐私保护、政府信息披露等方面。本文运用Citespace可视化分析软件和定性分析方法,以美国数据权利为切入点,对CNKI数据库的中文文献和WOS数据库中的英文文献共计931篇进行统计分析,从发文趋势、期刊分布、机构分布、高被引文献和高频关键词等内容进行研究,分析美国数据权利领域研究状况。进而,对分析结果归纳、总结与评价。经研究发现,美国数据权利研究涉及范围广泛、理论层面与实践层面并重、数据权利立法的连续性和灵活性较好等特点,对中国做好数据权利研究具有启发意义。
大数据时代,数据在日常生活中发挥着不可或缺的作用。数据权不仅仅是一项源于隐私权的人格权,在其逐渐成为一种生产手段的一过程中,数据权正逐渐从一项抽象的人格权转变为一项综合权利。从当前世界各国立法实践来看,对于数据权利的立法的研究仍处于起步阶段,本文将以美国数据权利为研究对象,基于文献计量软件对中英文文献的分析结果,对个人信息、隐私权、信息披露、政府信息公开等角度进行对以往研究进行梳理分析。
一、美国数据权利研究的统计与分析
数据权利的研究大多是规范性研究,运用文献计量方法从浩如烟海的研究文献中寻找美国数据权利研究的重点、热点,可以有效把握美国数据权利研究的学术版图、发展脉络和趋势,总结分析既有研究的成就、贡献与不足,对美国数据权利的研究具有十分重要的意义。本文所涉及的中文数据源于中国知网(CNKI),而英文数据则源于Web of Science(WOS)。以中英文数据库中所采集的纯文本数据为基础,运行Citespace软件,可视化展示了美国数据权利研究的热点和发展趋势。通过对共现关键词和主要聚类的研究,结合定性分析及定量分析的方法,尽可能全面地梳理美国数据及数据权利研究的脉络。
图1展示了CNKI中与美国数据权利相关的期刊文献的文章数量。从可查到的最早的关联隐私权利、个人信息的文献的时间点至今,有近50年跨度。美国的数据权利相关的研究文献的发文量呈现出了一定的规律性,2000年开始,发文量逐年递增,而在2013年达到了峰值,在之后保持着较高的发文量,并在2017年和2019年两个时间节点上再次上升至峰值。
发文数量及其所涉及的学科随时间变化的关系,一定程度上可以反映研究课题在一定时期内学术研究的活跃程度,并大致地揭示学科发展的特点。世纪交替前后,美国多个领域颁布了数据保护和信息隐私相关的法律,其中包括《健康保险流通责任法》(1996年)、《金融服务现代化法》(1999年)、《儿童在线隐私保护法》(2000年)等。一系列针对现代信息权利和数据权利的立法实施后,2000年这一时间点即作为事实上美国数据权利和信息权利研究的分水岭。2013年6月,爱德华·斯诺登曝光了NSA(美国国家安全局)的秘密监控项目。数据权利和信息隐私的争议迎来了新的转折点,涉及该研究领域的论文数量激增。数据权利的研究正处于巨大的发展阶段。2018年3月,脸书(Facebook)被揭露大范围泄露用户信息。2018年5月,欧盟颁布《通用数据保护条例》(GDPR)。大事件的广泛影响推动了美国对数据与隐私安全立法的新一轮探索。
总体而言,美国数据权利相关研究的年度发文量,在2000年-2021年间爆发式增长,但仍表现为不规则的波动状态。而这一趋势相对应的学科发展的特点,则解读为学科蓬勃发展,但仍未成熟。美国数据权利的相关研究仍存在较大的发展空间。
同样,在英文文献的分析中,年度发文量的时间变成也呈现出相似性。在图2中,发文量自1999年后保持不规则的递增趋势,在2013年之后保持着较高的发文量,学术研究高度活跃。总体而言,国际学者对于美国数据权利的相关研究亦存在较大空白。
二、美国数据权利研究的重点和发展趋势
根据年度发文量对检索文献进行粗略统计与分析,是从宏观视角来把握美国数据权利相关研究在过去数十年里的发展与变化。可以肯定的是,宏观视角并不能准确地抓住学术研究的焦点。通过Citespace软件对文献关键词的可视化分析,一方面提供了更精准把握学科发展脉络的视角,另一方面也简化了寻找美国数据权利相关研究热点的过程。
经由Citespacce所呈现的关键词可视化图谱,通过节点和线条的形式表现关键词的分布及其相互之间的联系。节点的大小和线条的浓淡表示关键词的出现频率和关系的紧密程度。圆形节点越大,关键词出现的频率越高,线条的颜色越重,连接就越紧密。
将检索数据输入Citespace软件,选择“Keyword”进行分析,调整参数,精简网络,得到中文文献的关键词图谱分析(见图3),同时总结了入选论文出现频次高于10次的前15个高频关键词(见表1)。
通过同样的方式得到英文文献的关键词图谱分析(见图4),同时总结了入选论文出现频次高于10次的前15个高频关键词(见表2)。
由于采集自WOS处的文献数据经过了“法学”学科的搜索限缩,在高频关键词的分析上应当是对中文文献关键词图谱分析的补充。根据图4所示,除去“美国”这一研究范围的关键词,美国数据权利研究的重要节点有信息披露、信息安全、信息公开、隐私保护、隐私权、健康信息、个人信息和政府信息公开等。将图谱的量化分析展示如表1及表2,综合来看,又以信息披露、信息安全和隐私保护三个关键词的频次最高。当然,需要注意的是,关键词的频次与表中另一的参数“中心性”并不具有严格的相关性。“中心性”指代关键词在一定时期的集中性,换言之,高中心性的关键词,如信息披露在某一特定时期成为学界研究的热点。当然,关键词整体的中心性并不高,说明目前美国数据权利的研究较为分散,美国数据权利的相关研究仍处在发展阶段。
图5为基于CNKI检索文献的研究热点的聚类共现分析。由图可以看出,Citspace将美国数据及数据权利研究聚为8类,分别为#0隐私保护、#1信息披露、#2政府信息、#3信息安全、#4可信计算机、#5《美联港安全协议》、#6关联交易和#7隐私权法。
图6为基于WOS检索文献的研究热点的聚类共现分析。由图可以看出,Citspace V将美国数据及数据权利研究聚为8类,分别为#0 data protection;#1 information privacy;#2 managing online identity;#3 amendment;#4 surveillance society;#5 citation practice;#6 health care worker;#7 design。
突现关键词信息展现了不同时期学术界对某一主题的研究情况,图7和图8分别展示了中英文文献对美国数据权利研究的高突现性关键词演进情况,可以看出不同时间有不同的关键词,这种变化呈现一定的阶段性,但并不十分明显。
图7是以时间线为坐标轴对高突现性关键词演进情况。2000年-2002年突现关键词比较集中,几乎所有的聚类都在这一时间段有集中的研究成果。而2003年-2005年信息披露和政府信息这两个方向的研究最为集中,是这一时间段的研究热点。世纪之初的美国针对公共卫生和金融领域的信息隐私的大量立法,引起了学界对美国数据权利的相关研究。2003年-2005年,与证券市场相关联的信息披露和政府信息两个研究方向集中出现,则又与我国加入WTO,与世界的联系加深,相关问题频现有关。2013年-2016年,这一时期,众多聚类较高频率地集中出现,主要的突现关键词有信息安全、保护政策、隐私权保护、信息自决权、美国联邦修正案和国土安全部等。“安全”与“保护”两词的高频出现,与爱德华·斯诺登曝光美国国土安全部监听全球的事件不无关系,丑闻的揭露引发了学界新一波研究美国数据权利的热潮。2019年-2021年,隐私保护和《美欧安全港协议》这两大聚类所包含的关键词出现较多,主要有健康信息、《通用数据保护条例》(GDPR)、个人信息权利化和《欧美隐私盾协议》等,这则与欧盟颁布GDPR,美国调整与欧盟数据相关的协议,并开展美国国内新一轮数据权利立法有关。总的来看,美国数据权利的学术研究紧密结合当前经济社会发展实际,虽然在不同时期相关研究具有不同的重点,但是与国际环境、社会舆论、立法活动紧密联系。
图8呈现了英文文献以时间线为坐标轴对高突现性关键词演进情况。基于cnki文献中突现关键词的演变分析,突现关键词集中在2013-2021年期间。法学界对于美国数据权利的理论研究与社会发展实际紧密结合。美国数据权利的相关研究具有明显的时效性和实践性。
三、数据权利目前研究的观点及成果总结
基于Citespace软件对美国数据权利研究热点的可视化分析,综合中英文关键词聚类图谱,合并研究所涉及内容较为相近的聚类后,梳理出六个关键词聚类,作为进一步具体总结美国数据权利目前研究的观点及成果的方向。在涵盖热点,把握重点,突出焦点的原则下,依照各个不同的聚类,对美国数据权利研究进行了有序的梳理。
作为隐私权法起步较早的国家之一,美国与1974年颁布的《隐私权法》被当作美国隐私权保护的基本法。而在之后的十年里陆陆续续又出台一系列的有关隐私权保护的相关法律法规,尤其体现在网络电子领域当中,1986年美国国会通过的《联邦电子通讯隐私权法案》中就规定了关于电子隐私数据的各项保护规制,1997年《全球电子商务发展框架》报告里提到了将隐私权法的保护作为一项基本原则并由此衍生出四种具体原则,分别是告知原则、选择权原则、渠道参与原则和安全与完整原则。告知原则作为具体原则之一,是指政府或企业在收集个人信息时,应当将收集个人信息的情况告知公民,否则公民将无法决定是否以及在多大程度上对其个人信息进行充分知情的披露。如果在没有充分知情的情况下收集信息,这种收集信息的行为可能被认为是不公平的,在没有知情的情况下收集信息侵犯了自主拥有和处置个人信息的权利,即公民在互联网上的隐私权。公民的选择权是指公民完全有权决定是否同意使用某种个人信息,特别是信息的二次使用。而渠道与参与原则意味着公民有权获取政府和公司收集的相关个人信息,有权质疑信息的准确性和完整性安全和完整性原则意味着政府和企业应采取某些行政和技术措施,防止未经授权访问、销毁、披露和使用内部信息。
由于上述原则的存在,数十年来美国联邦贸易委员会(FTC),都仅仅依靠其监管不公平贸易行为的权力以及特定法规和国际协议赋予它的权力来管理隐私和数据安全。因而类似于FTC这样的负有隐私保护权力的机构,其隐私保护的范围就成了学者研究的热点,过于宽泛的隐私范围会限制公民的隐私自由,而有限的管理范围则又无法保证这一权力的良好实施。在实践案例中,美国温德姆集团(Wyndham Worldwide Corp)和美国LabMD公司就对联邦贸易委员会保护数据的权力提出过挑战。但与普遍认为的,FTC的隐私法学理论内涵薄弱,它仅仅专注于执行隐私承诺不同,深入研究FTC根部判例总结的一些基本原则后就会发现,FTC对于隐私保护的学理研究深厚,并有效地制定了一些基本的隐私保护措施。这一现实成果说明建立一个健全的隐私监管制度的基础是存在的。
美国对于隐私的保护,是处于一种分散立法的模式。美国关于个人隐私的法律保护历史悠久并且伴随着政府数据开放运动与时俱进。1974年制定的《隐私法》是美国个人隐私保护上的一个里程碑式的事件。在这之后的立法中,纵向上,美国采取联邦、州、地方规制三层立法;横向上,美国采用将个人隐私条款编入到各个不同领域的成文法中,从而建立了极为发达的隐私保护法律体系。2013年后,大数据时代的隐私保护成了立法工作的重中之重。虽然美国没有单独的,全面的法律来规范个人数据的收集和使用。但是,通过在多个领域对于数据信息的立法规制,使其形成了一个较为完整的法律体系,较好地处理了隐私保护问题。
与此同时,美国法律界对隐私的定义也在不断变化。特别是,最高法院在其“卡兹诉美国案”中界定了“合理隐私预期”,界定了第四修正案下搜查的含义,并采用了公开披露原则、冒险原则等,解释了标准的主观和客观要素。使政府对于公民隐私的干预形成了标准。有利于公民隐私权保护法律制度的发展和完善。
综合政府信息相关的研究论文,学界主要探讨政府信息公开方面的矛盾。
不同学者的观点是相似的。1966年颁布的《信息公开法》被认为是美国现代意义上的政府信息公开制度的开端。该法案明确了公众要求联邦机构提供信息的权利,以及政府回应公众要求的义务。1974年颁布的《隐私权法》是对信息自由法的重要补充。其为政府公开信息过程中,涉及的个人有关信息提供了保护。1976年,美国制定《阳光下的政府法》。法律规定,合议行政部门的会议必须公开举行,公众有权了解诉讼程序,并有权获得信息和文件。这三部法律是早期美国进行政府信息公开的法律基础。随后到1996年,为适应电子信息时代的到来,美国国会通过了《电子信息自由法修正案》,这是对《信息公开法》做的顺应时代的调整与完善。该法案要求政府机关需要以电子数据的方式,向更公众公开政府信息,以方便回应公众提出的申请。2007年的《开放政府法》首次明确了政府信息的公开范围。
在美国,有专门的政府数据访问部门,主要由信息政策办公室和总务管理局管理。总务局交由其下属机构市民服务及创新科技办公室,为政府资料库建立及维持一个综合开放平台。这个平台是美国政府数据公开的综合网站。它不仅发布原始数据,还向公众提供数据分析工具和格式转换工具。美国于2012年和2014年分别发布了《数字化政府政策》和《美国数据开放行动计划》。这两个政策极大丰富了政府数据的公开形式,并且对数据开放工作进行了整合和完善,有效提高了数据的质量。
囊括于该聚类下的文献,中文文献方面主要涉及美国资本市场、上市公司企业、证券市场的信息披露,而英文文献则主要将视线放在医疗保健领域的信息披露。
美国的信息披露制度是在1929-1933年的经济危机后建立起来的。1933年,美国国会通过了《证券法》,并于1934年通过《证券交易法》,成立了美国联邦证券交易委员会(SEC)。这奠定了证券市场信息披露法律制度的基础。20世纪六七十年代,经济形势的不稳定以及各种新时期法律的出台,SEC逐渐改变了信息披露的发展方向。到了20世纪80年代,SEC逐步建立了“总和披露”模式和“框架注册”机制,使信息披露更加自由、灵活,同时也更加注重效率,提高了披露的效果。20世纪九十年代后,由于信息技术的快速发展以及互联网的影响,SEC逐步建立了网络化下的信息披露制度。SEC通过出台各种规范和规则,进一步提高了信息披露的时效性与准确性。
由于证券市场的信息不完全和不对称问题,因此信息披露始终处于一个非常重要的地位。同时,对于信息披露的监管,是完善信息披露制度的重中之重。从历史上看,信息披露的监管方式主要有:自律监管、政府监管、第三方监管。有学者在这方面也指出,严密完善的法律制度及成立SEC所带来的严谨详尽的披露规则以及严厉明确的法律约束,是美国资本市场发展的重要保障。
此聚类检索中,涉及了金融(银行)信息保护制度和信息安全法律。在金融(银行)信息保护制度上,有学者提到,美国权威性的观点认为银行对客户的保密义务应当及于四个方面:第一,业务往来时客户提供给银行的个人信息,包括姓名、住址、电话号码以及个人收入状况等;第二,客户的账户信息,包括账户上的存取款记录、资金来源和去向以及信用卡情况等;第三,客户的交易信息,包括交易记录、交易金额、购物信息等;第四,客户的衍生信息,这是指在对客户的金融信息进行分析的基础上产生的个人主观信息,如个人的交易习惯、消费偏好等。金融隐私权兼具人格权和财产权双重属性,其复杂性使金融隐私和金融信息变得难以区分。从而使美国的政府知情与金融信息披露产生冲突。面对两者冲突,美国采用分散立法的方式,先后颁布了《银行保密法》《隐私权法》等一系列法律,提出了公共利益优先原则、权利协调原则以及最大限度地保护人格尊严原则,有效缓和和制约了这对矛盾。隐私权已经是一个处于较高阶位的权利,立法对个人隐私权都有着详细的规定与保护。
《美欧安全港协议》是美国对于个人信息的重视以及欧盟1998年《数据保护指令》生效的共同结果,特别是在2018年欧盟颁布的《通用数据保护条例》的影响下,其包括了七大原则,分别为:知情原则、同意原则、向第三方转移原则、安全原则、资料品质原则、参与原则、救济原则。有学者指出,《美欧安全港协议》是当前美国和欧洲在个人信息保护方面立法规范和原则的综合,也是当前两大信息保护立法体系的融合。这是一种跨境个人信息保护的新方向。
四、美国数据权利研究的评述及其对中国的启示
基于Citespace可视化文献计量分析,对美国数据权利研究进行了较为全面的梳理。可以看出,美国率先涉足数据权利和信息权利的研究领域,而后欧盟又在数据权利立法领域赶超美国,而随着全球各国不断重视信息保护,“数据权利研究已然突破了单一的地域限制,成为一个重要的全球议题”。而近年来,我国与数据权利息息相关的“数据交易”“数据跨境流通”等议题不断凸显,国内对于个人信息保护、国家数据安全等诉求在逐渐加强。在梳理美国数据权利研究的基础上,总结对我国的启示。
美国对于数据与数据权利的相关方面研究发文量逐年递增并且在这一领域所涉及的分析样本类别有了很大程度的提高以及细化,从最开始信息安全和隐私权,逐渐过渡到如今的隐私保护、信息披露、可信计算机、数据主权与关联交易,数据主体也从个人扩充到政府,政府信息公开制度相关方面的立法与研究逐渐深入,政府信息数据的公开不单单面向公众角度深入研究,更是在信息采集、联邦登记制度等数据获取端进行管控和研究,大大提高了政府信息公开制度全程的合法化与可信化。
当前国内个人信息保护、数据安全等领域的法律尚未出台的情况下,在数据层面上与域外的交互以及个人数据跨境流动合作存在着十分严峻的考验,在2012年12月28日全国人民代表大会常务委员会通过的《关于加强网络信息保护的决定》中,虽然将网络活动中的数据收集者以及提供者的各种要求加以规制,但在个人信息合法使用的层面上未能作出详细的规制,导致个人信息能否被作为财产进行交易等情况仍然存在法律空白。民法典第111条规定了“自然人的个人信息受法人保护”,但仍需要对个人信息保护的具体问题进行明确规定。
比如,网络安全法(草案二审稿)中第35条涉及的数据本地存留机制是我国为数不多的在立法层面上的规制。域外的“安全港机制”经验,可以辅助解决了体系化数据跨境流通管理机制的问题,通过鼓励业界根据该项法律条文的立法原则自行拟定可操作性的实施细则,提高法律与制度的明确性和灵活性。我国可以在立法层面上建立起技术与监管机制,结合我国国情,进一步推进个人信息保护与数据安全性保护,同步推出监管机制使得信息保护全过程合法化、透明化。
往期精彩回顾
康琳|APP用户个人信息安全问题研究——以6款相机类APP为研究对象
陈淇华|个人信息权与隐私权的关系——论个人信息包含说的科学性
刘旭峰|数据搜索与个人信息:规范表达与法律保护
刘益欣|国家机关处理个人信息中告知同意规则的排除适用
连雪晴|人工智能时代美国个人数据保护研究
赵艺|我国数据权利证成之要件反思
上海市法学会官网
http://www.sls.org.cn