华政学报 | 韩旭至 信息权利范畴的模糊性使用及其后果 ——基于对信息、数据混用的分析
信息权利范畴的模糊性使用及其后果
——基于对信息、数据混用的分析
作者简介
韩旭至 华东政法大学法律学院特聘副研究员,师资博士后
目 次
一、信息权利范畴的模糊性使用类型
二、模糊性使用的成因:信息与数据的多重面孔
三、模糊性使用的后果:理论与实践的双层危险
四、厘清信息权利范畴的策略选择
五、结语
摘要
信息权利范畴在制度规范、司法裁判与学术研究中常被模糊性使用,并形成了信息与数据并用、信息包含数据、数据包含信息三种类型。这种广泛的模糊性使用的内在原因包括多学科混杂的信息与数据理论、制度历史形成的法律术语差异、随时代变动的信息与数据概念三个方面。而这种模糊性使用的危险在于,其不仅将引发权利设定偏差,且会对法院保护信息权利、进行法律论证造成困扰。为更好地保护信息权利,必须明确信息侧重内容而数据侧重形式,其具有不同的法律特征,归属不同的权利客体,在一定条件下又存在动态转化的可能。
关键词
信息权利 信息 数据 个人信息 大数据
随着信息社会的到来,信息权利的研究逐渐深入,关于个人信息权、数据权、被遗忘权、数据可携带权、算法解释权等新型权利已涌现出一批优秀的学术成果。然而,关于信息权利核心范畴的信息与数据概念本身的研究,却长期受到法学界的忽视。法学学者通常只是在论述个人信息保护与数据权利时,附带提及信息与数据的关系。虽然,对信息法律界定的专门研究也少量存在,然而亦未能对信息与数据进行区分。
众多法学研究者甚至认为,信息与数据的区分无意义,或“仅仅在于不同的表述角度”,因此“约定俗成即可”。反观情报学与哲学领域,对此已形成一定规模的研究,尤其是“数据—信息—知识—智慧”的信息链理论颇具影响,但这些研究成果又无法直接为法学领域所采用。
在信息化、数字化的当今社会,信息权利范畴已在各个方面被广泛地模糊使用。这固然有信息、数据含义多样的客观原因,却必将对权利设定与裁判结果产生不良影响。本文由信息与数据的混用出发,探寻信息权利范畴模糊性使用的成因与后果,力求厘清信息与数据的法律含义,以期对信息权利的保护有所助益。
一、信息权利范畴的模糊性使用类型
信息权利范畴的模糊性使用指的是,信息权利中的概念被人为地混淆使用。其中最典型的便是信息、数据的混用。在法律语言中,信息与数据似一对孪生兄弟,让人难以辨别。信息与数据并用、信息包含数据、数据包含信息,是三种最为常见的模糊性使用类型,这三种类型又贯穿着制度规范、司法裁判与学术研究三个层次。
(一)信息与数据并用型
在制度规范层面,《国家信息化发展战略纲要》即并列使用“信息化”“大数据”的概念。更多时候,制度文本更是使用了“数据信息”或“信息数据”的概念。《电子商务法》第25条、《人类遗传资源管理条例》第24条、《废弃电器电子产品回收处理管理条例》第17条、《消耗臭氧层物质管理条例》第28条均使用了“数据信息”的概念,《志愿服务条例》第19条则使用了“信息数据”的概念。域外制度中,“数据讯息”(data message)的概念有时也被翻译为“数据信息”。如菲律宾《电子商务法》第5条d款、文莱《电子交易法》第2条第6款即被译作“数据信息”。
在司法裁判层面,“数据信息”的概念亦常被使用。在“阳光数据诉霸财数据案”中,法院指出“电子数据库的经济价值在于其数据信息的即时性”。在“新浪诉脉脉案”中,法院认为“在信息时代,数据信息资源已经成为重要的资源”。备受关注的“头腾大战”诉中禁令裁定也采用了“数据信息”的概念,并特别指出“网络环境下数据信息的传播范围广、速度快”。
在学术研究层面,认为信息与数据只存在语义之别的学者绝非少数。根据国际标准化组织的定义,信息是关于特定事物的知识,数据是该知识的表现形式,同时数据可被自动化处理。根据这一定义,许多学者承认,在语义上信息与数据是内容和形式/载体的关系,且与信息相比数据更多表现出“被机器设备自动化处理的特点”。然而,这些学者大多又同时认为,这种语义上的区别“并无实质意义”,或即使有一定的意义“也是非常有限的”。以个人信息与个人数据的关系为例,二者更是常被通用。具体的称谓使用,则取决于语言习惯的“约定俗成”。
(二)信息包含数据型
信息包含特定数据,即以数据解释信息。《环境保护税法》第15条第2款、《国际刑事司法协助法》第26条第5款、《监察法》第25条、《食品安全法》第17条、《人类遗传资源管理条例》第2条第3款采用了“数据等信息”或类似表述。从域外制度来看,美国《统一电子交易法》第2条第10款、俄罗斯《信息、信息技术和信息保护法》第2条第1款、澳大利亚《电子交易法》第5条在信息(information)的定义中亦采取了数据(data)的概念。
在司法裁判层面,在分析信息时可能会对数据进行考察。在侵害公民个人信息犯罪的案件中,即无疑不涉及数据层面的证据判断。如典型案例“张某、姚某侵犯公民个人信息案”“丁某侵犯公民个人信息案”“李某等侵犯公民个人信息案”中,嫌疑人的相关电子数据是认定其非法获取公民个人信息的核心证据之一。
在学术研究层面,有学者认为“信息的外延大于数据”。其认为,数据只是信息的电子化表现形式,信息还可通过传统媒介传递。也就是说,信息既可以指数据本身,也包括加工后的数据和不以电子形式呈现的资料。基于这种理解,在个人信息保护领域内,有学者指出,个人信息可包括个人数据。
(三)数据包含信息型
数据包含特定的信息,即以信息解释数据。《电子签名法》第2条第2款、《快递暂行条例》第34条,即以特定信息分别界定“数据电文”与“电子数据”的内涵。该使用方式在域外亦不少见,如从“数据保护指令”到《一般数据保护条例》(GDPR),欧盟一直认为“个人数据(personal data)”就是“与识别或可识别自然人相关的任何信息(any information)”。
在司法裁判层面,数据保护案件中,常常将相关信息纳入其中进行考量。在“阳光数据诉霸财数据案”中,法院认为“电子信息产品应属电子数据库”。在“淘宝诉美景案”中,法院更是通过对案涉数据产品中用户信息的合法性进行考察,以判定淘宝公司对相关数据产品享有合法权益。
在学术研究层面,有学者认为大数据赋予了数据新的内涵,数据也包括了内容层面的信息内涵,甚至“也是信息的代名词”。舍恩伯格即明确指出,“数据化意味着我们要从一切太阳底下的事物中汲取信息,甚至包括很多我们以前认为和‘信息’根本搭不上边的事情”。据此,这些学者认为,“大数据包含信息”,大数据网络安全也可涵摄信息安全的内容。
可见,信息权利范畴的模糊性使用绝非一个可以忽视的问题。三种类型的模糊性使用同时存在又相互冲突,已到了不得不正视的地步。事实上,至少从制度层面看,立法从未彻底放弃区分信息与数据,至少个人信息与数据的区分有明确的制度依据。《网络安全法》第76条第4款与第5款便分别对网络数据与个人信息作出界定。《民法总则》在立法过程中虽曾试图规定“数据信息”,但最终还是将个人信息与数据在第111条与第127条两个条文中分别进行规定。《刑法》也分别通过第253条之一与第285条规定“侵犯公民个人信息罪”与“非法获取计算机信息系统数据罪”。然而,这些区分既未能实现信息与数据的整体区分,亦无法解决三类型的模糊性使用困境,甚至还出现了在明确区分数据与个人信息的前提下模糊性使用信息权利范畴的现象。如《数据安全管理办法(征求意见稿)》,即试图以数据安全管理的名义规定信息管理的内容。为解决这一难题,需进一步对模糊性使用的成因进行考察。
二、模糊性使用的成因:信息与数据的多重面孔
信息权利范畴的模糊性使用的内在原因在于关于信息与数据的词义多变,相关定义与理论亦纷繁复杂。从学科背景上看,信息科学、哲学、情报学等学科对信息与数据均有不同的定义。从立法历史上看,欧美两地法律语言的客观差异又导致其分别选择了数据保护(Data Protection)与公平信息实践(Fair Information Practices)的术语。从语言词义的流变来看,时代的发展不断更新着信息与数据的内涵。由此,作为信息权利核心范畴的信息与数据便显得难以区分。
(一)多学科混杂的信息、数据理论
自信息科学诞生以来,对信息便存在不同角度的理解。从组织与有序程度的角度,信息论创始人香农将信息界定为不确定性的消除。在这个意义上,布里渊进一步借助物理学上“熵”的概念,将信息解释为“负熵”。从主客体交互的角度,控制论创始人维纳则认为,信息是人类与外部世界进行交流的内容,是与物质和能量并列的要素。在这一定义中,人是“信息客体”,信息的核心是交流的行动能力。 海德格尔亦认为,“信息是一个关系和参考的网络”。对此,弗洛里迪进一步提出“信息圈”的概念,认为信息能动者的互动将构成信息化环境。其认为,信息是“世界和它的智能居民之间的一种特殊关系或接口”。可见,在此意义上,“信息只在行动网络中产生意义”。
哲学上信息又存在本体论与认识论两个层次。前者是指事物的客观变化状态和方式,后者则是对该变化的认识和表达。也就是说,本体论意义的信息是客观的现象,而认识论上的信息则受认识主体主观能动性的制约。可见,从主客体交互角度认知的信息是认识论上的信息。而本体论上的信息则更接近于数据的含义。与之相对,对于数据的定义也有关系论与表征论之争。前者基于香农、弗洛里迪的理论认为,“信息=数据+意义”。而后者则以伍德瓦德为代表,认为数据本身就有意义,如科学数据、加工后的衍生数据本身即附带“意义”。因此,在表征论视角下,数据与信息没有显著差别。
在情报学上,立足于信息的生产和传递,情报学信息链理论提出了从数据到智慧的关系模型。其中,DIKW层级模型(又称知识金字塔)指出,数据、信息、知识、智慧呈金字塔式层次关系。实际上,这种关系也被列为箭头表示的链条结构。具体而言,从数据到智慧,依次呈现出意义与价值从低到高,可编程性由高到低,属性由客观到主观的关系。在信息链中,无疑数据是最为基础的要素,只有通过数据处理,数据才能具有明确的意义,方可成为更具价值的信息。也就是说,数据是信息的基础,信息可提炼出知识,知识又可产生智慧。
然而,也有情报学者认为,数据、信息、知识、智慧并非简单的链式关系,而是呈现出交叉、并列甚至包含等多种关系类型。很多时候,这些信息与数据的关系模型还相互矛盾和冲突。同样是基于信息链理论,有学者认为,金字塔结构下可“把数据看成是信息的一个子集”。其将信息理解为包括数据、算法在内的“处理手段、过程和结果的总和”。也有学者得出完全相反的结论,认为数据是符号,是一种事实描述,信息是对事物关系的理解,而数据又涵盖了信息。
诚如波特兰所指,数据与信息“相互交织、相互关联”。多学科混杂的信息、数据理论虽然在客观上深化了信息、数据的认知,但二者错综复杂的关系,又使其含义始终难以确定。不难发现,信息权利范畴的三种模糊性使用类型都可在上述信息与数据的理论中找到各自的依据。然而,这些理论研究却又始终不是从法律角度出发的,于法学研究而言意义有限。
(二)制度历史形成的法律术语差异
从法律角度出发,信息与数据的模糊性使用很大程度上源于欧美两地分别以不同的法律术语指称类似的法律制度。自1968年联合国国际人权会议首次提出数据保护的概念以后,欧洲国家和地区便先后通过了一系列数据保护法律,以保护个人数据。直到今日GDPR仍以数据保护的名义保护具有可识别性的“任何信息”。而美国则没有采取数据保护的概念,而是从隐私权理论中发展出信息隐私权理论,将个人信息控制权纳入隐私权的范畴。其于1973年更是提出了公平信息实践原则(FIPPs),并将该原则贯彻到各类隐私立法之中。由此,在法律语言上信息与数据产生了地域的差异。欧盟地区及受欧洲国家影响较大的地区均采取数据保护的称谓,而受美国影响较大的地区则采取了信息保护或隐私保护的称谓。
虽然数据保护与公平信息实践在内容上均关注个人信息保护问题,但数据与信息的语义差别还是对制度产生了一定影响,主要表现为以下两点。
第一,体现为对数据自动化处理的严格要求。在欧盟地区,数据保护仅适用于被“全部或部分自动化方式进行处理”或“构成或旨在构成档案系统的处理”的数据。一些未经处理的非格式化信息并不受数据保护机制的约束,如欧盟第29条工作组曾明确表示,生物样本在没有数据化提取收集之前不是个人数据。对此,GDPR第4条第14款即明确规定生物特征数据必须是经特定技术处理而得的数据。另外,虽然美国亦通过“信息处理系统”与“记录”的概念对信息予以限制,但日本《个人信息保护法》却将无形式要求的“个人资讯”与有形式要求的“个人资料”“保有个人资料”并列,分别予以规制。
第二,表现在以信息拓宽数据的内涵。虽然在词义上“数据强调形式,信息注重内容”,但欧盟已明确表示必须以信息界定个人数据的内涵,并通过解释信息的含义指出,个人信息包括主客观两方面的信息。与个人有关的意见、评估等带有主观色彩的信息也不能被排除在看似客观的数据含义之外。此外,随着时代的发展,数据规制本身的内涵也在不断拓展。除个人数据保护外,非个人数据也被纳入法律规制的范畴。如2018年欧盟便出台了《非个人数据自由流动框架》。
值得注意的是,对不同法域法律术语的翻译有时也会造成信息与数据概念的混淆。“数据讯息”(data message)便是美国及一些国家常用的术语。如前文所提,有些译者将之译作“数据信息”。该译文容易让人产生数据与信息概念等同且并用的理解。而实际上数据讯息专指电子商务领域中通过电子数据交换的方式传输的讯息,强调的是讯息的电子化传输方式。
(三)随时代变动的信息、数据概念
从时间维度上看,信息与数据的概念至少发生了三次转型。早在农业经济时代将信息等同于消息,数据等同于数据似无争议。在信息经济时代,随着计算机信息技术的出现,数据成了信息在计算机中的载体,信息和数据的概念产生了交叉。进入知识经济时代后,信息与数据在信息链中的链状转化关系则进一步受到重视。如今大数据时代中,信息与数据又逐渐趋同,“数据成为了网络空间内的资源主体”。
尤其是当今大数据的语境下,数据的结构和功能已发生了深刻的变革。我国《大数据发展行动纲要》即指出,大数据具有“容量大、类型多、存取速度快、应用价值高”(4V)的特征。大数据之下,“一切都被记录,一切都被分析”。一方面,“一切都被记录”指的是,“世间万物皆可数据化”,数据成了关键资源和生产力要素。 因此,信息也有被数据化替代的趋势。另一方面,“一切都被分析”指的是,数据的含义已与数据分析相结合。有学者即明确指出,大数据的重点不在于数据本身,而在于对大量数据的分析。 辅之以分析意义的数据,在含义上与信息更是难以看出差异。甚至在数据分析层面,已不再追求特定信息所蕴含的精确意义,呈现出全样本取代精确性、相关性取代因果性的全新特征。由此可见,经典的DIKW层级模型的结构相应也发生了改变。数据无须经由信息即可直接提炼出知识或智慧。此时,“数据不仅仅是数据,而成为一种符号甚至一种意义,一种象征”。数据与信息的交替使用也成了常态。
与之相对,信息与数据的法律内涵也发生了变化。在刑法领域,破坏计算机信息系统罪所对应的“信息—算力—设备”模型已被突破。大数据、云计算已使得数据超出了系统运行的范围。“传输数据”概念中的“目的性的、非公开的、仅发送者和接受者有支配权利”限定也受到了挑战。在民商经济领域,随着数据价值倍增,企业数据权利诉求被广泛提出,亦引发了“腾讯诉抖音案”“淘宝诉美景案”“新浪诉脉脉案”“大众点评诉百度案”等一系列重要案例。如前所述,这些数据保护案件中,法院又大多采取了模糊性使用的策略。
事实上,“数据—信息—知识—智慧”的转化必然是一个过程,而这一转化过程又必定会受技术的时代变迁所影响。很难以一个恒定的点概括这一运动的状态,或许便是问题症结之所在。而这一问题之所以能成为真正的问题又在于,信息权利范畴的模糊性使用将对法律产生切实的影响。
三、模糊性使用的后果:理论与实践的双层危险
信息权利范畴的重要意义在于,其对权利设定与裁判结果均有决定性影响。模糊性使用的后果即体现在这两个方面。于权利设定而言,模糊性使用将导致信息权利客体难以确定,信息权利设定出现偏差。于司法裁判而言,模糊性使用又导致了权利保护受限、法律论证矛盾的疑难问题。
(一)引发权利设定偏差
以个人信息权利为例,《网络安全法》第76条第5款虽界定了个人信息,但在具体解释与适用中其与数据模糊不清的关系,仍将对个人信息权利设定造成障碍。一方面,“以电子或者其他方式记录”并不能等同于自动化处理的数据形式。对于非索引式、不构成或旨在构成档案系统一部分的、不易于获取的数据,大多数国家均不将之纳入个人信息保护范畴。而这部分数据是否属于我国“其他方式记录”的信息尚不明确。另一方面,个人信息以识别性为特征,使其必须从内容层对信息作判断。当前,我国法中个人信息的内容判断能否延伸至以评价信息为代表的主观层面亦不清楚。在欧盟法上,恰是对个人数据定义中“任何信息”的概念进行解释,方才使主客观两方面的信息纳入其中。
从域外制度来看,模糊性使用亦广泛地影响着个人信息权利。虽然,基于数据是形式而信息是内容的认知,欧盟第29条工作组曾明确反对将生物样本视为个人数据,但英国众议院却认为,“生物样本被提取或保存的唯一理由就是其中含有信息……这些样本是被作为信息而非其他保存的……因此,同样的隐私原则应使用于这些样本”。此外,被遗忘权的争议也在一定程度上反映了模糊性使用的后果。在GDPR的立法过程中,尤其是2014年“谷歌诉西班牙数据保护局案”后,被遗忘权成了信息权利中的热点问题。然而,该新型权利本质上关注的是数据被删除而非信息被遗忘的问题。因此,在GDPR通过后,被遗忘权已被设定为第17条数据删除权括号中的部分。
又以数据权利为例,由于信息与数据的模糊性使用直接导致数据权与信息权的关系不明。非个人数据如何确权,更是一直未有定论。有学者主张,数据分为符号层的数据文件与内容层的数据信息,数据新型权利客体限于数据文件,而数据信息则属于知识产权、隐私权等传统权利的客体。相反,基于对信息实质意义的认可,有学者认为应该提倡具有实质意义的“法人信息权”。也有学者认为,数据与信息是“工具和本体的关系”,而物理技术层面的数据本身并非权利客体,数据交易实为数据服务合同关系。
此外,大数据与数据权利的关系亦不明确。若不能判断大数据究竟指海量数据汇集而成的数据集合,还是包含对该集合进行数据挖掘、数据分析而产生的衍生数据,实际上便无法判断大数据所对应的权利。单纯的数据集合,实难有大小区分之必要。而具有内容分析属性的衍生数据则可能产生新型的财产性权益。有观点即认为,企业数据权对应的客体应为衍生数据。可见,基于信息权利范畴的不同认知,数据权利设定亦差异巨大。
(二)导致司法裁判难题
一方面,是权利保护维度上的难题。权利设定的偏差相应地为司法机关带来了众多疑难问题。典型的如面对层出不穷的数据权利诉求,法院通常只能采取激活《反不正当竞争法》第2条释义性条款作为不正当竞争一般条款的方式进行回应。然而,该方式不仅提高了数据权利保护门槛,还具有极大的不确定性。在“新浪诉脉脉案”中,二审法院即在援引最高人民法院“海带配额纠纷再审案”的基础上为互联网行业适用《反不正当竞争法》一般条款设定了六个要件。事实上,这一保护方式极其有限,无法规制不构成竞争关系、未破坏竞争秩序的数据与信息的盗用行为。在“大众点评诉百度案”中,法院即认为若百度能“审慎地少量使用来自其他网站的点评信息”则不会构成侵权。不正当竞争的实质并非数据的盗用,而是未能将相关数据的使用“控制在合理范围内”及“造成市场替代的后果”。
另一方面,则是法律论证维度上的难题。模糊性使用将直接影响法律论证的质量,使裁判说理出现问题。如“淘宝诉美景案”中,法院一方面认为信息与数据是内容与形式的关系,另一方面却指出大数据产品的价值在于用户信息内容,让人始终无法理解大数据究竟是数据还是信息。此外,该案中法院还将原始数据与衍生数据相区分,认为受保护的大数据产品数据属衍生数据。且不论数据产品亦含有原始数据部分,衍生数据是否就等同于信息,法院所承认的具有“竞争法意义上的财产权益”客体是否限于信息均不清楚。
实际上,若不对信息与数据进行区分,裁判说理便难以正常进行。虽然模糊性使用普遍存在,但对相关裁判文书分析可知,法院在裁判论证过程中,对信息与数据使用的侧重不同已有所展现。尤其是在论证与相关内容的对应关系时,法院多采取了信息概念。在“大众点评诉爱帮案”与“大众点评诉百度案”中法院即直接对点评内容进行考察,从相关内容的替代性角度判断相关信息使用是否构成市场替代。“新浪诉脉脉案”中,信息术语也被用于描述与新浪微博的内在对应关系。在“抖音诉刷宝案”中,法院在判断相关注册登录时间、授权账户等内容证据时,也采取了信息的术语。然而,如前文所分析,这些案件中又同时存在不同程度与类型的信息权利范畴模糊性使用问题,以致让人难以解读法院借助于信息与数据概念的说理逻辑。
四、厘清信息权利范畴的策略选择
为更好地保护信息权利,立法者应坚持信息与数据区分的策略选择。本文建议,采取国际标准化组织的定义,明确信息侧重内容而数据侧重形式,在法律概念与法律特征上予以区分。在宏观静态层面,信息与数据应归属不同的权利客体。在微观静态层面,信息与数据在一定条件下又存在动态转化的可能。
(一)概念特征的内容/形式区分
法律上的信息与数据应采取国际标准化组织的定义,即信息是“在特定语境中具有特定意义的关于客体的知识,如事实、事件、事物、过程或思想包括理念”;数据是“信息的形式化表现,可展现其背后的意义,用于沟通、含义展示或处理”。简单而言,信息展现的是内容含义,而数据是这种内容的表现形式及载体。
虽然,信息与数据存在多种理论,但对信息包含内容、数据体现形式的理解而言,确存在共通之处。信息的本体论与认识论之争并非在于信息能否体现内容,而在于相关内容究竟是客观存在还是依赖于主体的理解。数据的关系论与表征论之争也都承认数据是一种形式载体,但对数据本身是否具有意义认识不一。情报学上数据与信息的各种关系理论,亦是从香农与维纳的经典理论出发,从未否认信息/数据在内容/形式上的特性。信息链理论即表明,知识回答“如何/为何”的问题,信息回答“何时/何处/何人/何事”的问题,而数据则没有回答问题。从数据到信息是认识的深化过程。罗素即指出,数据“不包括在考察之后凭借论证和推理才得到的东西”。德鲁克亦认为,信息与数据相比具有相关性和目的性。
从法律术语本身来看,信息与数据虽常被模糊性使用,但在特定语境下亦反映出内容/形式的区分。如前文所分析的多起案件中,法院在论述内容相关的概念时亦不自觉地采用了信息的术语。此外,从个人信息与个人数据的制度发展来看更是如此。虽然个人信息与个人数据的概念走向融合,但其融合的条件即在于一方面以数据的自动化形式约束个人信息的外在表现,另一方面又以信息的内容要素拓宽个人数据的固有内涵。
必须明确,信息与数据属于不同的法律概念,具有不同的法律特征。参照莱斯格对网络通信规制的划分方式,可分别在物理层、代码层、内容层中探讨信息与数据的法律地位。其中,物理层属于信息传播的底层设备,可对应法律中的信息基础设施。代码层是设备上运行的代码,以0和1组合而成的比特形式存在,是信息的形式与载体,可对应法律中的数据。内容层则体现为代码符号所表达的具体内容,具有一定的意义,可对应法律中的信息。
具体而言,信息与数据均有广泛传播的可能,也容易被复制,且具有一定的价值,具有可传播性、可复制性、价值性的共同特征。信息与数据相比,由于其是具体内容的表达,具有固定性、独立性、过程性、知识性的特性。也就是说,信息固定在数据载体之上,但又独立于载体,可以非电子化的文字、图像方式传播,同时亦反映出特定内容,体现了人们的认知过程,能提炼出特定知识。数据与信息相比,由于其是信息的形式载体,具有电子性、原始性的特性。即数据的生成、处理、传输、储存都需要运用电子手段,依附于存储设备、终端、服务器等基础设施,从原始数据到信息必须通过代码和程序的加工处理。
根据信息与数据的法律概念与法律特征,应对信息与数据的模糊性使用予以纠正。在制度文本未及纠正之前,亦可进行解释适用。首先,法律文本中的“数据信息”或“信息数据”实际均指信息与数据。如《电子商务法》第25条要求电子商务经营者依法向有关部门提供“电子商务数据信息”,实际是试图同时涵盖电子、原始的数据与能体现内容、过程、知识的信息。其次,“数据等信息”所指亦是信息与数据。如《监察法》第25条中的“电子数据等信息”在条文中的作用便是指出监察机关对嫌疑人的数据和信息均有权采取调取、查封、扣押措施。再次,“数据电文”强调的是以电子形式发送的信息内容。如《电子签名法》第2条中的“数据电文”即重在作为信息的“电文”,数据只是“电文”的修饰,用于表示信息的电子化形式。最后,“用户信息等电子数据”应解释为数据而非信息。如《快递暂行条例》第34条目的在于通过数据管理实现信息安全。必须明确,电子数据并不包含个人信息,只是电子数据可以作为个人信息的载体,反映的具体信息内容可能包含个人信息。
(二)宏观静态的权利客体差异
从宏观静态的角度,信息与数据指向不同的权利客体。根据《民法总则》第111条、第127条的体系结构可知,个人信息与数据分别指向人格权与财产权。也就是说,以个人信息为代表的内容层信息指向人格权,其中权利客体是个人信息中蕴含的人格利益。这种具有人格利益的信息亦不排斥商品化利用,亦具有一定的财产属性。其他非个人信息更可直接成为财产权的客体。如为知识产权所保护的著作、专利、商业秘密信息等。此外,代码层的数据亦是财产权客体,可通过数据新型权利予以保护。由此出发,可进一步对权利设定中的具体问题进行解答。
就作为人格权的个人信息权利而言,前述记录形式、主观信息、生物样本、被遗忘权等问题均可通过法律解释方法解决。首先,通过对记录进行解释,可为个人信息设置形式要素,将记录限缩解释为“在当下查阅与处理是合理的切实可行的”记录,而无须引入数据的概念。其次,通过对主观信息进行分析可知,信息的内容层面并不要求客观真实,只要求具有识别性,评价信息若具有识别性当然属于个人信息。再次,生物样本本身应属于物理层的内容,只有当数据被提取后进行分析,以获得具有识别性的内容特征时,方才属于个人信息。最后,被遗忘权本质上属于信息内容的隐匿、删除,往往无须销毁代码层数据即可完成,只需要断开连接或进行模糊化处理,便可在内容层上达到这一效果,而不会造成信息与数据的模糊性使用。
就作为财产权的数据权利而言,有且只有合法的数据方为财产权客体。若数据处理违反个人信息保护规定,则无法获得法律保护。数据脱敏、数据匿名、数据加密等具体的数据处理技术有助于实现数据的合法性。数据合法实质上主要是对数据中体现的个人信息进行规制,无关于代码层的数据本身。如司法实务中法院通常即采取“合法、正当、必要的原则”,对个人信息获取渠道、使用目的、方式和范围进行考察。正由于合法性考察的是信息内容,而非数据代码,因此必须排除技术中立的抗辩,反映出特定内容的信息处理不存在中立免责的理由。技术中立的价值应被重新评估。此外,数据作为绝对权客体并不排斥与数据相关的相对权。数据服务合同作为一种债的关系亦应得到重视。
根据信息与数据的权利客体差异,可明确个案中所涉及的权利类型。以前述个案为例,“阳光数据诉霸财数据案”虽涉及“电子数据库”的保护,但实际审理的是“电子信息”的内容是否合法,因此法院考察的亦是信息内容是否符合知识产权保护的独创性要求。此外,“大众点评诉爱帮案”“大众点评诉百度案”“新浪诉脉脉案”等案件均涉及数据的财产权益。虽然,由于数据新型权利暂未确立,这些案件均采取了竞争法的保护方式,但无一不指向数据的财产属性。同时,在判断数据是否合法之时,法院均对数据所承载的个人信息进行判断。如“新浪诉脉脉案”中法院即提出“‘用户授权’+‘平台授权’+‘用户授权’的三重授权原则”,通过“知情同意”的个人信息保护框架,以考察数据中所蕴含的个人信息是否符合人格权保护要求。唯有在内容层上符合个人信息的人格权保护要求,代码层上的数据方可获得合法的财产权益。
(三)微观动态的内在层次转化
从微观动态的角度,信息与数据又有动态转化的可能。一方面,信息能逆向转化为数据。如个人信息在匿名化处理后,已不再体现可识别特定个人的信息内容,可成为数据权利的客体。另一方面,在更多的时候,数据将转化为信息。尤其是当前大数据语境下,海量数据汇集已与全样本的数据分析相结合,大数据实质上已部分转化为信息。信息链理论亦表明,数据可提炼出信息,信息是“经加工的数据”。因此,应对原始数据与衍生数据进行区分。作为数据分析产品的衍生数据在法律属性上应按信息进行对待。如对大数据下“全景敞视式”监控所带来的人格权威胁关注的即是对其所展现特定信息内容的忧虑。
然而,单纯以传统的信息保护手段,通过对衍生数据进行内容判断而决定其能否受到保护存在一定的局限。衍生数据亦可能面临著作权主体不明、独创性不显著等问题而无法受到法律保护。即便是以欧盟《数据库保护指令》进行考察,衍生数据也必须符合原创性结构化且制作人付出了实质性投入的要件。此外,大数据常常表现为原始数据与衍生数据的组合,机械地将二者区分保护亦不易于操作。因此,为更好地保护大数据的价值,数据新型权利的构建宜将衍生数据这种特殊的信息纳入其中进行规范。也就是说,虽然衍生数据属于信息,但由于其与数据关系紧密,具有巨大价值,可参照数据进行保护。虽然,大数据中同时纳入了信息与数据范畴,但绝不意味着在大数据语境下二者可模糊性使用。尤其是在法律论证过程中,区分衍生数据与原始数据,对其中涉及的个人信息人格权保护、衍生数据可能符合的知识产权保护、数据合法性要件判断等均有重要价值。
根据信息与数据的动态转化模型,可对大数据权益纠纷进行分析。以“淘宝诉美景案”为例,案涉大数据产品为衍生数据,无疑已转化为信息,但亦可循现有的数据保护路径,依竞争法获得救济。在具体的权益保护判断中,通过原始数据与衍生数据的区分,借助数据与信息两个维度,可判断大数据产品的合法性。在数据层面,至少涉及原始数据的收集、处理、存储是否符合法律规定的问题。这一问题将直接影响从中所提取信息的合法性。在信息层面,又涉及衍生数据能否识别特定个人的问题。值得注意的是,虽然一般的个人信息可通过匿名转化为数据,但由于大数据的内容分析属性,该案中匿名化的衍生数据仍属信息的范畴。依此分析逻辑,方能理解为何案涉大数据产品具有“竞争法意义上的财产权益”,并最终解决法院判决中大数据内容价值解释不清、原始数据地位不明等法律论证问题。
五、结语
法律语言应是确定的。对信息、数据混用的习以为常,本身便是不正常的。本文发现,信息权利范畴的模糊性使用存在内在矛盾,无法自圆其说。信息与数据并用、信息包含数据、数据包含信息三种模糊性使用类型之间呈现出互相排斥的关系。客观而言,正是信息与数据词义多变、理论复杂造就了信息与数据的模糊性使用。当前,这一模糊性使用已对信息权利设定与司法保护带来了切实的危险,厘清信息与数据并非学理上的无谓争议,已成为一个亟须解答的法律问题。
诚然,厘清信息权利范畴并在此基础上设计信息权利,是一项浩大的工程。马克思指出,“法律应该以社会为基础”。随着社会的发展,新型权利必然处于不断的变动与发展之中。因此,笔者并未试图为信息权利框定一个具体框架,仅力图对作为信息权利核心范畴的信息与数据作出区分,即明确信息侧重内容而数据侧重形式,在宏观静态的层面将之分别归属不同的权利客体,在微观动态的层面又承认其存在动态转化的可能。通过这一框架,为解决模糊性使用的乱状提供一种可行的策略选择。
(责任编辑:陆宇峰)
(推送编辑:潘佳妮)
本文原载于《华东政法大学学报》2020年第1期。编辑部在线投稿系统已更新,欢迎学界同仁登录journal.ecupl.edu.cn惠赐大作!