查看原文
其他

苏今:大数据时代信息集合上的财产性权利之赋权基础


点 击 蓝 字 

 欢 迎 关 注 


大数据时代下,对数据、信息的概念及其相互之间关系的明确具有重要的法学研究价值。这种价值不仅仅是在概念的明晰上,更重要的是通过对数据、信息在大数据时代的再认识,结合数据、信息本身在大数据周期中“关系化”的过程,来探讨在数据信息资源之上赋予财产性权利的正当性问题。数据在大数据生命周期中转化为信息,信息在新一轮的大数据生命周期中作为数据进行转化,成为新的信息。数据不断的“关系化”为信息的过程,是数据使用价值提升的过程;而提升数据的使用价值,是大数据时代价值流转的根本原因。促进数据开放的同时,对能够提升数据使用价值的市场主体赋予一定的财产性补偿,是大数据时代平衡个体利益与公共利益的唯一路径。


Vincent van Gogh · First Steps, after Miller

大数据时代信息集合上的

财产性权利之赋权基础

——以数据和信息在大数据生命周期中的“关系化”为出发点



目次


1

大数据时代信息集合上的基本组成单位——数据和信息

2

大数据时代信息集合上经济价值的生成过程——大数据生命周期

3

大数据时代信息集合上财产性权利的赋权基础

4

大数据时代信息集合上财产性权利的赋权基础


人类社会在经历了农业革命、工业革命,并自上世纪50年代后期通过信息革命,进入到信息社会以来,以体能和机械为主导的传统产业时代已经逐渐演变为以信息类无形产业为主导的智能时代。经过半个多世纪的网络社会活动,数据、信息资源已经具有足够庞大的规模,移动互联网、移动终端和数据感应器的出现,使得这些资源成几何倍数的增长,而以“云技术”为代表的托管技术的出现,给量变的数据、信息资源带来了使用价值上的质变。自2001 年,“大数据”(Big Data)的雏形在Gartner的研究报告中出现以来,经过10多年的变化发展至2012年,大数据的概念逐渐进入了人们的视野。大数据,是用来描述和定义信息爆炸时代的海量数据、信息资源,并以其命名与之相关的技术和创新手段。随着这些大数据相关技术的出现,大数据时代悄然来临。联合国也在当年发布了大数据政务白皮书,明确了大数据对于联合国和世界各国政府来说是一个历史性的机遇,人们可以使用丰富的数据、信息资源,来对社会各项活动进行前所未有的分析,使得大数据的产业逐渐崭露头角,大数据资源的交易与日频繁,以此更好的服务于社会。我国政府从2006年就开始就对信息化战略和发展做出了重要的安排和要求,也前瞻性的为大数据时代的到来进行了较为稳健的部署。

然而,大数据环境下,在数据、信息资源的流通和使用过程中出现了很多法律问题。究其根本原因,是由于这些资源流通和使用中的相关关系人(包括数据、信息资源的生产者、控制者和使用者),并不清楚自身对相关数据、信息资源是否享有权利,以及享有什么样的权利,而这些资源实然的具有经济价值,并可以通过流转使市场主体获取经济利益。加之,大数据概念的兴起,新的数据类型和种类的增多,人们对于数据、信息以及大数据相关概念的模糊使用,使本来就较为复杂的法律关系变得更加难以界定。

本文以信息管理传统理论中数据、信息及相关概念为基础,以数据和信息在信息生命周期中的区别与联系为出发点,结合大数据的特殊环境,对由数据转化为信息所产生的信息集合的特征进行分析,并讨论在信息集合上赋予财产性权利的正当性问题。本文不涉及数据、信息资源的产生者、使用者以及控制者对数据、信息资源享有什么样的具体财产性权利,以及具体权利的实现程度问题。


一、大数据时代信息集合上的基本组成单位——数据和信息

(一)“DIKW体系”之下的数据和信息

人类对客观事物的认识组成了人类思想的内容。这个认识过程是一个从低级到高级不断发展的过程。目前,一些学者将人类思想的表达内容分为了3类,即数据、信息和知识,也有一些学者将其分为了4类(数据、信息、知识和智慧)或者5类(数据、信息、知识、理解和智慧)。而支持“四分法”的较为普遍,四分法源自于DIKW体系。

DIKW体系(Data-Information-Knowledge-Wisdom)是描述关于数据、信息、知识及智慧的递进式体系,这个体系最初可以追溯到Thomas Stearns Eliot所写的诗。1982年12月,美国教育家HarlanCleveland引用Eliot的诗句在其出版的《未来主义者》一书提出了“信息即资源”(Information as a Resource)的主张。其后,教育家Milan Zeleny、管理思想家Russell Ackoff进一步对此理论发扬光大,前者在1987年撰写了《管理支援系统:迈向整合知识管理》,后者在1989年撰写了《从数据到智慧》,Milan Zeleny又在其后的著作中提出了4个Know来比喻DIKW体系中的每一个元素。(详见图1)

                            

根据DIKW体系,数据、信息、知识和智慧的关系是一个四层结构,智慧在顶层,数据在底层。通过原始观察及量度可获得数据,经过处理、建立相互关系后形成信息;对信息归纳演绎和集成提炼得到知识;而智慧是源于又超越知识的一个创新性思维或行动。这四者中,前者是后者的基础与前提,后者是前者的发展并对前者的获取具有一定的影响。

国内外相关领域的学者对数据、信息都分别进行了特征明确的定义,究其本质特征,差异不是很大:


1、数据

国际标准化组织(ISO)对数据所下的定义是:“数据是对事实、概念或指令的一种特殊表达形式,这种特殊表达形式可以用人工的方式或者用自动化的装置进行通信,翻译转换或者进行加工处理。”根据这个定义,就人类活动而言,常规意义下的数字、文字、图形、声音、图像(静态和活动图像)等,经编码后都被视为数据。国内外学者对数据的概念也都有较为近似的定义:数据是原始的,除了存在以外没有任何意义;数据是一个事实或一个与其他事情无关的事件陈述;数据是原始的数字和事实;数据是没有回答特定问题的文本;数据是“涵盖文本、事实、有意义的图像,以及未经过解释的数字编码等;”数据实际上就是一组分散的事实;我国信息工程学者认为,“数据是有意义的实体,它涉及到事物的存在形式,是人们通过观察、实验或计算得到的结果”。

通过以上学者对数据的描述,可以将数据间共有的、已被认知的特征,作为对其本身的基本描述。笔者认为,所谓数据,是指反映客观事物状态的、原始的、未解释的符号的记录,其本身并没有回答特定的问题。


 2、信息

现代管理学之父Peter Drucker将信息定义为:“信息是被赋予相关性和目的性的数据。”有学者认为,信息是由一系列描述特定情境、环境、挑战或机会的有组织的事实和数据所组成;信息是经过处理可以利用的数据,来回答“谁”、“什么”、“哪里”和“什么时候”的问题;信息是包含某种类型可能地因果关系的理解;信息是一定形式组织起来的数据,即是能够被存储、分析、展示,可以通过语言、图表或数字交流的一组数据;信息是试图改变接受者认识的消息;信息是经过解释能够成为一种结构含义丰富的数据;信息是经过处理的数据;信息是回答“when,where,what,who”问题的文本;信息是有上下文联系,有意义的数据。

根据学者们对信息的特征的描述,总结其特征共性,笔者认为,所谓信息,是数据“关系化”的表现,是通过一定的模式对数据进行加工后的结果,其本身可以回答特定的问题,解决特定的事务。


3、数据、信息、知识与智慧的关系

为了对数据和信息更好的认知,以及对本文第三部分的财产性权利赋权问题提供有效的理论支持,笔者这里将DIKW体系下的两个高级阶段进行简要总结。

通过图1可以较为直接的发现,在数据通过一定的方式转化为信息之后,信息又会进而通过人们的“更高层次的劳动”(例如创造性劳动)进行更高层次,更高价值的转化,形成知识和智慧。

国内外学者也对知识有大同小异的界定:知识是数据和信息的应用,回答“如何”的问题;知识是这样一种模式,当它在此被描述或被发现时,通常要为它提供一种可预测的更高的层次;知识是特殊背景下,人们在头脑中,将信息与信息在行动中的应用之间建立的有意义的联系;也有学者认为,知识是人或者其他无生命事物所拥有的真理和信念、视角和概念、判断和预期、方法论和技能等;知识是一种由经验、价值、情境化信息、专家意见等构成的流动的混合物,它们可以为评价并整合新经验、新信息提供一个框架;知识是经过证实并被认为具有真实性的信息;知识是回答“how, why”问题的文本。“知识体现了信息的本质、原则和经验,它能够积极地指导任务的执行和管理,进行决策和解决问题。”

在数据、信息和知识之间,没有绝对的界限;从数据转化为信息,再从信息转化到知识的过程,是数据通过被采集、被处理而变得有序、可验证,并最终揭示事实之中所存在的固有逻辑规律的过程。有学者认为,只有通过将数据、信息、知识三者的统一认识对象——事实,将三者联系起来,才能能够将三者的概念进行统一理解。

所谓智慧,是对更多的基本原理的理解,这种原理包含在知识中,而这种智慧本质上是“知识是什么”的基础;智慧“包括组织能高效地创造产品、服务和流程的才能和专门知识;”是一种推测的、非准确定性的和非随机的过程。

从获取途径来说,数据可通过最基本的、最原始的观察获取,数据可以共享;信息是客观世界的直接间接描述,使人们活动交换的内容,信息可以流通;知识源于数据、信息任一层次,是对它们的归纳演绎和集成提炼,知识可以传播;智慧是知识的外在表现,源于又超越信息和只是的创新性思维,智慧可以垄断。数据、信息、知识和智慧的特征可以用四个英文介词进行表达:数据——where,即原始记录的数据存在何处;信息——what,即数据的本身的意思和关系是什么?知识——how,即知识结构的概念、原理如何掌握;智慧——when,即利用知识生产智慧的机会在何时。有的学者也对数据、信息、知识和智慧进行了较为形象的递进式举例。高质量的管理应当收集原始数据以便于再利用,通过信息找回与当前兴趣有关的数据,通过检查以前的成功的方案以使用当前的环境生成知识,而智慧是对照当前的经济形势,检验过去实践活动的有效性。我国知识管理领域咨询专家王德禄认为:“数据是反映事物运动状态的原始数字和事实;信息是已经排列成有意义的形式的数据;知识是经过加工提炼,将很多信息材料内在联系进行综合分析,从而得出的系统结论;而智慧是激活了的知识,主要表现为收集、加工、应用、传播信息和知识的能力,以及对事物发展的前瞻性看法。”

此处需要对一些概念进行研究展开前的明确。在情报学中,有类似的四个基本概念,即“数据”、“信息”、“知识”和“情报”(intelligence)。钱学森于1983年在国防科技情报工作会议上提出“情报是为了解决一个特定的问题所需要的、具有及时性和针对性的知识,情报是激活了、活化了的知识”。从数据到信息、从信息到情报都需要知识的支撑,而知识贯穿于整个转化过程。从大量的数据中搜集、研究与事件相关的数据时,数据就转化为信息,利用知识对信息进行分析,信息转化为情报。可见,情报学将“知识”作为数据向信息转化的媒介,而不认为其是数据进化分类的一个较高级的阶段。“情报”一词来源于日语中的汉字“情报”,日语中“情报”一词普遍被认为是从德语“Nachricht”一词而来,而德语中“Nachricht”一词多有“信息”、“情报”、“消息”以及“新闻报道”的含义。而且,由于英文中“intelligence”实际可以翻译为“智慧”和“情报”。所以本文认为,“情报”一词由于经过多重语义移植,不具有较为确定的范畴,因而不应当作为法学研究的具体对象,加之在情报学中,针对数据和信息之间的关系得表述并不异于DIKW体系,所以本文依旧以DIKW体系下的“数据、信息、知识、智慧”为基础进行法学研究。

通过以上学者对DIKW体系下的数据、信息、知识和智慧进行的总结不难发现,数据和信息之间最重要的联系——信息是形成“关系化”的数据。知识和智慧是数据、信息发展的高级阶段,不如数据和信息可具象,但是在价值上更为突出,这也就是为什么对于某些可以控制的知识和智慧,需要通过特殊的法律进行保护的原因,如知识产权法等。


(二)大数据时代对数据和信息的“再定义”

“再定义”并不是重新定义,而是在新环境下,对既有定义进行合理的发展。

在日常生活中,人们对“数据”和“信息”的使用多有交叉,加之“大数据时代”的出现,一些新的以“数据”为内容的概念跃然于人们的生活之中,“数据”与“信息”的界定就变得更为模糊,但区分“数据”和“信息”有重要的作用,因为,“如果没有准确定义数据,信息生产者将不知道要创造什么价值的数据,以及不知所引用的数据的意义。”

根据信息技术专业的学者观点,任何数据和信息的概念都有一定的适用范围和应用背景,离开这种背景,概念模糊难以避免,这也就是为什么在日常生活和工作中,人们对于数据和信息的概念难以界定的原因。

不同于小数据时代,大数据时代是分享经济和数据整合利用的时代——信息共享的时代。所谓信息共享,是指“在一定程度开放条件下,同一信息资源为不同用户共同使用的服务方式。”信息共享离不开共享信息源、信息使用者、信息共享过程三个要素,正是存在着对以上三个要素的认识不一,导致人们对数据和信息概念的难界定。在信息共享研究领域,学者们对数据的界定和信息的界定虽然有些差异,但是都阐述出了数据和信息联系和区别上的共性。数据和信息相互联系,可以从“纵向”和“横向”概念关系来看:“纵向”概念关系上,数据与信息在层次上有差别,存在递进关系,数据是信息的基础与前提,信息是数据的整合与提炼;“横向”关系上,可以把数据看成是信息的一个子集,存在包含关系。

不难看出,有关数据和信息研究的专业领域的学者们对数据和信息的关系都有同样的潜在认识——信息是形成“关系化”的数据,这样的关系在小数据时代,主要是“因果关系”;而在大数据环境下,这样的信息除了包含着数据间的“因果关系”,也包含着数据间的“相关关系”,而且,“相关关系”占了很大一部分比重。在DIKW体系中,与大数据时代活动对应最紧密的还是数据阶段,大量的数据经过现代存储技术保留了下来,提高了其被转化为更多有价值信息的可能性。与传统信息采集能力下的数据资源不同,大数据时代的数据具有规模大、移动性强、多样性高、价值稀疏性大的特点。而经过大数据挖掘后所转化出的信息,相较于小数据时代,具有更大规模,更多样化的内容。

但是,无论环境如何变化,数据和信息之间的基本关系依旧不会改变,只会通过科技发展愈发强烈。除非新生科技对既有人类的知识体系形成颠覆,那么对于进阶发展而成的科学概念,其基本特征应当是统一的,这样就不会凭空增加学科间的兼容难度,也不会使既有成熟的科学体系瓦解。所以,在大数据环境下,对于数据、信息以及其他相关概念的认知,应当遵循科学理论发展上的“承上启下”,用谨慎的态度来界定新的问题。这对法学研究更为关键,法学研究是以研究对象特定为基础,继而对具体的法律关系所进行得讨论。数据和信息等术语是其他学科发展而成的,不是法学的源生概念。所以,如果要将数据和信息纳入到法学调整的范围之内,就要进行相关概念的移植,只有如此,才不会破坏与源生学科的兼容性,也不至于让法学研究变成无源之水、无本之木。

因此,通过以上的阐述可以看出,“大数据”只能表达通过大数据的相关技术,对海量的数据进行处理,创造新的价值的一种新兴生产力方式。所以大数据时代用“数据”命名的概念并不一定就能表达其本身特点,相反,“数据”的普遍使用,使得很多应当具有“信息”特点的研究对象变得模糊不清。例如“数据产品”,就不只是具有数据的特点。大数据时代是非结构化数据(Unstructured Data)的时代,大量的非结构化数据需要通过技术转化为可以被认识的结构化数据,进而转化为信息。况且,大数据时代的基本运行特征,就是将“关系化”了的数据(即信息)来衍生出数据产品,而这实际上就是数据转化为信息的过程,单一的信息从信息资源交易的角度来看并不具有很大价值,除非这个信息是核心价值的全部或者一部分。一般信息资源的交易都是将相关的信息进行归集整理,形成集合化后才会具有价值,如通常所说的数据库。而数据库实际上就是信息的集合,并不是单纯的数据的集合,大数据时代下所谓的数据产品也是信息集合。

综上,本文所称的信息集合,是指通过对数据的采集、归集、分析、将数据“关系化”后转化为信息,并形成具有一定实用价值的集合,是大数据时代数据信息资源交易的基本对象。而数据通过关系化的发展转化为信息,继而成为信息集合的这个过程,也有着特殊的法学研究意义。


二、大数据时代信息集合上经济价值的生成过程

——大数据生命周期

(一)信息生命周期(Informationlifecycle)及相关概念

1981年,Karen B. Levitan首次将“生命周期”引入信息管理理论中,指出,信息或信息资源是一种具有生命周期特征,具有包括信息的生产、组织、维护、增长和分配的“特殊商品”。次年,美国学者Taylor提出了包含数据、信息、告知的知识、生产性知识和实际行动5个阶段的信息生命周期过程。1985年,Horton在《信息资源管理》一书中指出,信息是一种具有生命周期的资源,其生命周期由一系列逻辑上相关的阶段或步骤组成,体现了信息运动的自然规律,并据此定义了两种不同形态的信息生命周期,一是基于信息利用和管理需求的信息生命周期,由需求定义、收集、传递、处理、存储、传播、利用7个阶段组成;二是基于信息载体与信息交流的信息生命周期,包括创造、交流、利用、维护、恢复、再利用、再包装、再交流、降低使用登记、处置10个阶段。2000 年10 月,ISO/TC171文件成像应用技术委员会的伦敦年会上的相关决议指出:“信息无论是以物理形式还是数字形式管理,其信息生命周期均包括信息的生成、获取、标引、存储、检索、分发、呈现、迁移、交换、保护与最后处置或废弃。至此,“信息生命周期管理”(ILM:Information lifecycle management)等针对信息生命周期内的阶段特征对信息进行管理的学科领域进入人们的视野之中。

随后,专门从事数据存储研究的机构又将ILM理论应用在数据存储领域,研究海量数据的高效存储方式,提出了数据存储管理理论。该理论将数据生命周期管理(DLM: Data lifecycle management)划分为6个阶段,分别是数据创建阶段、数据保护阶段、数据访问阶段、数据迁移阶段、数据归档、数据回收阶段。数据生命周期管理和信息生命周期管理这两个词有时可以交换使用。然而,这两者之间是有区别的。DLM产品处理通常的文件属性,例如它们的类型、尺寸以及年龄;ILM产品则具有更复杂的功能。例如,DLM产品可以允许你查找已存储的具有某个年龄的某类文件类型的数据,然而ILM产品则能让你查找不同类型的存储文件的某个数据片断,例如客户号码。也就是说,ILM比DLM所处理的对象更具有“关系化”。这样看来,信息生命周期发展而来的信息生命周期管理、数据生命周期、数据生命周期管理等研究领域,在本质上依然没有改变数据和信息之间的基本关系。


(二)信息生命周期在大数据时代的发展——大数据生命周期

大数据时代,没有绝对无用的数据,数据再利用的价值明显提升,在数据坟墓、数据废气中也能够发掘有用的数据,并进行新的一轮周期的转化。大数据理论与技术促进了信息生命周期理论的发展,同时,大数据与信息生命周期理论的契合显示出“信息消亡”观点的片面性。有的学者就提出了“信息休眠”的概念。所以,在大数据时代,无论是数据还是信息,实际上是不存在“绝对消亡”情况的,只是在一轮周期满足其使用价值之后,被人们忽视或者储存起来(即休眠),有可能在之后的某个时间节点上进入下一轮周期运行,产生新的使用价值。在大数据时代,由于不存在数据和信息使用价值的绝对消亡,基于信息生命周期理论的,具有大数据时代特色的大数据生命周期被人们逐渐认知。2016年1月,美国联邦贸易委员会(Federal Trade Commission)针对大数据相关重要的问题发布了一份《分析报告》。该报告开篇部分阐述了从小数据到大数据之间需要经过几个阶段,而大数据的生命周期可以分为4个阶段:

第一阶段:收集;

第二阶段:编辑和合并;

第三阶段:数据分析;

第四个阶段:使用。


(三)大数据生命周期——数据“关系化”为信息的过程

不同于小数据时代的信息生命周期及其管理步骤,大数据生命周期是刚进入人们视野之中的概念,很多具体部分仍在细化。但是对于法学研究来说,目前的周期各部分特征已经足够明确、简练,适用于法学研究的具体条件已经比较充分。   

比较大数据生命周期与小数据时代的信息生命周期,从特征上来说只是在数据信息资源的“再利用”阶段出现了质变的突破,而其他部分,在价值变化上基本类似:首先,需要经历数据的收集,形成数据挖掘源;然后进行编辑和合并,此阶段下,数据通过归类等方式被“关系化”,一部分已经成为了能够使用的信息;在数据分析阶段,实际上是进一步加剧了这些数据的“关系化”(因果关系和相关关系),使其成为符合“特定”使用目的的信息,组成信息集合。最后一个阶段,就是如何实现信息集合的使用价值阶段,是信息集合交易的目的。每一轮大数据生命周期都可以看作是一次数据“关系化”为信息后,成为交易对象并实现使用价值的过程。

每一次的“关系化”都应当符合使用阶段的使用目的——目的特定化。在下一个周期,又会有新的使用目的,进而进行新一轮的数据“关系化”。也正是由于数据和信息的“关系化”,加上其在每个大数据生命周期之中的使用目的不同,研究信息集合上的法律关系,才应当在一个生命周期内,一个相对特定化的阶段展开。因为同一个研究对象在不同的周期内表现不同,例如,信息在这个周期内表现为是数据“关系化”后的信息,其在这个周期内已经具备了特定的使用价值,可以组成集合并进行流转;但是,在另外一个周期环境下,其就有可能是为了新的使用目的,为了产生新的信息,而在该周期内作为“数据”的角色存在。因此,数据和信息的转化,需要在特定的大数据生命周期内进行分析,否则会出现使用上的混淆(这也就是在大数据实践中,为什么数据和信息的概念经常被替代使用的主要原因)。(详见图2) 

                     


因此,结合前述信息技术专业学者的观点可以发现,任何数据和信息的概念及发展都应当在相对特定的背景下进行分析,从信息生命周期发展而来的大数据生命周期正好符合这种背景条件,而法学研究对象的特点也是相对确定化。因此,数据和信息,以及对信息集合赋予财产权利及具体权利项的法律分析,也应当在这个特定的周期之下展开,否则容易产生模糊不清的现象。然而,国际立法实践中,对数据和信息概念的模糊表示却时有发生,例如2016年5月25日,美国参议院和众议院审议的《开放政府数据法案》中将“数据”定义为“被记录的信息,而无论这些信息记录的媒介是什么”。而将“数据资产”定义为“可以被归集在一起的数据元素或数据集的集合”。可见,这里的表述忽视了数据和信息在大数据生命周期中的不同角色。而“数据资产”实际上就是信息集合。我国有学者在其文章中提出以数据内容的生产方式为标准,将数据分为“衍生数据”和“原生数据”。实际上是利用了新的概念去定义数据(原生数据)和数据“关系化”后的信息(衍生数据)。但是新的概念恰恰忽视了传统信息科学理论中的数据和信息之间变化实质。

忽视数据和信息的区分,模糊概念般的使用,实际上也就是将数据向信息转化中的“过程”和“结果”的忽视,大数据实践的具体术语中可以忽视这样的内在关系,因为专业实践者深谙这种关系。但是,大数据环境下的法学研究,必须对法律关系产生的具体环境进行限定,对研究对象进行明确,对每一轮周期的四个阶段和最终依据使用目的而产出的信息集合进行明确。只有这样,才能合理的研究信息集合上的法律关系,为信息集合上财产权利的赋权问题奠定理论支撑。


三、大数据时代信息集合上财产性权利的赋权基础

(一)传统财产权利的赋权基础——客体原因和主体原因

1、财产权利产生的客体原因——可支配的稀缺性资源

“稀缺是指这样一种状态:相对于需求,物品总是有限的。”具有稀缺性是财产价值的基础,资源的稀缺性是经济学理论的起点。从法学角度而言,一种资源如果不具有稀缺性,就不具备赋予财产权的必要,也就无所谓权利的分配和流转。自古以来,资源的稀缺性取决于人们的生存方式,过度丰饶的社会并不需要“所有权”式的财产权;对于游牧社会而言,土地资源对其并不稀缺,但水资源和畜牧资源对其稀缺,财产权会在这些资源中产生。而对于定居的水耕社会来说,土地则成为其必不可少的生存依托,具有稀缺性。稀缺性可以说是决定一种资源上是否存在财产权利的标准,因此,有学者就认为“除了就稀少的或预期稀少的东西而言,财产的权利并不存在,财产的价值总是一种稀少性价值。”这种评价无可厚非,因为只有存在稀缺性,才会产生需求上的不满足。从人性的角度而言,“由于我们的所有物比起我们的需求来显得稀少,这才刺激起自私;为了限制这种自私,人类才被迫把自己和社会分开,把他们自己的和他人的财物加以区别。”

在稀缺性的基础之上,某种资源上是否可以赋予财产权利,还必须取决于这种资源是否可以被人类所支配,即资源的可支配性,如果某种资源不具有可控性,那么这种资源的现实意义就不存在;因此,从法律本质而言,可支配的稀缺资源,才是定分止争的对象。


2、财产权利产生的主体原因——劳动赋权理论

如前所述,一种可支配资源具有了稀缺性特征,是其能够成为财产的前提。但是,一种可支配稀缺资源并不是先天、主动的成为财产,而是需要通过一定的转化方式,与支配其的主体产生一种媒介关系,从而形成资源本身的价值,即通常所说的资源的价值性,也称实用性。因为“如果一种商品毫无用处,或者说,如果它无法对我们的需求满足有所贡献,那么不管它怎样稀少,或者获取时需要付出多少劳动,这种商品都不具有价值。”这里所指的价值是以使用价值为基础,以交换价值为表现形式,使用价值是指能够满足人们的需要,而交换价值是指该种资源可以以通货来衡量。而这种媒介关系的基本表现形式,是人类的劳动。

1690年,英国哲学家洛克在其著作《政府论》中提出了劳动赋权理论,以天赋人权的自然法理论为基础,将“劳动”作为人类获取财产权的重要途径。根据皮特·达沃豪斯(Peter Drahos)教授的归纳,财产权劳动理论的全部内涵主要有五个部分:“第一,上帝将天堂留给了自己,而将地上的一切赐给人类所共有。第二,每个人对他自己的人身都拥有所有权。第三,每个人的劳动只属于他自己。第四,当人们将他的劳动与处于共有状态的某个东西混合在一起的时候,他就取得了该东西的所有权。第五,人们在取得该财产权时必须留有足够好的同样多的东西给他人共有,同时以不造成浪费为限。”洛克的推理实际上蕴含了近代以来市民社会的两个基本原则:财产权私有原则和自由主义原则。其从根本上为财产权找到了合法性基础,并确立了社会发展的核心价值;同时,通过将创造物比作是主体人格的延伸来扩张人格权,使财产权具有了人权基础。可以说,除了劳动,没有其他媒介方式比其更符合道义和法理上的正当性。

因此,“具有效用的商品获取其交换价值的来源有两个:稀缺性和获取商品时所需要的劳动量”。“在资本积累和土地私有尚未出现以前,获取物品所需的劳动量的比例似乎是物品交换的唯一标准。劳动难度不同,交换价值也不同。如果某种劳动需要巧智,处于对这种技能拥有者的尊重,其生产物自然更具有价值,也就是超过其平均劳动时间应得的价值。这种技能需要人们多年苦练才能获得,对其生产物给予较高价值就是对其掌握技能所需要劳动时间的合理报酬。”劳动是人类社会能够接受在可支配稀缺资源上创设财产权利的最基本的方式。当然,随着社会生产力的发展,这样的观念也在一定程度上得到了发展与修正。


(二)财产权利的赋权基础在信息时代的发展与修正

1、客体原因——可控资源从有形到无形、从绝对稀缺到相对稀缺的转变

人类的每一次生产力的变化都给其财产观念带来新的变革,因为生产力是决定既有资源是否可控,以及是否稀缺的关键,也是人类通过何种“劳动”使这种资源具有使用价值的前提。从农业革命、工业革命再到信息革命,农具、蒸汽机、电子计算机的出现使得人们可控资源的范围逐渐扩大,人们对待财产的认识,对待价值的观念也随之变化。传统的财产观念侧重于对有形物的保护,而这种以物权制度为中心的传统财产观念,随着工业革命的到来发生了根本的转变。社会发生价值创造模式的转变始于20世纪20年代,即从以有形物质创造价值为主的社会向无形的信息创造价值的社会转变。美国学者施瓦茨曾列举了“具有重大价值的新型财产,包括商业信誉、商标、商业秘密、著作权、经营利益、特许权以及公平的便利权”1967年,世界知识产权组织成立后,以“知识产权”为统称的一系列无形财产权被社会广泛认可和实践,财产权的客体发生了从被人类“实际控制”到“法律上控制”的转变。人类社会在面临拟制财产权的抉择之后,无形财产范围被一次次的扩大,直到数据信息资源占领了我们生活的每一个角落。信息化技术普及、自媒体发展、大数据技术的出现,又使得人们在面对一些新型的、具有经济效益的、可以提高人们生存发展质量的“新事物”时,踌躇不前。

如前文所述,数据信息资源作为信息时代的主要可控资源,其本身并不稀缺。传统财产观中对于赋权客体的要求在新型资源中没有直接对应之可能,但这并不表示“稀缺性可控资源的观点”已经被取代,相反,稀缺性可控资源在信息时代发生了转移,成为非直接可控的资源,也是市场主体努力争夺的资源。

诺贝尔经济学奖获得者赫伯特·西蒙(HerbertA. Simon)在1971年提出:“信息的丰富导致注意力的贫乏,因此需要在过量的、可消费的信息资源中有效分配注意力”。20世纪90年代,在西蒙提出“注意力贫乏”概念20年后,“注意力经济”的概念开始出现。1990年心理学家沃伦·桑盖特(Warren Thorngate)首先使用了“注意力经济”(the economy ofattention)一词,很快这个词为学术界所接受。米歇尔·高德哈伯(Michael H. Goldhaber)在1997年《注意力经济——网络的自然经济》一文中提出了“注意力货币”的概念,阐述了在网络空间中,注意力是“硬通货”,他将西蒙的“注意力贫乏”概念向前推进一步,称“注意力是一种珍贵的财产”。注意力经济虽然在2000年大量网络公司倒闭后消沉过一段时间,但是存活下来的网络公司在随后的发展中展现出来的经济能力使得注意力经济重新成为信息时代的研究热点,有的学者认为对注意力经济的研究应当重新回归到“交易”当中来,使得简单的“注意力记录数据”的交易扩大到“注意力”的销售。

美国社会学家布鲁默(Herbert Blumer)在他的著作《符号互动论:观点和方法》中指出,人类所组成的社会, 其最显著的人文特征就是符号交往,即意义的建立, 所以人类社会应当理解为是由符号交往所形成的社会。德国哲学家恩斯特·卡西尔也把人定义为“符号的动物”。因此有学者也指出,农业社会的核心资源是“土地”,农业经济强调人的动物性,突出解决温饱的生理需要;工业社会的核心资源是“能源”,工业经济强调人的社会性,突出了人的社会分工与合作;信息社会的核心资源是“注意力”,注意力经济则强调人的符号性,强调符号消费对人类生存的意义。注意力经济是基于注意力这种稀缺资源的生产、加工、分配、交换和消费的新型经济形态。

所谓注意力,是指人们关注一个主题、一个时间、一种行为和多种信息的持久尺度。美国应用数学家,控制论创始人维纳认为:“接收信息和使用信息的过程,就是我们对外界环境中的偶然性进行调节并在该环境中有效地生活着的过程,而有效的生活就是拥有足够的信息来生活。”人类的精力是有限的,信息过剩导致注意力短缺,换句话说,有限的注意力在信息爆炸时代成为了稀缺的资源。所以,不同于传统财产观念,稀缺资源实际上是市场主体(即信息消费群体)的注意力。注意力直接决定着市场主体的经济活动,能够控制这种注意力的媒介就具有巨大的经济价值,因为“控制注意力意味着控制经历,因而控制了生活质量。” 但是,注意力这种稀缺资源本身并不能够被直接控制。而通过对在大数据时代并不稀缺的资源——数据、信息资源的直接控制,就能够间接的对市场主体的注意力形成“控制”。网络实践中常常提及的提升“用户黏度”,就是控制这种注意力的方式之一。

因此,在信息时代,可控资源的稀缺性已经从绝对的稀缺转变为相对稀缺,数据、信息资源作为信息时代间接控制绝对稀缺资源的一种媒介,其价值在大数据时代才被逐步发掘。


2、主体原因——劳动赋权理论对无形财产权的解释困境与其他财产权理论对其的修正

无形财产权制度出现较晚,其没有本身的哲学基础,需要借鉴有形财产权制度的哲学基础来进行支持。但劳动赋权理论作为有形财产权哲学基础最为著名的代表,多少存在一定的解释缺陷:有形财产世界始于自然初始状态,资源分配默认人类共有,而以有形财产为基础的无形财产世界,任何劳动获取的产物都不是简单的自然发掘过程,而需要先前经验;同样,劳动赋权理论也无法解释无形财产权的主体与客体无限分离的现象及许多特殊制度现象。因为在洛克时代,无形财产还是一个新的事物,人们还不能够从历史的角度来看待无形财产权。而洛克之后的财产权理论,从某种程度上对劳动赋权理论进行了修正,也为无形财产权的赋权正当性提供了理论支撑。

卢梭的“社会公意”理论认为,劳动赋权理论三要素(先占、需求和劳动)的满足只是占有事实的成立,而不足以表明财产权的成立。在这种批判的基础上,卢梭提出了以社会契约为基础、以社会公意为依据的新的财产观。但是卢梭的理论将社会整体利益与个体利益完全对立起来,而无形财产权的利益基础不应当是极端化的,而应当是基于个体利益和公共利益的平衡。

康德的财产“自由意志”理论虽然是以有形物与所有权为研究对象的,但其关于自由意志与财产权利的学说,为现代无形财产权及其权利制度的确立提供了有力的哲学理论依据。康德在其所有权与共同意志中也提出了自己意志占有和共同意志占有的关系与重要性。知识产品作为无形财产被赋予财产权,并非取决于创造者对其自由支配,而在于全体社会成员对这种财产状态予以承认的“共同意志”。

黑格尔的“财产人格”理论是将私法思想构筑于“意志—人格—财产”的基本范畴上,阐述了财产是人格的表达,是自我实现的方式;既然财产是人格的外化。在知识产品上设立产权制度并无道德与正义的障碍;黑格尔的“财产人格”理论则与洛克的“劳动价值”理论相映成趣。这是因为,知识产权的合理性无论从“人格”方面还是“劳动”方面解说,在道德上都是可以接受的。

庞德的“利益平衡理论”认为,20 世纪已不再争论权利、法的本质和制度的出发点,而是更多地考虑人们的利益、目的和要求,并协调或调和各种关系。这样,财产理论的本位已经从权利转向其目的,即利益本位。财产权利的权源不再是问题的出发点,人们更多地关心实在利益的分配,即“必须在合作本能和利己本能之间维持均衡。”因此,财产的社会负担和义务也加重了。

功利主义财产权学说主要源于休谟和边沁的观点。休谟认为我们所遵循的正义规则来自那些被认为有利于促进人类幸福的一些习俗。人们遵守这些规则是为了个人的私利同时自然也有利于公共福利。私人所有权及其规则的基础除了这一实用目的别无其它。休谟之后,边沁更明确地指出,并不存在所谓的自然权,财产权完全是法律的人为创设。具体到以知识产权为代表的无形财产权,功利主义认为社会提供知识产权制度的终极原因是为了提供刺激动机,以扩大相应成果的供给,保证社会公众能够获得充分的知识产品。

美国法学家波斯纳教授将财产权放入经济学的背景,自然就进入了经济学“追求利益最大化”的效益理论。他提出了根据资源的稀缺性来矫正财产权,并提出事实上的财产权的概念以及著名的“权利相互性”理论,即不存在绝对的、无条件的排他财产权,财产权利的使用不仅具有了个人的效用,而且是社会在考虑资源有效和最优配置时的必要因素。

罗尔斯的正义论将财产权利与经济利益放在同一理论层次进行讨论,强调经济活动中的现实权利。强调社会正义、制度正义,这就不同于以往单纯对个人正义的强调;承认不平等,提出差别原则;平等自由原则优位的情况下,实现对不正义的正义对待;调和社会利益,引导人们相互合作。

除此之外,澳大利亚学者达沃豪斯教授的“抽象物”理论,从功利主义的立场提出应当将知识产权当作工具看待,以抵制知识产权独占主义,防止对他人自由和分配正义的威胁。美国法理学家博登海默教授提出“共同福利”这一术语,用来标明外部界限,以限制分配和行使个人权利。他主张个人权利与社会福利之间应创设一种适当的平衡。个人权利的实现固然深深植根于人格的需要与倾向,但对权利进行某种限制同样正是公共利益的需要。

通过对财产赋权的主体原因和客体原因的分析,笔者认为,在信息时代,尤其是当今人类所处的大数据时代,人类社会稀缺资源趋于多元与无形化,社会通过法律拟制财产权利的方式来体现财产观的转变,使得财产权利的赋予已经不同于往昔。财产权利之上所体现出的个体利益与公众利益之平衡,是社会通过“共识”来拟制财产,从而促进社会发展的一种诉求,也是大数据时代的主要财产观。


 (三)大数据时代信息集合上财产性权利的赋权基础——数据使用价值的添附(value-added)

  1、数据在大数据生命周期中“关系化”为信息的过程是其使用价值添附的过程

使用价值是自在之物在人们观念中转化为有用之物的关键,是从原始的“占有”之事实向实现“占有”之目的的转变的关键,是从着眼于“占有”状态向注重“利用”转变的关键。提高使用价值的认知,人对物的支配就不再是简单的经验式支配,而开始形成抽象性因素,形成法律意义上的“非物质”占有。就如同康德所述,如果不能通过有形的方式对一个物宣誓权利,那么其可以在另一种意义上(非物质)去占有它。

随着以所有权为代表的有形财产权的形成,人们已不满足于对可控资源的现实支配(现实控制),而愈发的要挖掘可控资源上的使用价值,对资源本身的价值进行分割,将所有权的权能进行分化,继而形成了用益物权、担保物权等物权价值化的产物。而以知识产权为代表的无形财产权的形成,更是人类社会对可控资源价值占有方式的“妥协”,只为能够发挥资源的最大效用。从明确所有、为我所用,到但求所用、不求所有的观念变迁,是商品经济下权利创设的基础之一。权利创设最终是法律确认的结果。而财产的利用也不再局限于资源的自然使用价值的释放,而是依靠科技和管理组织起来的一个创造性的过程。

美国雪城大学信息研究学院的泰勒教授曾于1982年就对数据和信息的转化进行了较为深刻的阐述,并提出在信息生命周期中存在一种价值添附过程(Value-Added Processes):信息系统是一系列有序的程序,这些程序由潜在有用的、明确的讯息(message)经过处理得到加强后组成的,在数据向信息转化的过程中,经历了一系列组织过程(organizing processes),如:归类(grouping)、分级(classifying)、关联(relating)、格式化(formatting)、信号传递(signaling)、 展示(displaying)等,而这是一种价值添附的过程,其中不乏精力、时间、金钱的投入,而最终的价值认知,取决于使用它的人。泰勒教授在文章中还大胆预言“未来20年将会有大量转化后的信息和知识储存、组织、展现和传播”,而这正是大数据时代的即有表现。如前文所述,在大数据生命周期中数据通过被“关系化”,转化为信息的过程,实际上就是数据的使用价值添附的过程。


  2、可控资源价值认知的相对化在大数据时代愈发强烈

古代和近代的财产制度侧重于实际利益或者期待利益的取得和保护,而当代财产则体现为取得财产的资格和手段本身,并不直接体现为一种可即时享有的利益。对可控资源使用价值的挖掘,使得人们对待财产价值的态度也从绝对化向相对化转变。美国学者康芒斯就认为:“在封建和农业时代,财产是有形体的。在重商主义时代,财产成为可以转让的那种无形体财产。在资本主义阶段最近四十年,财产又可以成为卖者、买者可以自由规定价格的那种无形的财产。”可见,人们对可控资源的价值认知相对化并不是始于大数据时代,只是在大数据时代得到了加强,这都要归因于大数据时代的可控资源——数据、信息资源的价值被无限发掘。

而如前文所述,由于大数据时代的稀缺性资源——市场主体的注意力,只能通过数据、信息资源间接控制,所以对数据、信息资源的价值认知也就是相对的。谷歌的首席经济学家哈尔·范里安(Hal Varian)认为数据资源非常之多而且具有战略重要性,但是真正缺少的是从数据中提取价值的能力。所以,通俗的来说,对于特定的数据、信息资源,有些人认为是财富,而有些人不认为,也没有能力去实现其价值。笔者认为,一种可控的资源是否具有价值,应当由市场来决定,如果这种资源能够被市场主体认可,并在其间流转,那么这样的资源就是有价值的。

实用性与需求性的相对化,使得人们对财产的观念发生改变。双边、多边的价值认可频繁发生,合同(如信息许可协议)创造财产性权利比比皆是。而通过相对权来创制财产性权利有利有弊:快速通过合同拟制财产性权利,通过债权的方式来创制相对的财产性权利,实现数据使用价值在市场主体之间的有效转移,提高市场效率。如贵州大数据交易平台,作为我国第一个大数据交易平台,是卖方与交易所进行协商定价之后,出售给买方。大数据交易所产品定价的影响因素主要有以下几个方面:数据品种、时间跨度、数据深度、数据完整性、数据样本覆盖、数据实时性。而这些正是数据使用价值增加的要件。但相对性权利毕竟保护强度弱,不及绝对性权利,给信息资源是否设置绝对性财产权利,不是本文讨论的内容。只是我们目前可以从市场的需求和认可,以及从理论的推断中发现其财产性价值,以及在其上设置财产性权利的正当性。至于如何加强这种相对财产性权利的保护,实践中已有反不正当竞争法,侵权法的救济方式。


  3、数据的使用价值才是大数据时代价值流转的根本

大数据实践中,无论是产生数据、信息资源的主体,控制数据、信息资源的主体,还是使用数据、信息资源的主体,往往对数据、信息资源上是否存在财产性权利判断不清,基于前述研究,笔者在此对一些争议问题进行分析。

首先,数据的使用价值才是大数据时代财产权利发生和流转的根本。数据在大数据生命周期里被“关系化”后成为信息,组成的信息集合,是数据使用价值的载体,是大数据交易实践中的基本对象。信息资源区别于物资、能源资源有一个显著的特点,它可以被重复使用,可被共享,在使用过程中不仅可以不减少,并且还可以产生新的增量。这就使得信息集合中数据的使用价值有无限的可能。信息集合的可变性十分明显,只要其中数据的使用价值发生质变,那么新的信息集合就有可能成为新的交易对象。每一次周期内的转化,都是对数据使用价值的一次添附过程。只有在特定的研究环境和对象之下,才能够发现财产权利产生的起点和财产权利流转的终点。

其次,数据本身并不具有财产权利赋权的正当性。此处的数据是指每一次周期发生初始的既有数据(即有些学者所称的原始数据、原生数据)。对于数据相关关系人,主要有数据的产生者,数据的控制者。作为数据的产生者而言,对因自身发展而产生的数据,不享有财产性权利,因为从前述客体原因和主体原因上来看并不具有正当性,但是数据产生者对该数据资源中涉及个人信息、隐私权、商业秘密、国家秘密等,享有请求权。目前国家严禁并打击的是非法的地下数据交易几乎都是数据本身的非法流转。否认数据上赋予财产权利,避免了数据生产者对其相关数据的过分保护,促进数据的合法流通,从而平衡个体利益与公共利益之间的博弈关系。

最后,只有对数据合法占有并对其使用价值的添附合法“投入”的主体,才是最终产生的信息集合上财产性权利的合法享有者。本文在此处将数据生产者和信息生产者进行区分,对数据合法占有并对其使用价值进行添附的主体,是信息生产者。每一次数据使用价值的添附之始,占有数据资源的主体对该数据不享有财产性权利,通过合法的“投入”,添附其它市场主体承认的数据的使用价值,是获得财产性权利的方式。


       大数据时代下,对数据、信息的概念及其相互之间关系的明确具有重要的法学研究价值。这种价值不仅仅是在概念的明晰上,更重要的是通过对数据、信息在大数据时代的再认识,结合数据、信息本身在大数据周期中“关系化”的过程,来探讨在数据信息资源之上赋予财产性权利的正当性问题。数据在大数据生命周期中转化为信息,信息在新一轮的大数据生命周期中作为数据进行转化,成为新的信息。数据在不断的“关系化”为信息的过程,是数据使用价值提升的过程,而提升数据的使用价值,是大数据时代价值流转的根本原因。促进数据开放的同时,对能够提升数据使用价值的市场主体赋予一定的财产性补偿,是大数据时代,平衡个体利益与公共利益的唯一路径。



感谢作者对本公众号的授权!

为方便读者阅读,引注已略。

本文仅作学习交流之用。



Pierre Bonnard · View of Le Cannet, Roofs



往 期 荐 读



异化中的解放

欢迎关注


大数据和人工智能法律研究院


    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存