法律如何处理数据财产?
编者按
商业模式的变迁将技术革命与商业贸易相互勾连起来,而商业模式的变迁表明商品交换行为的变化,而商品交换行为正是知识产权的运用行为在现实生活中的具体体现。在中国,近乎空白的个人数据法律保护现状和相对残缺的数据库法律保护,演化出一种“低法治状态”下的数据保护状况,其与中国目前蓬勃兴起的数 25 51866 25 13282 0 0 6605 0 0:00:07 0:00:02 0:00:05 6607据商业形成了某种难以言述的脆弱平衡。
原标题《法律如何处理数据财产——从数据库到大数据》,载《法律和社会科学》第15卷第1辑。作者李谦,时为清华大学法学院博士研究生。文章推送时有删减。
一、引言
人类的知识信息、艺术感悟甚至个人情感,由于认知思维的生理制约,必须以符号的形式寄寓到某一物质载体之中即媒介。然后,人的认知思维再将符号形态的信息与情感从中识别、感知。原始时代的岩石壁画、结绳记事是这样的符号载体;文字发明之后,碑刻、铭文、竹简和图书也是这样的符号载体。过去,符号和媒介的认知同一性表现为某一具体物,最典型就是图书。这是一种特殊的物,具体的物质载体和抽象的信息符号相互结合即为具体物与抽象物(abstract objects)的结合。现行法律对此给予特殊的权利配置,具体物上赋予财产权,抽象物上赋予知识产权或其他精神权利。这种权利配置是历史发展的产物,偶然性与必然性彼此伴随,随着技术发展、商业实践和思想控制等各种力量共进催化,最终形成了处理具体物与抽象物权利关系的现代知识产权法体系。今天,数据(data)成为抽象物的新类型,是信息得以存储、传播和再生产的新形式。围绕着数据,各方利益相关者展开了激烈博弈,传统知识产权法上抽象物与具体物的权利配置是否同样适用于数据成为争锋焦点。此外,数据法律构造的其他实践和理论探寻也层出不穷,特别是在获取数据与利用数据方面,合同法实践已经悄无声息地越走越远。
数据作为法律客体所引发的重大法律争议,主要因为其特殊的媒介属性和技术属性。数据的媒介属性,通常认为彻底脱离具体物的物质性的原子构成,而呈现为非物质性的比特(bit)构成,所谓比特,通俗理解为信息的数字化存在形式。这一媒介特性意味着,数据不再需要具体物作为物质载体,它即是载体亦是符号,只需要相应的数字化系统工具加以呈现,使得人的认知思维可以直观识别。换言之,信息的数据形式表明,具体物与抽象物是可以分离的。这样的可分离,一方面,使得抽象物的商业利用方式发生了深刻的剧变,占有式的物质性的货物交易急剧转变为体验式的非物质性的服务交易;另一方面,因商业实践的变化而直接影响现行版权法对作品抽象物的权利安排,传统的复制权式微,新兴的信息网络传播权成为核心。同时,数据还有相对复杂的技术属性,如果数据规模集聚,便具有反复挖掘数据而获取新信息的可能性。随着信息科技的深入发展,数据在将来可能会成为最为广泛、普通的信息存在形式,数据的种种属性将接二连三地冲击现行法律对于抽象物的权利配置,深刻地引发出隐伏在抽象物权利配置之中的诸多价值冲突。
本文将交织运用数据的技术属性、商业实践和法律价值冲突等观察视角。
首先,简要地考察信息产业兴起之后,现行法律如何处理数据,特别是现有的法律体系如何将数据库(database)纳入制度安排。
其次,着重指出大数据(big data)将彻底改变以往法律体系处理数据的制度建构,而问题的焦灼在于,商业利益冲突之后还有难以消解的价值冲突。
最后,尽管抽象物的法律构造之中充满了历史的诡变与偶然,但是信息商品化与商品交换关系的变化则是隐伏其间的主线,抽象物的权利配置背后是商品交换关系的常态与变态的交替,更是信息商品化的反复变奏。然而必须冷静的是,信息抽象物的公共性寄身于数据已重回法律视野之中。
二、数据库的权利配置:价值冲突和商业实践
数据作为信息的存在形式并非相当晚近的历史现象,但是,其成为备受关注的现实问题则是因为个人数据和数据库所引起的一系列政治与法律争议。由于过去技术发展和商业实践的历史局限,人们习惯于将数据所表达的不同信息内容客体作为数据区分标准。于是,在数据的权利构造上,通常认为个人数据关乎个人隐私与人格权利,而数据库则与财产权利关系紧密。数据库,顾名思义,即大量数据的信息集合体(collections of information),是信息产业至关重要的“心脏”。从数据库产业链的演化形态来看,早期的数据库商业模式依赖于已有的版权内容产业,庞杂的版权内容是信息数据化的基本“原料”。因此,数据库的法律问题一开始就围绕着知识产权与不正当竞争,数据收集与存储直接影响着作品的权利安排和版权产业的竞业关系。同时,这也是为什么数据库法律的推动者首先就是相对发达的版权内容输出国,如英国和美国,而被动接受的版权内容消费国则一直在国际立法上消极应对数据库立法。可以说,相较于个人数据所依托的人格权利,数据库并非一个简单的“自然权利”所能覆盖,而是由众多历史关系牵引的复杂问题。
1.域外法经验:何种程度的财产权?
欧盟国家和美国是数据库立法的主要倡导者,但是双方基本立场与立法技术存在重大差别,这些区别折射出抽象物之上权利配置所隐含的价值冲突和商业差异。时至今日,欧洲的《欧盟数据库法律保护指令(1996年)》和《欧盟关于协调信息社会版权和相关权特定方面的指令(2001年)》等立法与司法实践所树立的数据库版权保护、特殊权利保护,与美国积极倡导的数据库反不正当竞争法保护,已成为数据库立法的两大主流意见。
比较欧美的两大主流意见,究其实质,双方争讼焦点在于数据库的财产权利应当到达何种强弱程度上。数据是将信息内容进行数字化处理之后的技术产物,信息内容的数字化过程令人很自然地联想起版权法上所规制的复制行为。而且,早期数据库的制作技术和商业模式直接脱胎于版权法上汇编作品,汇编作品与作品之间的法律关系可以直接映射到数据库与数据之间。尽管大数据兴起之后,数据及数据库的内涵已经超越法律上的传统数据库观念。但是,当初数据与作品之间所想象的法律拟制关系却关键性地决定了数据库的法律构造:财产权利是数据库的起点。
首先,数据库被视为版权法上的汇编作品,数据库的制作与编排因其独创性,遵循版权法上汇编作品的权利安排,将获得汇编作品所享有的版权权利。从财产权的强度而言,比之传统物权,版权是一种相对较弱的财产权利,其有明确的权利期限和严格的权利限制,数据库作为版权客体,其权利配置自然沿袭诸多限制。而且,更重要的是,在实践中,作品的独创性门槛标准会造成数据库因没有独创性而丧失作品资格,在实际认定中很难获得版权法的保护。应当说,数据库不能直接等同于汇编作品,两者只是在认知上有着一种便于理解的隐喻关系,某些有汇编作品性质的数据库只是数据库的一种,而不能代表所有数据库。两者的隐喻,只是由于早期的数据库商业模式迫切需要版权作品通过数字化处理为数据以此构成数据库,才形成数据库主动汇编作品或其他材料而形成汇编作品的法律想象。当然,更关键的原因,数据作为新型的抽象物,沿袭已有的版权法法律概念和法律关系,能够及时地保障数据库产业的利益。
其次,在个案实践中,各国一直都在较为务实地运用反不正当竞争法来处理数据库的法律纠纷。与版权法的权利配置相反,反不正当竞争法明确拒绝将财产权利配置给数据库,而是通过判断具体商业竞争行为的性质和程度来展开一系列复杂的司法考量,特别是分析当事人的商业竞争行为究竟有什么具体影响,以及综合考虑到当事人可能从制作数据库的资本投入中所获得的合理收益。这一法律保护的运作形态即是至今通行美国的数据库的盗用侵权(tort of misappropriation)保护原则,不仅如此,盗用侵权还是屡次立法失败的美国数据库立法的基础原则。换言之,在立法意旨上,美国数据库立法就偏离了欧盟的财产权模’式,其不认为数据库应该获得一种典型的财产权利。盗用侵权是美国法上一种独特的反不正当竞争保护,其流变复杂,在美国各州皆有不同形态的判例规则。盗用侵权保护的独特之处在于,一方面它与基于保护作品的数据库版权权利截然分立,断然否定数据库自身存在一种财产法上的具体权利;另一方面,至少在有关信息或版权内容竞争上的侵权盗用保护,都要求原告实施了某种程度的财产法或美国版权法上的先占适用,使得侵权盗用保护在某种程度上又是以一种准财产权利的存在为前提。当然,相对财产权利属性明确的版权和数据库特殊权利,盗用侵权保护只能算是一种最弱的财产权利。
最后,欧盟所倡导的数据库特殊权利保护是一种强大的财产权利,数据库几乎等同于获得一种不动产意义的财产权利。从权利构造来讲,第一,相比其他抽象物客体的权利行为,数据库特殊权利的权利行为类型化程度相对模糊。以“提取”和“利用”来定义权利行为,一方面因行为特征外延包涵较广,从而扩大了数据库权利人对抽象物利用行为的控制权,另一方面突破了控制商业利用的传统观念,明确认定数据库“提取”或“利用”的行为不管其是否为商业目的都在控制之内。第二,抽象物的知识产权都是有一定时间期限的财产权利,数据库特殊权利依循法理,同样有法定期限。但是根据欧盟立法,经实质更新的数据库保护期应独立计算,换言之,数据库更新即能获得永续时限的数据库特殊权利。然而更具颠覆性的则是权利的正当性,数据库特殊权利的正当性论证完全摆脱了“激励创作”的版权法原理,反而直接以“激励投资、保护投资”为基础。由此,数据库不再受制于传统抽象物上的权利配置原理,作品门檻标准遭到摧毁,产业发展的经济价值成为立法导向。特殊权利论所立足的“投资激励说”,其实也并不是数据库的独特学说,知识产权学说中一直就存在着“创作保护论”与“投资保护论”的争讼。仅从实用效果来看,知识产权在现实运作中的确表现出有效的投资激励。但是,就算不考虑抽象物之上的重叠利益和多元价值这一复杂问题,仅从功利主义的经济效率角度来观察也会发现信息流通与信息生产之间具有十分复杂的流变关系,过强的财产权利可能会严重阻隔信息流通,进而阻滞信息生产。传统知识产权之所以有限保护抽象物,恰恰是反思与权衡的结果,是一种必要的妥协和因势的策略。正是因为如此,数据库特殊权利论遭到了严厉批评和实践质疑。实证研究发现,提供数据库特殊权利保护的国家,他们的数据库产业并因为“投资保护”增强而获得巨大发展。
归根结底,强弱不同的数据库财产权利安排实际上反映了各个国家对同一个价值冲突即信息私有化与信息公共化的不同立场和处理方式,信息私有化代表着鼓励投资、保护投资的经济价值,实现信息的其他价值必须以此为基础;而信息公共化则认为信息流通是人类社会基本准则,更是思想自由、民主政治的基础,优位于经济价值。此外,版权法保护与特殊权利保护的差异还显露出经济激励自身的内部张力:激励的最终目的究竟是激励创作还是激励投资?如前所述,信息所有与信息生产之间关系复杂,权利实现受制于商业支配,财产权利的激励对象可能仅仅是版权产业的投资者而非版权法字面意义上所明确的激励对象即作者,强财产权并不意味着信息生产获得提高。而且,传统知识产权的权利配置充分考虑到信息流通的重要性,在信息数字化技术之前的信息印刷时代,版权法规定合理使用等权利限制以保障信息流通。现在,数据成为信息存在形式之后,具体物与抽象物已然合一,无法接触数据就无法接触信息,数据库赋予强财产权之后将如何保障合理使用?事实上,数据库的商业模式已经造成了某些合理使用的消失,数据使用者的行为要么是商业购买取得数据库使用权,要么就是数据库侵权而盗用数据。
纵观历史,信息抽象物的权利安排深受价值立场选择差异的影响,精雕细琢的权利话语在字面上呈现为不同价值观的义理推演。但是,知识产权实质上是一种特定抽象物的商品化利用权。从这一权利的构造及其演变来说,价值选择是立法者的预期目标,真实而具体地塑造权利的往往是特定抽象物的商业化利用行为。抽象物须与具体物结合才能完整呈现,这一自然的物理属性造成以往的抽象物的商业化利用主要是具体物品形态的货物交易。这样,将抽象物固定制作为某种物质形态的复制行为成为主要的抽象物商业行为,同时亦是最重要的权利行为。具体以版权作品为例,书籍是版权作品的具体物,抽象物的流通则是以具体物的货物交易来完成。在数据技术应用早期,数据主要用以数字化转化处理已有的作品内容信息,当大量的版权内容信息需要集聚性地数字化转化处理时,制作数据库的技术行为就被认为具有汇编作品的特征。因为这些特殊的相似性,早期数据库的商业形态同样很接近传统图书贸易的抽象物商业模式,典型即是数据库光盘软件销售类比为图书销售。从知识产权商务运营的角度来讲,制作版权作品的数字化产品无疑是对版权作品的商业新开发,将与图书贸易形成并行不悖的商业新途径。而且,以理想状况考虑,数据自身的媒介属性,一方面会适宜地减缩传统作品内容产业中各种僵化的交易成本,另一方面会扩大数据信息流通的各种渠道,对整个社会公共利益具有积极的正外部性。发达的版权内容输出国正是看到了数据库的未来广阔前景,才不遗余力地推进数据库的产业政策和立法保护。
发展数据库,借此催生发达的信息产业,这是欧盟数据库保护立法的基本目标,由此才生成出强大的数据库特殊权利保护。然而,强保护的数据库特殊权利仅仅是欧盟数据立法的一个面向,同样强大的个人数据权利保护则是欧盟数据立法的另一个不可忽视的面向。反言之,欧盟并非视而不见数据的多元价值和重叠利益,相反,其有着更加详细周密的思考。欧盟在立法上兵分两路,一方面激励数据库投资,保护数据库商业模式,以版权保护和数据库特殊保护两重权利塑造出最强力度的数据库财产权利;另一方面,又通过立法个人数据保护指令,全程规制个人数据的收集、存储、流转和利用,将个人数据权利视为宪法基本人权,严格控制个人数据的商业实践。由此可见,欧盟的立法本意可能认为数据库和个人数据可以在各自的数据定义范围里获得正当、有效的权利配置,彼此不会冲突影响。换言之,数据库的商业实践与个人数据的法律保护能够获得协调,不会冲突。时至今日,欧盟的这一深远见识利弊两现。第一,互联网与大数据兴起之后,数据库与个人数据成为数据法律的争议核心,表明欧盟双管齐下的数据立法确实切中趋势。第二,商业实践将数据库与个人数据的紧密相连,欧盟将两者并立的立法框架某种程度上反而掩盖了两者的内在联系与价值冲突。其中最为关键的一点,就是欧盟过于自信地认为数据库的产业发展与个人数据的权利构造并无直接冲突。
为什么欧盟会出现这样的认识?笔者认为,这是由于欧盟对于数据库的商业实践有一个基于历史实践的理想预设。这个理想预设就是已经讨论过的抽象物商业利用问题。欧盟沿袭传统的抽象物商业模式,等同看待数据与图书的媒介属性,潜在地将图书商品交易模式视为数据库商业模式的模板即以基于具体物的货物交易来实现抽象物的流通。同时,欧盟亦意识到非物质性的数据难以控制流转的特征,以数据使用替代货物占有,这才在传统版权法的实践基础上构造出行为类型化相对模糊、财产权利程度更强的数据库特殊权利。同时,为与个人数据的法律权利构造相互协调,欧盟在司法实践中甚至忽视数据库的技术与商业发展趋势,以司法判例缩限数据库保护的客体范围。2004年欧盟法院遵循所谓副产品原则(spin-off theory),判定只有直接投资于数据库的生产,从外部收集、核实、汇编形成的数据库才能够赋予数据库权利,而其他不是主动收集而是因经营活动意外获得的“副产品”数据库则不是保护主体,这就将处于数据库发展前沿的以各种行为数据、事实数据收集和挖掘为商业驱动的互联网数据库排除在外。于是,欧盟的数据立法产生了出乎意料的后果,代表数据库发展前沿的互联网数据库不仅仅丧失保护,更重要的是,个人数据的强大权利保护又直接制约着互联网数据库的发展。因此,通观欧盟的数据库法律理论与实践,可以判断,欧盟的数据库与个人数据立法框架、司法实践对不同类型数据的权利配置间接地锁定了数据库的商业模式,即一种类似于图书商品交易的数据商品交易成为权利配置所意外锁定的商业实践模式。然而,意想不到的是,如此权利配置所锁定的商业模式并不是数据库技术乃至数据产业发展的未来趋势,这或许就是导致欧盟数据库立法失败,没有到达预期目的的现实制约之一。
通过立法保护乃至发展以数据为驱动的信息产业同样是美国的经济战略,由于各方博弈僵持不下,美国始终没有在联邦层面上立法通过一部法律来处理数据库的法律问题。自欧洲1996年通过数据立法以来,美国国会试图推进的数据库立法都未获成功,仅从法律构造的角度而言,财产权与不正当竞争的两难选择始终是美国立法的难点。起初,美国毫无疑义地坚持强财产权保护,第108届国会之前所有法案要旨都是承袭欧洲《数据指令》的数据财产权观,但是,“美国立法建议的出发点是欧盟立法的终结点,而它的终结点与欧盟的出发点非常类似”,第108届国会的立法草案表明了美国的最大共识就是回归不正当竞争权利,以商业保护、侵权责任的法律形式处理数据库,信息流动的公共利益如果不是超越信息生产的私有权利,那么至少也同等重要。由于没有统一的法律保护,美国继续沿袭传统的行业自治和竞争法规制,这样的法律现状反而使得美国没有像欧盟那样以具体的权利配置来过早锁定数据库的技术发展和商业实践,最终令美国的数据库产业远远胜过欧洲。此外,平心而论,美国普通法中分散而庞杂的隐私法判例、灵活处理竞业关系而模糊配置权利的盗用侵权用于解决数据库实际法律问题并不逊色。总而言之,欧美的数据库立法与实践告诉我们,数据的权利配置与商业实践的互动关系微妙而复杂:欧盟雄心壮志的个人数据与数据库立法框架在商业实践中进退失据,令其立法目的最终落空,过强的财产权利不一定利于产业发展,稍弱的财产权利也不一定阻滞产业发展。
2.中国的数据库法律保护和商业实践
与过去系统地继受国外知识产权法有所不同,没有强大的国际谈判压力,中国面对数据库的法律争议时,没有亦步亦趋国外学说与司法实践。相反,谨守抽象物权利配置的知识产权法原理,认定数据库属于汇编作品,尤其强调独创性的重要。因此,有学者总结学术界主流观点认为中国法上的数据库法律保护应该是一种混合式的法律交叉保护模式:第一,利用版权法为在编排制作上具有独创性的数据库提供版权保护;第二,利用反不正当竞争法为市场竞争领域内的数据库提供保护;第三,利用民法、商业秘密法为某些种类的数据库提供保护;第四,利用个人数据保密法、隐私权制度及宪法中的某些制度对数据的权利设计进行平衡;第五,利用行政法、刑法为数据库权利提供有力保障。当然,在学说与实务上,要求援引欧盟主导的数据库特殊权利保护的主张也不乏其声。
需要强调的是,在数据库法律保护上,欧洲更强调特殊权利保护论,美国则更侧重不正当竞争法保护,但其共同之处都是一定程度地放弃了版权法上的作品保护原理,迂回地援引其他法律关系作为正当性基础,从而可以重建法律框架来宽泛保护各种内容类型的数据库,特别那些不是作品数据而仅是事实数据,同时在数据库制作编排上亦很难体现独创性的数据库。判断作品的独创性本身是一项相对复杂的法律认定,而数据库制作的技术属性使得其每一个独立数据库的技术架构和制作工艺有很多相同之处,特别是针对同一类信息又具有商业竞争关系的数据库,往往很难区别它们各自所谓汇编作品的独创性。相较其他国家或地区,中国没有回避独创性的底线要求,反而在数据库法律保护中坚持以作品保护为主,反不正当竞争为辅的法律保护原则。显然,这一定程度上造成事实内容型的数据库在中国很难获得实质有效的法律保护。
故此,中国的数据库法律保护是一种较弱财产权的权利安排,如果仅从正式的法律渊源角度来看,这种权利安排主要还是针对具有独创性的汇编作品型数据库,而事实信息型的数据库则几乎是裸露于法律真空之中,只在某些特殊个案裁判中获得其他部门法的相应保护。那么,这种弱财产权的权利配置对中国语境下的数据库商业实践究竟意味着什么?
首先,观察中国目前的整体的数据库产业现状。参照欧美数据库立法目的,一般认为,如果没有相应的法律权利保障,数据库产业应该遭受严重阻碍,特别是司法实践中法律保护十分不确定的事实型数据库。然而,相当吊诡的是,中国的数据库产业发展并没有因为较弱财产权的权利配置而受到严重阻碍,短短十几年的时间,中国的数据库产业从无到有、由少变多获得快速发展。而且,这还仅仅是作品内容型数据库的商业发展势头,其商业实践与欧美国家的早期数据库商业实践相同即一种类似图书商品交易的数据信息供需交易模式。更令人意想不到的是,裸露于法律保护之外的事实内容型数据库,伴随着中国互联网产业的迅速崛起,获得飞跃性发展,已成为互联网信息产业的核心技术及商业未来。其次,从数据库的具体演变来看,事实内容型数据库也并未因为法律权利的缺失而萎缩。相反,生成于互联网产业的事实内容型数据库革命性地扩展了传统事实内容型数据库的数据范围,以人的网络行为数据为纽带重新汇总一切基于人的事实信息,作品、行为或其他事实信息在此意义上均被同质化为数据类型而不视为具有实质区别。从技术演化的趋势来看,作品内容型数据库已被吸纳为互联网产业数据库制作的一个子集,与事实内容型数据库彼此支撑。数据库制作也由此获得新定义,在欧盟数据库司法实践中曾被认为是因经营活动而产生所谓“副产品”的各种非作品内容的数据已经成为数据库制作的主要数据资源。
通观现状,我们是否可以认为中国数据库法律保护的缺失并没有影响数据库乃至信息产业的发展?为此,我们要深入理解中国数据库产业发展的具体环境。
第一,中国的数据库产业刚好内嵌入中国互联网产业,两者几乎同时起步。因此,传统的作品内容型数据库一开始就只是中国数据库产业发展的一个断面枝节,互联网产业蓬勃兴起的平台战略很快推动事实内容类型数据库跃升为数据库的技术未来和商业愿景。与此相应,作品内容型数据库其类似于图书商品交易的数据交易商业模式也遭到边缘化,由此,数据商品交易中极易引发数据版权侵权的法律问题也并不是事实内容型数据库的主要问题,因为事实内容型数据库已将数据由商品交易对象转化为商业秘密,互联网公司基于自身商业秘密而展开数据挖掘,以优化网络服务和优化产品来摸索数据商业实践。因此,除非网络黑客攻击和自身管理失误,事实数据很难外泄,而保护数据的则是代码;同时,按照Pamela Samuelson教授的理解,商业秘密只是商业竞争中受保护的特殊法律情状,并非一种财产权意义上的权利。简言之,事实内容型数据库在实践.中并不亟须一种财产权的保护,相反,依循新兴的数据商业模式的生成逻辑,软件代码和硬件服务器已经构筑出相当于版权法上技术保护措施的自力保护。
第二,决定事实内容型数据库的商业实践及其法律构造的个人数据保护法律在中国近乎空白。事实内容型数据库不需要财产权的强力保护,并不表示它不希望获得财产权保护。但是,在理论与实践上如何界定事实信息的权利配置,尤其有关个人行为的人格和隐私等事实数据如何配置财产权和人格权,这是一项世界范围内的难题。如前所述,欧盟的数据立法正是在数据库和个人数据的权利配置上过度自信,错误地间接锁定数据库的商业路径,意外造成数据库特殊权利失去实效,整个数据法律框架反而妨碍欧洲互联网产业的发展。在欧盟的统一数据法律制度和美国的分散性处理数据法律问题的法律框架之外,中国则是近乎空白的个人数据法律保护现状。尽管随着实践和立法不断推进,在《民法通则》和《侵权责任法》等法律框架下有关个人数据泄露方面的法律保护正在不断受到重视。但是,有关个人数据的收集、存储和分析等正式法律保护依然付之阙如。可以说,正是这样一种“低法治状态”下的个人数据保护状况,与中国目前的数据库法律保护形成了某种难以言述的脆弱平衡,这一脆弱平衡所塑造的法律环境成为事实内容型数据库技术及商业实践兴起的最重要的外部条件。事实内容型数据库在技术发展和商业实践中所显示出的某种程度的独立封闭性,与这一外部条件相互协调适应,才使得尽管个人数据法律保护严重缺失,但在商业竞争层面之外的个人数据法律争议并不特别引人注目。
因此,不能仅仅以数据库的财产权利配置来理解中国数据库产业的发展状况,数据库的财产权利和其他数据的相关权利并非截然无关,两者在何种程度上形成协调或者彼此冲突,会直接影响数据的重叠利益和多元价值。因为,权利配置的衍生后果将是间接锁定抽象物之商业模式。从这一视角出发,才能将中国数据库法律保护的弱财产权配置和中国个人数据保护的缺失相互联系起来,再完整地结合数据库产业的技术发展和商业趋势,由此理解为什么中国数据立法的“荒芜”会成为中国数据商业实践兴起的重要条件。
中国的数据库商业实践依托于互联网产业,互联网甚至重构了作品内容型数据库的商业模式,将货物贸易改造为服务贸易。随着互联网逐渐深入中国社会的各个层面,中国庞大的网民数量及各类数据将会加速推进事实内容型数据库的发展。而这一切将引出与担忧信息生产激励相比更加深重的疑虑,即数据库信息垄断的要害可能并不在阻碍作品生产,而是各种基本事实信息的绝对垄断。特别是,在大数据兴起之后,个人主体的各类数据、商业运营的各类数据和社会国情的各类数据成为互联网时代的主要事实数据,这些备受关切的事实数据被视为经济发展和技术进步的驱动力,而围绕数据的收集、存储、分析乃至最终形成商业服务与数据产品则全部建基在数据库制作之上。数据库的法律问题将以更加复杂的形态呈现出来,这个时候我们重新反思欧盟数据库立法的意外失败、美国数据库立法的屡战屡败和中国数据库立法的“空白荒芜”,就有着非常重大的现实意义。
三、大数据的冲击
时至今日,大数据的概念依然没有一个获得绝大多数科学界、产业界人士所认可的权威定义。目前,商业机构所宣传的大数据商业概念是较为流行的论调,其中美国咨询公司麦肯锡是较早向社会公众推介大数据商业概念的机构,其认为,大数据就是大小、类型超出常规数据库工具处理能力的数据集。观察舆论,这样一种“口袋型”的定义反而脱颖而出,成为大众广泛讨论的大数据概念。纯粹从技术特征而言,学界与产业界普遍认为大数据与以往传统信息数字化技术的区别在于“三V”特征:第一,数量(volume)极大,随着移动互联网、物联网的逐渐成形,社会所积累的数据量正在不断刷新,正迈向前所未见的PB (petabyte)级、ZB(Zetabyte)级数据量,而至今五千年以来的人类文字数据只有5EB而已。第二,数据类型的多样性(variety),数据多样性是指数据类型的复杂性,包括结构化、半结构化和非结构化数据,主要有文本、图片、传感器数据、音频、视频、点击流、代码文件、人机互动的行为痕迹等,类型庞杂,现有的常规软件与算法都无法精准分析这些汇聚一起的多样性数据。第三,数据的实时速度(velocity),与传统的静态数据相比,大数据必须是运动中的实时数据,通过互联网信息传播、各种实时传感器与在线监测不断收集海量数据,始终保持数据的新鲜度。
1.大数据对数据库的超越
互联网技术及其经济形态的演化是大数据出现的主要动力,从传统数据库技术角度来看,数据库是大数据的技术基础,大数据则是数据库的技术飞跃,两者都是针对信息数字化产生的海量数据而发展的数据技术。不言而喻,大数据的技术突破将会深重影响到数据及数据库的商业实践及其法律构造,从原有法律关系的客体角度来观察,大数据相比之下有着非常鲜明的特点。
第一,大数据的数据类型突破了传统数据库的作品数据和事实数据的狭窄范围,以互联网与移动互联网为平台收集各种结构化、半结构化和非结构化的数据信息,一切信息的数字化是其最终目标。而传统数据库的具体应用则起源于文字作品的信息数字化,方便文字信息存储与传播,数据类型多为版权法上的作品。同样的,传统的事实内容型数据库所收集、存储和分析的事实数据也是易于结构化的数据,而且事实内容型数据库的早期商业实践之一就是将能够结构化、可视化认知的事实数据信息作为商品出售。
第二,传统数据库的编排和制作需要独创性才能获得版权法上汇编作品的相关权利,这是传统知识产权理论中抽象物赋予权利的智力创造原则;如前所述,传统数据库的数字化编排、制作技术过于雷同,尤其针对同一信息而具有竞业关系的数据库彼此之间很难区分出独创性,造成数据库的智力创造性偏低,最终引出投资保护与创作保护之争。然而,大数据不仅仅意指海量数据的汇总集聚,更是意谓海量数据的挖掘与分析,这就重新发现数据的信息媒介属性之外的技术属性,因此大数据其最终表现为一种基于数据的智力洞察和决策判断。这无形中使得大数据与软件算法关联起来,当大数据真正实现媒介属性和技术属性的高度融合,呈现为一种实体化的技术产品,此时的数据财产权利究竟更接近于版权还是专利?毫无疑问,大数据相较数据库具有更多的智力创造性。
第三,传统数据库收集原始数据需要大量的资本投入,数据库的制作和维护非常昂贵,但从数据库制作与维护的法律关系主体来看,相对比较单一,主要为数据库制作者的主动收集和作品版权所有人的被动参与。大数据的参与主体则日趋复杂,呈现为多向互动的情况,在互联网和移动互联网的数据信息网络平台上,互联网公司是数据库所有人,互联网用户则是数据提供者,双方通过网络服务协议而彼此关联,缺一不可。换言之,大数据意义上的数据库制作,制作商的资本投入只是其中一方面,网络用户的服务参与是数据的直接来源。随着物联网的兴起,作为财产上的物也将汇入大数据的数据收集之中。
第四,传统数据库的法律关系中存在着类似于版权法上的作品生产者、作品传播者和作品消费者的三角关系,具体为数据内容版权所有人、数据库制作者、数据库消费者。这样的数据库商业模式及其法律关系决定了传统数据库具有某种程度的开放性和公共性,同时亦因数据库的开放和数据复制的便捷,造成盗用或侵犯数据库的侵权行为极易发生。但是,大数据的数据库商业模式及其法律关系则有封闭性的特征,以服务协议合同为纽带,将数据库所有人和数据提供者、数据使用者两两结合在一起,数据库极少开放给社会公众意义上的大众使用。换言之,数据收集并不是主要为了达到对外数据交易的目的,而是内部运营,将大数据意义上的数据库转为数据库所有人产品研发、商业服务和战略投资的重要支柱。从此意义来说,大数据意义上的数据库确已成为数据库所有人的商业秘密和战略资产。
大数据的商业实践还刚刚起步,目前表现出以下几种形态:
第一,汲取过去数据商业模式的有效经验,通过数据挖掘,将数据制作为某种内容信息产品,以版权交易或版权实物交易获得收益。
第二,大数据其实指向的是一种基于数据的智力洞察,所依靠的是软件算法,所获得的是数据分析能力,以数据能力提供服务贸易——尤其是基于数据独占而获得的数据能力——同样是大数据的重要商业实践形式。
第三,在没有法律风险的情况,直接或间接地以原始数据作为商业交易的标的物,这种商业实践比较精巧的形式是通过公司收购或公司入股的公司资本运作间接地将原始数据作为公司资产而货币化,这一现象在中美互联网产业界屡见不鲜。当然,更加完整地体现大数据所表现的商品服务化和内部封闭性的商业实践毫无疑问是各大互联网巨头公司都将数据视为自身公司发展的驱动力,换言之,大数据内化为公司的核心竞争力。
这些技术特点和商业实践投射到法律关系层面会造成什么样的影响呢?当初传统数据库财产权利争议兴起之时,与信息网络技术相伴随的新型数据库并非没有被研究者关注到,因为两者本身就是一个数据信息技术系统的不同板块组成。只是由于依然局限于数据客体类型作品与事实的简单分类,依然局限于制作商投资巨大的单一主体视角,局限于传统抽象物之上的财产权利框架,因而一开始就将数据库的法律起点定位在财产权利。事实证明,如果这不是一个错误的方向,也是一个模糊的起点。
2.大数据的法律冲击与价值冲突
大数据的法律冲击主要体现在两个方面。第一,重新唤起人们对数据保护的法律思考,反思过去数据库法律保护所延续的财产法框架,抽象物上赋予较强的财产权利是否能适用数据保护,是否有利公众利益。在实践中,商业秘密、版权、专利权、个人数据权利、合同权利及广泛适用的不正当竞争法都从不同层面去参与数据法律构造的复杂演化,这些强弱不同的财产权利在具体个案中反复伸缩,不断探试着数据私产化的程度及其可能激起的各种强烈反对(如图所示的法律链条)。显然,财产权利的数据法律框架会突破了以往的三种模式,未来将呈现极大的偶变性。
第二,数据的财产权利安排已经不再是有关数据的权利(力)建构的主要争议,个人数据权利和国家数据主权全方位地进入数据权利(力)的演化逻辑之中。个人数据权利和国家数据主权并不是现有的法律概念,它们都是在已有的法律概念中推理衍生出的新内涵,个人数据权利来源于人格权和隐私权;国家数据主权来源于国家最高主权对一国内的自然资源具有占有、管理、控制、利用和保护的权力,数据主权最典型的体现是2014年以来一些国家所规定的数据本地化现象,尤其是2015年9月1日生效的俄罗斯数据本地化法案,其要求互联网公司将俄罗斯用户的个人信息数据存储到俄罗斯本地服务器。
当前最为紧迫的现实问题则是数据的权利配置困境,个人的数据权利与占有原始个人数据的数据库所有人财产权利之间充满了紧张矛盾,甚至可以说,传统数据库基于财产权利的体系建构由此将遭到重构。率先在这一方面破冰试水,甚而改弦更张的地区依然是欧洲。欧盟的《数据保护指令》已公布执行15年,目前又计划提出新的《一般数据保护条例》(Draft of General Data Protection Regulation)来取代前者。值得注意的是,欧盟一反故态,不再坚持反复强调的数据库保护的财产权立场,重新正视个人数据与数据库之间的权利冲突,提出了以“被遗忘权”为代表的个人数据权利,其所专门针对的就是大数据意义的数据库模式:2014年5月欧洲法院判决谷歌公司必须依法承担侵犯个人数据“被遗忘权”责任。同时,在具体法律规范的适用方面,数据收集、使用、流动和泄露等几个层面都不同程度地渗进个人数据权利主张,例如,“数据最小化”原则已经成为数据收集方面最基础的法律原则,很多国家数据保护法中都有所体现;在数据使用方面,用户应该享有数据控制权以对抗数据库所有公司的数据滥用已成为一般性的大众共识;而极其复杂的数据流转问题,则受到更加严格的政府监控和个人限制,澳大利亚在《隐私法》修正案中明确规定数据流动,尤其是数据售卖要受到严格监控。
尽管欧盟关于数据库法律保护的基本框架在名义上并未更改,但大数据兴起之后,数据库特别保护论在欧洲似乎已经式微,这样的急剧变化很难以法律理论的自身逻辑来解释,必须予以政治经济学的洞察。简单地说,欧盟的数据库特殊保护论并未保障欧洲传统数据库产业的高速发展,相反,在互联网产业兴起之后,美国与东亚地区在20年互联网产业竞争发展中已经跃升为世界性的互联网产业核心,而互联网公司巨头成为大数据意义上的数据库所有人;欧洲在这一场新的数据圈地运动中明显是失利的一方。而且,由数据所有权而衍生的数据主权在“棱镜门”事件中已经让全世界都学了一课。欧盟的数据立法风向变化似乎更应该从经济产业公共政策和国家安全的角度去审视,申言之,围绕数据的价值冲突已经突破了信息私有化与信息公众化的原有结构矛盾,数据信息原本所具有的多元价值和重叠利益终于在数据这一新形式里重新完整地释放出来。对于已经奇迹般地弯道超车、在互联网产业中异军突起的中国互联网产业来说,数据的法律构造同样迫在眉睫。
目前的数据产业直接根源于互联网产业的变革和创新,环顾各国,中美两国不仅在互联网产业上具有某些相似性,而且在互联网产业崛起的过程中其法律治理也具有某种同构性即所谓“低法治”状态。更加意味深长的是,比之欧盟依然全面规划、大兴土木地改建数据立法框架,中美两国面对本国异常复杂的商业实践,在法律治理上都呈现出一种“补丁”式立法,利益重叠、权利交错的数据使得利益攸关的各个领域的法律治理都显得保守审慎。比如,面对数据产业与隐私保护的冲突,在国内,美国至今维护其信息隐私权的分散化法律趋势,明确表示不会照搬欧盟的“被遗忘权”,同时以国际安全为由,强化其与各大跨国互联网公司的数据合作,并“军工复合体”的商业投资形式与众多互联网公司合作发展数据产业前沿。在国外,面对欧盟缩紧其数据跨境流动的“安全港”规则,侧重从国际贸易的保守角度以经济互利、产业交换的手段去弥补,“跨大西洋贸易与投资伙伴关系协定”(TTIP)即是典型一例,同时“跨太平洋伙伴关系协定”(TPP)也有类似规定。中国与此类似,受人期待的《个人信息保护法》并未出台,只有工业和信息化部2013年制定了《电信和互联网用户个人信息保护规定》,结合之前颁布实施的个人信息保护国家标准《信息安全技术公共及商用服务信息系统个人信息保护指南》,糅合形成了个人信息保护政策的初步框架。之后,2015年又出台《网络安全法》(草案)以网络信息安全一章节的形式融人综合的网络安全治理中。与此同时,数据留存、数据交易和数据开放也纷纷在国家与地方各级层面上展开,而这些法案都显现出尊重甚至迎合现有商业实践的某种暧昧立场。是的,商业实践的号角比法律治理的试探要勇敢得多。
2015年4月14日,地处西南的贵州贵阳市正式挂牌成立贵阳大数据交易所。据报道,贵阳大数据交易所是工信部批准的唯一一个试点机构,其作为第三方机构对数据进行清洗和建模分析,为买卖双方提供一个数据结果交易的场所,而不是直接进行底层数据库的原始数据交易。但是,该所认为大数据本身是一种资产,值得进一步探索数据抵押融资、典当和期权融资的数据金融模式。大数据产业的商业模式探索日趋激进,在规避原始数据库交易的同时,数据挖掘和数据交易被默认为一种资产使用及交易方式。抽象物的权利配置历来都与抽象物的商业实践模式息息相关,目前中国大数据的资产界定和交易探索由于沿袭着传统数据库的财产权利框架,如前所述的种种权利交叠和价值冲突,在激烈的商业竞争面前暂且搁置。
数据作为信息新的存在形式,依据抽象物赋权的传统法律原理进行权利安排本无不可,而且退一步说,如果依然因循过去的数据法律框架思路,反而更容易且更深入地将抽象物“非物质性”所内蕴的多元价值和重叠利益暴露出来。不管赞成还是反对目前知识产权制度安排的学界观点,都有一定程度的共识,认为知识产权的价值目标应该多元化,但实证考察知识产权制度的实际运作却又不约而同地发现,知识产权主要功能其实是在保护投资而非所谓的作品创造。然而碍于知识产权传统理论与实践的种种限制,投资保护论最终只能在新型抽象物的法律构造中跃为主流意见,并以此希望突破传统知识产权相对较弱的财产权框架,赋予抽象物更强的财产权利。大数据兴起之后,围绕数据的价值冲突愈加明显,财产权利和人身权利、商业发展和国家安全、信息流通与作品激励这些彼此冲突的利益与价值需要一个重新的安排。而且,不容乐观的是,大数据时代的数据库所有人比其他任何时代的抽象物所有人拥有更为强大的技术垄断能力,对于个人数据权利人来说,没有法律的直接介入,几乎没有任何技术能力去维护个人数据权利。正是在这样的情况下,将支配性更强的财产权利赋予数据库制作人,是否有利于数据产业发展,是否有利社会公众,恐怕都是悬而未决的问题。现实的产业经验表明,欧盟的数据库特殊权利保护并没有促使其信息产业的加速发展;中美数据公司巨头依靠各自的大数据商业实践最终造成了至今拉锯不断的数据孤岛现象;公众数据非常态的跨境商业流动将很大程度上烕胁国家数据主权。
以数据为资源的信息产业兴起不能简单视为一个经济现象,数据已经深入到现代社会的方方面面,对我们的个体表达、文化创造、社会生活、政治意识产生了重大影响,与周遭的自然环境一样,信息产业为我们构筑了一个崭新的人造环境,这是一个用“比特”来构造的数字化生存空间,在这里,思想和信息的传递成本已经近乎于零。但是,信息产业所塑造的这样一个新世界并不是如许多人所臆想的那样虚拟而无限,相反,它是由各种数据产品、服务合同、知识产权和基础设施所围造的物质实体,这些各种数据、代码和电流所承载的绝不是免费之物,同时,它们所承载的也绝不是单纯的经济利益所能覆盖的。必须重新探索数据的法律构造路径,这需要我们从理论上反思抽象物的法律构造传统原理,从现实中去观察抽象物的商品交换模式,从价值冲突层面去正视无可回避的权利困境,这样才可能博弈出一个相互协调的法律政策框架。
首先,我们必须承认抽象物的法律构造不存在一个单一的、线性的所谓客观规律,而是财产权观念、人身权观念和政策利益考量相互影响,历史路径与现实格局彼此交错。现代知识产权法的渊源之一英国知识产权法的历史演变已经充分证明,围绕抽象物的知识产权法由“一组复杂而变化着的环境、实践和习惯共同作用的产物”。故而,抽象物的价值多元和交叠利益表明不存在任何优先权利而预定抽象物的法律构造,相反,权利配置可能是一个妥协性应对的权宜之策,但内含复杂而艰难的利益协调。因此,作为抽象物新类型的数据它不应该贸然锁定为新类型的财产,反需谨慎对待依附其上巨大财产利益,以网络个人数据为例,互联网公司以免费服务换取个人数据的对价是否合理合法尚有斟酌。更何况,数据的媒介特点和技术属性已经超越过去种种抽象物媒介,不断演化的商业实践还在持续发掘其中价值,过强的财产权权利配置可能会严重影响依附其上的其他重要价值,例如,过于强调数据跨境流通的商业价值,个人数据的隐私性和国家数据的安全性又将如何保障。欧洲的历史经验表明,过强的财产权利配置如果不与其他权利相互协调,适得其反的结果也可能出现;谦抑的立法理性不是一句空话。
其次,历史上很多新型抽象物——如计算机软件、形象公开权、商业方法专利——都是伴随着技术与商业的双重变革而进入非物质性的知识产权体系之中,但是技术革命与商业贸易究竟怎么改变知识产权的,新的知识产权权利如何证成,新的知识产权客体又如何认定,这里面的具体逻辑为何?笔者认为,真正将技术革命与商业贸易相互勾连起来的正是商业模式的变迁,商业模式的变迁根源于商品交换行为的变化,而抽象物的商品交换行为正是知识产权的权利行为在商业实践中的具体体现,三者环环相扣,彼此支撑,最终投射进法律规范层面即是知识产权的历史演变;而数据不过是这一古老逻辑的新展开。大数据将促进当代经济中抽象物商业模式的巨大变迁,商品交换关系的变化必然要投射进法律规范之中,法律规范会将实践中的现实逻辑重新颠倒性地叙述在法律文本之中,完成对现实中的商品交换关系的正当性叙事,顺利实现古老财产权对新兴非物质客体的攫获和控制。数据库特殊权利保护论和大数据资产论正是前述逻辑展开的自然结果。因此,我们不能仅仅依据传统知识产权所给定的法律框架刻舟求剑地搬用到数据的法律构造之上,也很难做到一厢情愿地以个人数据保护的优先性去严格控制拥有强大技术能力的数据巨头。而是应该回到现实商业场景中去观察数据的商品交换行为,测定其限度、观察其效果、衡量其得失,确定各种交叠权利彼此冲突的范围,这才是对其数据进行权利设置的切实之道。数据的技术发展表明其与商业实践息息相关,其法律构造依受制商业实践的曲折演化,恰如马克思主义法学家帕舒卡尼斯所言“反映法律形式的唯一社会关系就是商品拥有者之间关系”。通过数据媒介,作品内容、事实信息、人格隐私这些抽象物才整合进新的商品交换关系之中,没有数据媒介,这些抽象物难以进行商品交换,没有商品交换,这些抽象物之间难以爆发激烈的利益、价值冲突。
最后,以上两个不同方面的论述似乎存在矛盾,一方面谨慎对待抽象物财产权的配置,另一方面强调观察数据之商业实践具体演化。难道数据商业实践的前提不是财产权吗?传统的知识产权并非一种典型的财产权利,知识产权并不保护相关抽象物客体的信息独占和垄断,而是对客体的商业利用行为进行垄断,典型即为财产权利力度最强的专利权,公开专利技术方案内容信息而获得独占专利技术方案的商业利用独占权利。这种具体权利体现为一种禁止权,垄断某一商业利用行为而禁止他人未经许可而实施该行为。因此,这种权利配置模式并不是以财产权利的所谓价值目的性为伸张,相反,而是通过甄别具体的商业行为的正当性来定义财产权利的具体权能,这在知识产权基础理论里通常被理解为权利法定原则,体现了知识产权的功利主义和社会本位。从这样一种功利主义和后果主义立场出发,确实会陷入权利配置和行为正当之间的两难判断,但是,这未尝又不是对财产权利并非来源于道德论辩而是来源于实际行动的真实揭露?抽象物之上的财产权历来皆是发现的而非自然的。申言之,谨慎对待数据财产权,是强调抽象物之上的财产权利构造须参照知识产权法的历史经验和价值定位;观察商业实践的演变,是突出数据作为新型抽象物的独特属性和潜在影响还远远未被人们清晰认知,此时,辨析某种数据商业实践行为的正当性对于抽象物之权利配置就显得尤为关键。
四、结语
因为出现了数据这种新型信息形式,我们借此机会重新发现某种抽象物如何在历史路径和现实条件之间沿着商业实践逐渐演化其权利构造。欧美国家的立法得失与中国的法律空白显示,数据的权利配置与商业实践关系复杂。第一,数据财产权利的自身限度需要在商业实践中获得确认;第二,数据之上种种权利的各自边界须在商业实践中相互协调。商品交换的行为及其限度成为理解数据权利的基本视角。
信息数据的公共性与私权性交织而冲突,已无可争辩,从数据库到大数据的演化过程不过是将其深层次的公共性重新通过商业实践而暴露出来。不断演进的各种革命性巨变还在持续地推进这一过程,如以云计算、大数据为代表的技术革新、以“数据资产”为代表的商业革新和“数据开放”为代表的观念革新,在某种程度上这是对抽象物私权性质简单认知的拨乱反正,权利(力)的边界只能是另一权利(力)。因而,围绕数据的法律主体和法律场域已经在性质上、范围上超出以往,要以一种层次分明的宏大视野才能包容透视到数据之上的重叠利益和多元价值,大数据需要一种公私混合的“大法律”框架与之对应,一种三类主体互动博弈的数据法律构造活动已在逐渐展开,即个人数据提供、享用者——商业数据使用、管理者——国家数据监管者正在实践中各自站位。申言之,数据抽象物之法律构造的起点应该是公共性与私权性并重。
看到这里了,分享一下呗~
如果你喜欢我们的推送,请长按下方的二维码,关注我们,谢谢支持!此外,如果你有什么想法,以及对本文的评论,欢迎在下方留言。