林华:大数据的法律保护
点 击 蓝 字
欢 迎 关 注
大数据正在改变众多产业甚至全社会,而对大数据的内涵及保护模式在全球都在争议之中。本文认为技术和产业意义上的大数据在法律中接近的概念是汇编作品/数据库。实践中绝大多数大数据是不具有独创性的数据汇编,以邻接权保护大数据的立法模式比以版权、数据库特殊权利、商业秘密权、隐私权、合同和反不正当竞争等立法模式更加符合逻辑和法理,也具有更高的可行性。
Mikalojus Konstantinas Ciurlionis · The sun
大数据的法律保护
文 / 沪江网法务部 林华
目次
一、大数据交易的交易安全
二、大数据法律保护现状
三、数据库保护的未来
(一)大数据的意义
古希腊思想家毕达哥拉斯认为数是世界的本源,也许这是人类初次领悟到数的伟大。著名未来学家阿温.托夫勒在1980年出版的《第三次浪潮》中预言:“如果说IBM的主机拉开了信息化革命的大幕,那么‘大数据’则是第三次浪潮的华彩乐章”。
从出现文明到2003年,人类总共才创造5EB(百亿亿字节)的数据,但现在仅两天就造出相同数据量[i]。互联网每天收发着3000亿电子邮件;百度每天响应超过60亿次搜索请求;每天上传到Facebook的照片甚至达到2.5亿张的天文数字。互联网和IT代表的信息产业怀着吞噬一切的野心颠覆了几乎所有传统产业,也改变了人类沟通甚至生存方式。信息是由数据构成的,大数据无疑是信息经济的制高点,也是经济和社会赖以运行的基础。掌握大数据意味着对内容的控制、用户偏好的了解和市场趋势的洞悉。数据既是企业的核心资产也是核心的竞争优势。技术和大数据始终是百度的战略基石,马云为阿里规划的平台、金融、大数据三个发展阶段更能揭示数据对互联网企业的终极意义。
大数据的运用范围极其广泛,几乎无所不包。百度利用从互联网搜索等多个应用获得的数据,从而推出针对具体用户的精准网络广告;沃尔玛超市在海量的购物统计结果中发现众多男性用户购买婴儿尿布时会附带购买啤酒,利用这个发现安排商品摆放位置从而增加了相关商品的销售;视频网站Netflix通过研究网站数据分析出观众对影视内容、风格、导演、演员的偏好,成功买断红遍全球的《纸牌屋》;谷歌利用搜索数据推出流感预测,把大数据应用到社会公益领域;微软纽约研究院经济学家David Rothschild利用大数据预测奥斯卡奖得主,在2012年成功预测24个奖项中的19个之后,在2013年第86届奥斯卡预测中创下直接命中21个奖项的记录。如果知道Rothschild在2012年美国总统选举51个选区结果中提前押中其中50个结果,就不会对奥斯卡奖的预测成功率感到惊讶。
(二)什么是大数据
技术、经济和产业界在实践中对大数据有不同的理解和定义。其中IBM对大数据概括出的4V特征受到学者和产业界众多认可。IBM的4V特征即大数据量(Volume)、快速变化(Velocity)、庞杂内容(Variety)和(不)精确性(Veracity)[ii]。著名产业调研机构Gartner认为大数据是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。Gartner给出的大数据的3V特性和IBM相当接近,分别是巨大的数据量(Volume)、数据的快速处理(Velocity)、多变的数据结构和类型(Variety)。
大数据并不是固有的法律词汇,法律中也找不到技术或产业意义上的大数据对等的概念。中国《著作权法》第14条所规定了汇编作品,即“汇编若干作品、作品的片段或者不构成作品的数据或者其他材料,对其内容的选择或者编排体现独创性的作品”;欧盟数据库指令第1条规定了可受特殊权利保护的数据库是指经系统或有序的安排,并可通过电子或其他手段单独加以访问的独立的作品、数据或其他材料的集合。汇编作品可以看成有独创性的数据集合,欧盟规定的数据库可以是不含独创性的数据集合。汇编作品和数据库是最接近大数据的保护客体,大数据可以主张著作权或特殊权利保护。区别在于法律不关注汇编作品或数据库的体量有多大,也不会区分数据是否类型多样、是否准确以及是否在变动。
(一)版权外的数据保护
大数据是很多IT企业的核心资产。据不完全统计,仅国内A股上市公司中主营大数据相关业务的企业就有数据技术提供商超图软件、科大讯飞、拓尔思,数据服务提供商上海钢联电子、广联达、大智慧、四维图新等20多家。上市公司卷入的重大新类型数据权利侵权纠纷不断涌现,包括同花顺集团两家子公司在2012年底被万得信息技术公司在上海市第一中级人民法院索赔9,920万元人民币,以及上海钢联电子最近上海、江苏、北京、广东等全国各地法院起诉多家网站未经许可使用原告网站的钢材交易数据。数据集合根据不同情况可能受到多项法定权利的保护,数据保护并不是单项填空。根据中国法律,在版权法(著作权法)之外就有商业秘密权、隐私权、人身权、合同债权以及不正当竞争保护可能被主张。
1.商业秘密保护
《反不正当竞争法》第10条第三款规定:“本条所称的商业秘密,是指不为公众所知悉、能为权利人带来经济利益、具有实用性并经权利人采取保密措施的技术信息和经营信息。”根据该项规定,满足秘密性、保密性、实用性的技术信息和经营信息即可以作为商业秘密保护。随着司法实践对商业秘密认定不断倾向做宽泛解释,通过主张商业秘密权保护数据的案例呈增多趋势。在衢州万联网络技术有限公司与周慧民等侵害商业秘密纠纷上诉案中,一审被告周慧民等是一审原告万联公司的前员工,在2004年5月底至6月初从万联公司离职后创办与其相竞争的网站,利用从万联公司擅自截取的50多万个注册用户信息,通过在互联网公告和通过QQ群通知等方式引导原告注册用户到被告网站。两审法院均认为虽然单个用户的注册用户名、注册密码和注册时间等信息是较容易获取的,但是(原告)网站数据库中的注册用户名、注册密码和注册时间等信息形成的综合的海量用户信息却不容易为相关领域的人员普遍知悉和容易获得,此外,上述用户信息又具有实用性,万联公司也对上述用户信息采取了保密措施。法院由此认定万联公司的网站用户注册信息属于商业秘密,判决五被告共同赔偿原告经济损失100万元。
2.合同法保护
上证所信息网络有限公司(下称上证信息)诉新华富时(新华富时)指数有限公司违约案缘由是上证信息公司曾通过合同授权新华富时使用上海证券交易所实时股票行情编制指数,授权明确禁止使用上证指数开发衍生产品。法院审理后认为,原被告之间签订的合同依法有效,新华富时利用上证指数开发指数期货的行为违反合同约定,应承担违约责任。
3.反不正当竞争法保护
《反不正当竞争法》第2条规定:“经营者在市场交易中,应当遵循自愿、平等、公平、诚实信用的原则,遵守公认的商业道德。本法所称的不正当竞争,是指经营者违反本法规定,损害其他经营者的合法权益,扰乱社会经济秩序的行为。”反不正当竞争法具有高度抽象性和个案中宽泛解释的弹性,能够对成文法静态保护的权利形成兜底的动态保护。援引郑成思老师的著名比喻,就是如果把专利法、商标法、版权法这类知识产权单行法比作冰山,那么反不正当竞争法就如冰山下使其赖以漂浮的海洋[i]。
尤其在对不满足版权法对独创性要求的数据集合进行保护的案件中,禁止不正当竞争往往是原告和法院的标准选项。上海霸才数据信息有限公司与北京阳光数据公司技术合同纠纷案二审中,北京市高级人民法院认为一审原告霸才公司的SIC实时金融信息作为一种新型的电子信息产品应属电子数据库,在本质上是特定金融数据的汇编,这种汇编在数据的编排和选择上并无著作权法所要求的独创性,不构成著作权法意义上的作品,不能受到著作权法的保护。但霸才公司作为特定金融数据的汇编者,对数据的收集、编排,即SIC实时金融信息电子数据库的开发制作付出了投资,承担了投资风险。该电子数据库的经济价值在于其数据信息的即时性,阳光公司正是通过向公众实时传输该电子数据库的全部或部分而获取收益,阳光公司对于该电子数据库的投资及由此而产生的正当利益应当受到法律保护。
4.人身权
个人信息受隐私权保护,2013年引起不小风波的大规模开房记录泄露事件属于对当事人人身权中隐私权的侵害。以DNA基因序列为代表的个人信息同样是典型的隐私权保护客体。
(二)数据库的版权保护
1.汇编作品模式的数据库保护
根据《著作权法》第14条的规定,汇编作品是在选择或者编排中体现独创性的作品集合或其它信息集合。《著作权法》对汇编作品的该条与《世界知识产权组织版权条约》(WCT)第5条规定及《与贸易有关的知识产权协议》(TRIPS协议)第10条二款的规定实质相同。从以上著作权法规定和中国加入的知识产权国际条约规定可知,著作权所保护的汇编作品可以由电话号码、交易行情、股票走势等不能单独构成作品的信息、数据或其它材料组成,这一点使著作权保护在理论上延及数据。但因汇编作品并不能覆盖很多极具利用价值的数据库,以汇编作品版权模式保护大数据有先天不足,致使立法本意与实践可能产生南辕北辙的效果。
2.版权保护中的独创性难题
具有独创性是作品受著作权保护的前提,也恰是数据库版权保护取舍两难的症结。《著作权法》将数据库划为汇编作品的类型,规定其内容的选择或者编排体现独创性。要求数据库满足作品的构成要求就必然要求数据库具有独创性,接踵而来的难题是能独立构成作品的数据库并不需要法律专门规定就可以直接受到著作权保护,而很多具有高度商业价值迫切需要法律保护的事实信息类数据库如号码簿、通讯录、地图或交易行情却不具有独创性。精选类汇编作品如《唐诗三百首》、《古文观止》、《新概念作文选》贵在选择得当,不同汇编者对内容选择和编排可能差异巨大,独创性显而易见。而大全类数据库如《永乐大典》、《四库全书》、《唐诗大全》、《吉尼斯世界纪录大全》或《法规大全》则正好相反,其价值在于数据材料的全面而不在于选择,所以汇编人的个性和偏好都会降低而不是有助于数据库的价值。大全类数据库的编篡可能需要巨大投入,《永乐大典》和《四库全书》分别是明清两代以举国之力完成的浩大工程,这与个人或独立团队就能完成的精选类汇编作品有重大不同。按独创性标准衡量汇编作品的保护,可能使具有重大意义和实用价值的大全型数据库成为弃子。
3.结构保护的边界
从另一个方面看,汇编作品的结构和编排体例虽然可能体现作者在选择或者编排上的独创性,却未必具有保护价值。数据库结构与数据相比如同仓库与存货,真正价值往往在数据本身而不是结构。航班信息按时间早晚、价格高低、打折多少、航空公司名称排列都可以,实质都是同一个信息集合。而很多行业类数据库结构在逐步标准化和统一化,例如财务报表,也使对数据结构的保护失去意义。而在检索技术在所有数据库都普遍运用的情况下,数据库的结构随时可以变化,也表明保护数据库结构很多情况下如同鸡肋。进一步来看即使对数据结构进行保护,也可以在使用他人数据库实质性内容时改变编排来轻易规避侵权责任。恐怕这又是汇编作品模式对数据库保护所力不能及的。
4.案例解读
如前所述,以汇编作品版权模式保护数据库的重大缺陷之一在于无法保护众多有很高商业价值却没有著作权法所要求的独创性的数据库。北京市第一中级人民法院2009年二审的大众点评网诉爱帮网民事裁定书中指出:“大众点评网对于网友点评文字系按照时间顺序排列,排列方式是常见的排列方式,并不具有独创性。同时,本案现有证据亦无法看出被上诉人对于用户点评的内容进行了选择”。二审法院据此认为大众点评网中网友点评字的集合不构成汇编作品,推翻了一审法院对原告点评数据库受版权保护的判决。
通过认定数据库具有独创性从而适用版权保护的也有以下典型却仍有争议的案例。在上海市高级人民法院二审的上海易图通信息技术有限公司诉上海城市通网络信息技术有限公司地图作品侵权纠纷案中,法院认为,“根据我国著作权法规定,具有独创性的地图作品,受到法律保护。因此,无论被上诉人上海1:2000数字化地图是否为底图,只要其具备独创性,即应受到我国著作权法保护。本案中,被上诉人制作的上海1:2000数字化地图,是其根据对上海地区的道路、河流和铁路信息的测量数据,根据自己独特的判断和取舍方法,绘制出的具有与其他地图不同表达方式的地图作品,具有独创性,属于我国著作权法规定的地图类图形作品,受到法律保护。”
在该案判决书中法院并没有提到地图的测量数据受保护,而是指根据测量数据绘制地图时的独特判断和取舍方法具有独创性,所以地图可受保护。按此思路,未经人工处理的测绘原图以及卫星云图由于没有经过独创性的判断和取舍,其是否受版权保护成为悬疑。
在北京市高级人民法院二审的中经网数据有限公司与香港中华网国际网络传讯有限公司侵犯著作权纠纷案中,法院在判决书中指出“中经网数据有限公司(中经网公司)经营管理的中国经济信息网(中经网)网页上所载的“中经景气动向”、“中经先行合成指数”等图表的曲线走势图并不是抄袭他人的,而是独立完成的。其次,正是因为中经网公司带有主观性的差值填补、季节调整才使图表中某些“点”的位置的安排体现了与其他公司所制作的图表的区别。无论是图表坐标轴刻度的选择,还是颜色背景的选择,均使得整个图表的形态会因绘制者不同的判断而呈现出区别,即上述曲线走势图表所表达的内容能体现制表人员独自的判断。因此,中经网网页上的所载的上述图表具有我国著作权法所保护的作品的独创性。对金融业而言,行情数据本身才是最有价值的资产,只要有准确、及时、充分的数据,用很多软件可以非常容易的实现多种多样的图形表达。即使Excel软件都可以提供饼图、柱状图、曲线图、星状图等等数十种选择,何况强大的专业分析软件。把无足轻重的制表人员的判断作为图表可以受版权保护的理由,虽然达到保护金融数据库的目的却造成了逻辑的崩溃。
(一)以反不正当竞争法保护数据库
反不正当竞争法和版权法相比具有弹性好,解释能力强,能在一般法保护不足情况下对权利进行兜底保护的优点。但以反不正当竞争法保护数据库并非万全之计,反不正当竞争法的适用同样有着自身难以客服的缺点。首先,反不正当竞争法的立法目的是保护市场秩序而不是直接以私权作为保护对象。数据库权利保护更多基于私权而不在抽象的市场秩序。其次,反不正当竞争规则大多由原则条款构成,不正当竞争行为的界定有高度不确定性,在个案中受裁判人主观认知的影响较大,很容易使案件结果难以预测。在德国,案情基本相同的两个数据库不正当竞争纠纷案在不同的法院得到了不同的判决。案件之一是1993年汉堡联邦地区法院审判的一个电子电话号码案,被告直接从原告的电子电话号码簿里下载数据编入自己的电子电话号码簿,其行为被汉堡联邦地区法院判决为不正当竞争行为。而在1994年法兰克福上诉法院审理的另一个案件中,被告将官方7万多页的电话簿稍作修改,将其中有关德国电话转接的数据扫描进三张光盘组成的电子数据库,法院却判决被告的行为不构成不正当竞争行为,理由仅仅为被告的电子数据库与原告的纸质数据库不存在直接竞争,原告数据库中不受版权保护的数据可以为包括竞争者在内的任何人自由利用[i]。
(二)以特殊权利保护数据库
欧盟部长理事会1995年通过并在次年生效的《关于数据库的法律保护的指令》(Directive 96/9/EC on the legal protection of databases,下称数据库指令),另辟蹊径规定了对不构成作品、不受著作权保护但又有实质性投资和数据库给予特殊权利(sui generis right protection)保护的解决方案。数据库指令第7条第一款规定:“各成员国应为在数据库内容的获取、检验核实或选用方面,对证明在质量与/或数量做出实质性投资的数据库制作者赋予防止对数据库内容的全部或在质量与/或数量做出实质性投资的数据库为实质部分进行摘取(extraction)与/或反复利用(re-utilization)的权利。[ii]”该项数据库特殊权利保护的期限为15年。
欧盟立法在将不受著作权保护的数据库纳入专门法/特别权利的保护范围,以及避开保护意义不大的数据库结构编排而直接针对最有价值的数据库内容摘取/利用进行保护这两点上取得了显著进步。数据库特殊权利保护作为新生权利种类难免引发理论上的不同观点。不少学者认为特殊权利保护使数据面临被垄断,信息自由受到重大威胁。然而信息和有形资产不同,其具有近乎零成本无限复制和传播的特性,更重要的是版权和特殊权利都只是有限专有权,而并非专利权那样具有绝对的排他效力的垄断权。数据库特殊权利的权利人并不能排除他人对独立完成或独立创作的同样的数据库单独享有权利,所以数据库特殊权利并不像假设那样容易阻碍信息自由流动。
但数据库指令创设数据库特殊权利作为一项制度创新当然会冒风险,有其自身理论积淀和实践检验的不足。首先,在各种新客体和新的侵权方式层出不穷的背景下,不经充分论证就在现有规定外另起炉灶、规定特殊权利可能过于匆忙。如果技术发展使新事物和权利客体继续涌现而为之一一设立特殊权利保护,则特殊复特殊,处处是特殊也就难言特殊。其次,数据库特殊权利明确指出立法目的是保护对数据库的“投资”,这个理念与其说是基于法理不如说更倾向产业政策。美国国会分别在1996年、1997年和1999年三度讨论和欧盟数据库指令同样以保护投资为思路的三个数据库特殊保护的法案,即H.R.3531法案、H.R.2652法案和H.R.354法案,立法机关最终未能达成一致。欧盟委员会在2005年在对数据库特殊权利立法效果的调查结果中也评估认为特殊权利的令人费解(The “sui generis” right is difficult to understand),且没有达到设立特殊权利保护的经济效果(Theeconomic impact of the “sui generis” right is unproven)[iii]。
(三)以版权邻接权保护数据库
知识产权法受新技术以及社会、经济趋势变化的影响巨大,在所有部门法中变动最活跃更新最频繁。GUI(交互界面)、实用艺术品、计算机软件等特殊或具有交叉保护特点的客体层出不穷,始终推动知识产权法自我革新和进化。把设立新权利作为解决新问题的标准模式很可能为将来埋下又一个新问题,应对的最好办法是对现有法律资源深入挖掘、优化整合,尽量利用现有法律和法理的合理部分加以解决。
版权邻接权又被称为传播者权,是版权法为保护没有独创性的作品传播行为而赋予的权利。尤其对于重在搜集整理的大全型数据库,其内在价值并非“投资”而在于传播和充分利用数据信息。以邻接权保护数据库从理论到实践都是契合的。德国《著作权法》第87条规定受邻接权保护的数据库是系统地或者按一定方法排列,可通过电子或者其他方式获得的,在搜集、校对或者呈现上需要有质或者量的实质性投资的作品、数据或其它材料的汇集[iv]。考虑到德国《著作权法》已在第4条“汇编著作和数据库著作”赋予具有独创性的数据库以汇编作品享受的同等保护[v],德国的数据库立法和欧盟的双轨制是一样的。但德国法没有像欧盟那样寻求创建新的权利体系而是从既有的邻接权制度中发掘传统著作权法的潜力。在德国以外,俄罗斯《联邦民法典》第1333条(规定数据库制作者)和第1334条(规定数据库制作者专有权)也是明确以保护投资而不是独创性为目的、以邻接权模式保护数据库的范例[vi]。
以邻接权模式保护数据库在理论上能够自洽,实践中可以满足无独创性数据库最有价值的数据利用部分。在大数据成为互联网支柱产业之际,中国著作权法学界及立法者应该认真研究并在修法中及时纳入数据库邻接权体系,避免在对众多以搜集为重、以数据传播为主要价值的数据库在《反不正当竞争法》之外无法寻求保护的局面。
参考文献
(请向下滑动)
一、大数据交易的交易安全
[i]车品觉:《大数据革命:倾听用户的心跳》[EB/OL]. [2014-01-30]http://www.itongji.cn/article/122314R2012.html,2014年5月17日访问
[ii]商业价值研究院.《分析:大数据在现实世界中的应用 创新型企业如何从不确定的数据中获取价值》,[R/OL].[2012-12-11]http://www-935.ibm.com/services/multimedia/use_of_big_data.pdf,IBM,2014年3月2日访问
二、大数据法律保护现状
[i]郑成思:《反不正当竞争与知识产权》,《法学》1997年第6期,第54页
三、数据库保护的未来
[i]李扬:《数据库的反不正当竞争法保护及其评析》,[R/OL],[2012-07-11],http://www.iprcn.com/IL_Lwxc_Show.aspx?News_PI=2066,2014年5月6日访问
[ii] <Directive No. 96/9/EC of the European Parliament and of theCouncil, of 11 March 1996 on the legal protection of databases>,[EB/OL],[2009-03-22]http://www.wipo.int/wipolex/en/text.jsp?file_id=126788,2014年5月6日访问
[iii] <First evaluation of Directive 96/9/EC on the legal protectionof databases>,[EB/OL],[2009-03-22],http://ec.europa.eu/internal_market/copyright/docs/databases/evaluation_report_en.pdf, p23-24,2014年5月10日访问
[iv]《十二国著作权法》翻译组:《十二国着作权法》[M],北京:清华大学出版社2011年版,第175页
[v]前引书,第147页
[vi]前引书,第459页
感谢作者对本公众号的授权!
本文仅作学习交流之用。
Peder Severin Kroyer · Hip, Hip, Hurrah!
往 期 荐 读
异化中的解放
欢迎点击“阅读原文”