高郦梅: 企业公开数据的法律保护——模式选择与实现路径
点击蓝字|关注我们
高郦梅:中国人民大学法学院博士研究生
本文原载《中国政法大学学报》2021年第3期,转载对注释与参考文献进行了省略。
摘 要
非赋权模式难以周全保护处于公开状态且整体上缺少独创性的数据。基于数据的非排他性、非竞争性等属性,对企业公开数据也不宜采取绝对化的财产权赋权模式,应当通过有限度的柔性赋权模式将数据财产权的对抗性限于特定范围。对企业公开数据的柔性赋权具有理论基础、功能价值和现实需求。实践中,应在数据之上设立独立的权利,确立数据控制企业享有数据的使用收益等财产权益,同时通过强制许可、合理使用等制度限制其排他性。具体而言,应充分考量数据获取后的利用方式、数据获取的目的、数据获取是否对数据控制企业造成根本性影响以及数据的性质等因素。同时,应制定数据价格的修正原则,提高数据定价的合理性。
关键词
企业公开数据;柔性赋权;合理使用;数据定价
一、问题的提出
随着大数据云计算等信息科学技术的革命性发展,数据已经成为了新时代的“石油”,数据保护的法律问题也成为国内外学术界重点关注的议题之一。为了应对数据问题带来的法律挑战,《民法典》第 111 条确立了个人数据保护条款,并在人格权编专章设置个人数据保护的相关规定;第 127 条以框架式的立法技术宣示了数据受法律保护的转介条款。同时,即将颁布的《数据安全法》和《个人信息保护法》将从数据安全和个人数据保护的角度细化民法典的有关规范。然而,这些立法文件本质上均是着眼于对个人数据中人格法益的保护,同时从监管维度为数据安全设立红线和底线。立法一直未对经企业收集加工后的数据财产权益的归属作出直接而明确的回应。而在司法实践中,法院一般采用《反不正当竞争法》处理相关企业数据争议。
典型如“新浪诉脉脉”案。该案中,新浪微博经营者微梦公司主张淘友技术公司、淘友科技公司在合作期间违反《开发者协议》,从开放平台获取新浪微博用户的职业信息、教育信息;双方合作终止后,淘友技术公司、淘友科技公司未经微梦公司许可仍然大量抓取、使用微博用户上述信息。法院认为,数据是企业的重要经济投入,已经成为经营者的重要竞争优势,新浪微博用户信息是微梦公司通过多年经营活动的积累成果,未经新浪微博用户及新浪微博的同意,第三方不得使用新浪微博的用户信息,也即“三重授权原则”。故此,淘友技术公司、淘友科技公司违反了诚实信用原则及公认的商业道德,存在不正当竞争行为。该案的判决一出,立即引发较大争议。支持论者认为,企业基于运营行为所获得的数据属于核心商业资产和重要竞争资源,受到法律保护,第三方获取数据应当获得用户和企业明确授权。反对论者认为,赋予企业在数据许可中享有决定权不仅不利于技术创新,也存在伪隐私保护的嫌疑。这种“高标”的数据获取要求将导致企业运营成本的增加,进而限制数据流通。归纳上述争议的焦点,其本质仍然是此类特殊数据权益究竟归属于谁的问题。由此可知,具体到此类特殊数据赋权与否乃至如何赋权是理论界和实务界必须正面回应的议题。本文将此类特殊数据称之为企业公开数据。
二、企业公开数据非赋权模式的局限
(一)企业公开数据的范围
在数据领域,根据不同的分类标准数据可以分为不同类型。聚焦于数据的公开性,可以将数据分为公开数据与非公开数据。非公开数据主要是商业秘密类数据,即不能为社会公众所获取的数据类型;而公开数据是指处于公开状态可以为公众所获取的数据,其中包含整体上缺少独创性的数据和具备独创性特征的数据,本文所称企业公开数据即是前者。
对于处于公开状态整体上缺少独创性的企业公开数据而言,知识产权制度无法予以保护。数据受到知识产权制度保护的前提是数据可以被涵摄至知识产权的客体。例如,企业可以通过主张汇编作品著作权对具有独创性的数据集合进行保护;对具有鲜明技术属性并解决一定技术问题的大数据运算程序引入专利保护;将符合价值性、新颖性和保密性的企业数据纳入商业秘密保护范围。但是,知识产权保护的要求对于企业公开数据而言存在诸多不适应。一方面,数据与著作权保护的作品存在本质差异。数据的特征决定了其不满足知识产权独创性、期限性、法定性等必备属性,且数据不必然是智力劳动成果,同时其在取得方式上也与知识产权有别。著作权法可以赋予包含信息的独创作品以产权,但不能为基础数据本身提供保护。同时,数据汇编作品中掺杂着单纯的事实信息,实践中难以将汇编的创造性数据信息与不可保护的事实数据清晰分开。另一方面,在满足商业秘密构成要件的前提下,数据可以作为商业秘密予以保护。但是,如果某一种商业模式要求企业对所有公众开放或提供数据,此时的商业秘密机制将丧失启动条件;通过逆向工程还原原初数据也不能认定为侵犯商业秘密。因此,处于公开状态且整体上缺少独创性的企业公开数据属于知识产权制度的空白地带。为统一表述、不致歧义,如无特别说明,后文所称数据均指处于公开状态整体上缺少独创性的企业公开数据,如“大众点评诉百度地图案”中在线公开获取的商家点评数据、“新浪诉脉脉案”的用户背景数据。
(二)企业公开数据法律保护的非赋权模式
如前文所述,在司法实践中,对于企业公开数据的不正当竞争行为,法院通常采取竞争法的保护进路。这类案件法院通过援引《反不正当竞争法》第2条认定数据属于竞争法上的财产利益。而合同法路径也被数据产业广泛采用,以实现数据的资产价值。总体上,竞争法进路和合同法进路都是通过行为主义的方式对数据进行保护,即二者都采取的是企业公开数据法律保护的非赋权模式。这一模式注重纠纷中行动主体之间形成的法律关系,并通过一种“条件—后果”式的表述方式,分析其中的“条件”要素,描述在特定行为或状态条件下民商事主体间的强制分配关系。非赋权模式具有界权成本低、高灵活性等优点,但是,运用非赋权模式对企业公开数据进行保护存在不可忽视的局限。
第一,竞争法难以为企业公开数据保护提供合理预期。有学者认为,《反不正当竞争法》为数据保护提供了多种路径,如该法第12条规定的“互联网专条之兜底条款”和该法第2条规定的一般条款规制路径。竞争法进路可以为数据保护提供周全的选择,同时数据的实践争议多涉及竞争利益,因此数据保护应当转向竞争法规制路径,此路径更加符合当前的社会实际。
但是,适用《反不正当竞争法》对企业公开数据进行保护存在诸多困境,一是《反不正当竞争法》 第2条本属释义性规定,其对于不正当竞争行为的界定要件模糊。例如,什么是“商业道德”?何谓“扰乱市场竞争秩序”?因此,法律适用常常缺乏明确的判断标准,不利于法的安定性目标。同时,这样的不确定性还会带来较高的企业合规和实践成本,无助于民事主体对行为预期的合理判断。二是竞争法对企业公开数据的保护范围是极其有限的。例如尚未形成市场替代效果的少量抓取行为并不属于《反不正当竞争法》的涵摄范围。其根本原因在于两者所调整的法律关系存在本质差异,竞争法益与数据权益并不完全重合。对此,学者李爱军分析指出,“前者调整的显性法律关系是经营者间的关系,隐藏其后的则是其他经营者等主体,直接保护的是市场竞争秩序,鼓励公平竞争,出发点即是公共利益;而后者所调整法律关系主体是不限于经营者的权利人,没有隐性主体,不构成竞争法上实质的三方关系结构,直接保护的是权利人的私益,出发点是私益。”三是竞争法对数据的保护力度也存在局限。权利和利益在法律救济强度上存在差异,前者的保护力度强于后者。将数据视为竞争法益实际上采取的是一种极弱的保护思路,实质上是将企业数据权益视为一种受法律保护的纯粹经济利益,这种保护密度不足以应对实践中的数据争议。
第三,合同法对企业数据的保护范围有限。一种观点认为,数据私法治理的价值目标主要是实现交易价值,增加经济利益。以价值实现方式为考察基准,数据的价值实现依靠流通。通过订立数据合同在一定范围内利用,进行互利合作,使新产品不断完善并扩大生产规模,最终促进社会福利。在此方面,数据合同是联结数据利用和价值实现的桥梁。从促进数据经济发展的角度出发,数据合同的灵活性和适用性有助于创新商业模式、促进数据流通,合同路径是数据治理的理想机制,同时也更贴近数据产业的实践需求。
然而,合同法的局限在于,合同的相对性难以处理第三人侵害数据的问题。适用合同法的前提是当事人已对数据交易进行了合同安排,否则合同法并不足以对数据进行保护。尤其是在实践中频繁发生的数据爬虫案例,被爬虫一方几乎没有可能预先与潜在的爬虫方确立合同关系。所以,囿于合同的相对性,合同法难以对第三人的侵权行为进行法律救济。
综上,非赋权模式难以周全保护处于公开状态且整体上缺少独创性的企业公开数据。同时,非赋权模式试图绕开数据权属的界定,以“关系”代替“权利”,但这种思路并不符合新型财产的理论发展规律。产权的界定是提升交易效率、保障安全的逻辑起点,随着我们对数据形成较为成熟稳定的认识,对数据的法律权属进行界定不仅是必要的,也具备现实可行性。有鉴于此,对于企业公开数据的法律保护问题应当转换思路,在肯定非赋权模式对部分数据争议场景有效性的基础上,将眼光调整至企业公开数据赋权模式。
三、企业公开数据的赋权模式选择
如前文所述,依赖于合同法、竞争法等非赋权模式的框架可以为数据提供一定程度的法律保护,但也只能作为部分数据争议的解决方案,其保护范围的局限性和不确定性不足以应对数据的实践需求。在推进数据要素市场化配置,优化数据流通环境的政策目标的背景下,执拗于非赋权模式毋宁说是一种权宜之计,不利于实现我国对数据财产权益保护的长远战略规划。从当前我国对数据赋权模式的讨论看,主要集中在如何对数据进行赋权的问题。下文将对此予以具体阐述。
(一)学理争议与困境
对于企业对数据是否享有合法权益,既有研究普遍认可企业的数据财产权益应当受到法律保护。但对于应当在数据之上构建一种什么性质的财产权,则存在分歧。从目前的文献看,大致可以分为四类。一是所有权说,认为数据属于“物”,可以被物权法调整。其中一种观点认为,数据具有公共性,是受互联网业者支配,旨在实现特定公共服务目的的物,即网络社会中的公物。另有论者将数据作为私有客体,私主体享有数据所有权,故适用物权法。二是中间权说,认为数据保护应当由个人控制转向社会控制,并以合同方式建构一种介于对人权与对物权的灵活中间权。三是算法规制说,认为算法在数据权利和数据价值的生产机制中处于中心地位,可以通过设置针对算法的数据责任规制、管制规制、禁易规则来明晰数据利用边界,从而反向推导出数据财产权的框架。四是新型财产权说,认为既有数据治理路径都存在缺陷,应当设立一种新型财产权对数据予以调整。
上述学说从不同视角阐述了数据的赋权路径,体现了既有研究对数据的关注和努力,但是,这些理论仍然面临不少难题。其一,所有权路径没有认识到数据在物权法中的异质性,即数据的可复制性、同时共存性等特征与一物一权原则相悖。其二,中间权路径以合同保护为中心,忽视了契约的相对性无法涵摄数据侵权的问题。其三,算法规制路径试图将数据的确权问题转化为算法治理,以实现清晰的产权界定。但是,算法质量和算法的不可控性导致数据处理风险的加剧,且算法的智能性特征改变了传统技术带来的风险轮廓。这就是说,算法和数据都是处在发展变化之中且难以被界定的概念,如果因为对数据本身确权存在困境转而求助于算法规制,这实际上是用一个很难形成同一框架,高度数学化的,并且解释权不在法律的概念去解释另一个复杂的问题,无异于是问题的叠加。其四,新型财产权路径为数据的本权问题提供了破解方向,本文对此予以赞同。但是,此种路径将数据定位于绝对排他性的财产权的观点则值得商榷。欧盟的相关调研报告指出,处于私人控制之下的数据集合面临着共享困难的问题。绝对化的财产权通过赋予企业对抗任意第三人的排他权来实现数据安全,这虽然有助于保护企业对数据投入所形成的利益关系,但是在很多情形下,这样的企业数据权可能逐渐从数据保护的安全措施异化为阻碍数据流通、抑制竞争的工具,同时还可能加剧互联网的碎片化和数据孤岛的形成。例如,基于策略性思维,企业很可能会利用绝对支配地位进行“敲竹杠”,甚至为了维护自身先发优势而拒绝有利可图的要约。这种模式不仅会导致成本的不当分配(一方得到的远远超过其应得的),且限制获取数据的行为还将造成重大的社会福利成本,从而阻碍后发企业对数据的利用和创新,损害竞争活力和市场的繁荣。从赋权模式的效力弹性看,这实际上是一种“刚性赋权模式”,欠缺灵活性,难以调整数据这类不断变化发展的新型财产。
(二)柔性赋权模式的提出
针对目前数据的规范缺失和理论局限,本文认为数据保护困境的破解之道在于对数据进行赋权并限权。一方面,应当在数据之上设立独立的权利,确立企业享有数据的使用收益等财产权益,解决数据利用的本权问题,同时也纾解当下司法实践运用《反不正当竞争法》一般条款进行救济的不确定性和有限性;另一方面,由于数据具有无形性、流动性、来源多样性、非竞争性等多重特征,为了避免出现企业机会主义行为和逆向选择难题导致数据流通受阻,对于企业数据的赋权不宜依赖刚性赋权模式,而应当采取柔性赋权模式。这意味着企业享有的数据财产权是一种有限财产权,数据财产权的对抗性限于特定范围,且需要受到合理适用、强制许可等制度的限制,其保护强度小于绝对财产权。可以说,这一赋权模式与企业数据法益保护的内在机理具有天然一致性和内在协调性,其正当性基础具体体现在:
第一,从理论基础上看,劳动赋权和激励理论为企业享有独立财产权利提供了重要支持。根据洛克的劳动赋权理论,劳动产生价值,赋予资源的投入者以财产权益有利于产生经济激励效应。企业为数据的生产投入了大量劳动和成本,其本质上属于劳动创作的内容,赋予企业数据财产权符合劳动创造财产权的理论。事实上,我国司法实践对企业享有独立的数据财产权益的证成也多以劳动赋权理论进行裁判说理。例如,在“大众点评诉百度地图案”中,百度公司未经大众点评网授权,在其经营的百度地图和百度知道中大量使用了大众点评网的点评信息。一审法院认为,数据利益应当归于平台,其主要原因在于大众点评网上的点评信息是汉涛公司长期运营的成果,其付出了巨额成本。而百度公司未经许可利用技术手段爬取点评信息的行为,属于没有任何贡献的“搭便车”与“不劳而获”。二审法院对一审判决予以确认,认可了大众点评网上用户评论信息的经济价值,并指出这些信息是汉涛公司付出大量资源所获取的,是汉涛公司的劳动成果。百度公司未经汉涛公司的许可,在其百度地图和百度知道产品中进行大量使用,这种行为本质上属于“未经许可使用他人劳动成果”。 类似的裁判立场也发生于“淘宝诉美景大数据不正当竞争案”。该案中,淘宝网通过对网络用户浏览、搜索、收藏、加购、交易等行为所产生数据进行加工处理,进而形成可以向平台商家提供市场行情变化,改善经营水平的可视化数据产品——生意参谋。美景公司未经淘宝网许可,擅自提供平台,以提供远程登录已订购生意参谋数据产品用户电脑技术服务的方式获取数据。对于数据产品的财产利益归属,法院基于对数据产品的形成方式分析,指出数据产品并非对用户原始数据的简单聚合,而是网络运营者经过深度处理、整合加工后形成的衍生数据,是经过淘宝网大量的智力劳动成果投入形成的一种独立的数据形式,属于淘宝公司的“劳动成果”,淘宝网对于其开发的数据产品享有独立财产权益。
激励理论是赋予企业数据财产权的另一重要理论基础。激励是对目标行为的奖励和惩罚,激励理论是认知行为科学的重要内容,这一理论涵盖了心理学、伦理学、经济学、生物学等研究方法。“刺激—反应”是行为主义心理学分析人类行为的典型模式,如斯金纳指出,外在刺激对于人(刺激对象)会产生激励作用,人的行为是对外在刺激所作出的反应。同时,他进一步分析了正强化、惩罚、负强化和自然消退四种刺激方式与反应函数之间的关系。在法经济学领域,行为经济学集中体现了激励理论的运用,即以认知心理学为基础,对经济行为的动机、态度、预期等心理因素进行测量。可以说,激励理论的关键在于合理设置刺激手段。在这个意义上,法律规则属于影响行动主体决策的一种刺激手段,能够通过构造行动主体认知事物的“参照系”来调动主体实施目标行为的积极性。赋予企业数据财产权有益于保障企业的开发利益,为数据从业者提供一种安全性的市场法权基础,使数据经济“得以置身于一种高效稳定的财产权结构性的驱动力和交易安全的保障之中”。如果企业不享有这种公开且稳定的财产权,基于自我保护的心理,就不太可能进行数据的初次收集与数据共享。有一种观点认为数据财产权化对保护创造力和技术进步的激励效应存疑,因为当前数据已经并将继续以指数级的速度增长,企业正在竞相生产更多的数据,而没有通过数据资产化实现“激励”。通过合同+技术措施的结合模式,市场主体能够有效解决目前存在的数据市场潜在失灵的问题。此观点揭示了数据的重要价值使得企业自发地想要获取数据,但忽视了缺少明晰产权界定的数据难以激励持有数据的企业进行数据共享,而目前合同与技术措施的结合也不足以应对第三人侵害数据的情况。
第二,在功能价值的维度上,柔性赋权模式更有利于实现数据治理目标。全球治理委员会于1995年发表了一份题为《我们的全球伙伴关系》(Our Global Neighborhood)的研究报告,在该报告中将治理定义为:治理是各种公共的或私人的个人和机构管理其共同事务的诸多方式的总和。它是使相互冲突的或不同的利益得以调和并且采取联合行动的持续的过程。按此定义,“治理”涵盖了一切可以平衡利益冲突的行动机制和管理模式,具有以解决问题为导向的工具属性。数据治理(Data Governance)是治理理论的新阶段。经济合作与发展组织(OECD)针对规范数据流通和释放数据红利等数据事项提出了这一重要命题。理想的数据治理制度是“利用数据进行治理”与“对数据进行治理”的统一,包括数据管理、数据决策、数据质量、数据定价和数据产权等一系列要素。因此,数据治理的内涵和目标也因研究视角和学科领域而有所不同。在法律规范层面,数据治理主要解决的是数据保护与利用问题,即通过法律规范调整在数据整个生命周期中不同行动者的利益关系,最终实现保障数据安全和促进数据流通的治理目标。
从法学方法论的角度观察,主张赋予企业数据财产权的研究,不仅是在概念主义法学的脉络下进行论证,更多的是运用法律实用主义的理念,通过考察规则的法律效果来阐明赋权模式的优越性。法律实用主义是一种分析问题的理论态度,即以事实和后果为判断规则适用的核心,而非概念和一般原则。此种分析立场兼具描述性和规范性,其任务包括说明对立规则模式所可能产生的法律后果,以及在不同法律方案之间作出选择的理由。如果赋予企业一方绝对控制权(刚性赋权模式)来决定是否允许他人对数据进行访问和收集,将会阻碍数据的共享和自由流通,甚至对言论自由造成有害的危险。而柔性赋权模式下的数据治理路径在确立企业享有独立的数据财产权利的基础上,同时通过限权措施来平衡数据安全和数据流通的治理目标。这一模式考虑了企业数据的公共面向,其中的合理使用、强制许可等限权制度可以尽可能地避免基于数据控制权导致的数据垄断和“算法黑箱”,有助于疏通数据流通和利用的堵点。
第三,以数据的保护需求为出发点,柔性赋权模式有助于弥合制度供给与实际需求的裂缝。换言之,柔性赋权相较于刚性赋权模式更贴近企业数据实践,运用这一模式对数据进行保护更加符合企业公开数据法益所需要的救济方式和救济强度。就保护力度来说,企业公开数据非独创性且处于公开状态的本质要求适中的救济强度。由于这类数据缺少独创性且能为公众所获取,因此,其保护力度应当小于受知识产权保护的独创性数据,即不需要获得绝对排他权保护。就相似性而言,处于公开状态整体上缺少独创性的企业公开数据与商业秘密均属于非独创类数据,只是存在公开与否的区别。商业秘密制度的目的在于阻止他人以不正当手段获取商业秘密,维护产业和伦理秩序。如果第三人通过反向工程等正当手段获得商业秘密,则不属于侵害商业秘密。因此,商业秘密制度并不具备绝对排他性,其实际上遵循的是一种有限保护思路。基于此,同为非独创型且还处于公开状态的企业公开数据,其保护力度应当小于等于商业秘密。
综上,柔性赋权模式是一种适度的保护思路。柔性赋权模式给予了法益相对方很大的便利,合理使用或强制许可等限权制度实质是在弱化数据的排他性,即否定企业对数据拒绝许可的权利,强制达成数据许可,并以损害赔偿请求权代替绝对财产权模式下的刚性排他权。这种模式在保障企业经济报酬的同时,能够有效减少数据利用的障碍,符合企业数据法益的客观需求。
四、柔性赋权模式的实现路径
(一)权利客体与权利主体
基于数据的可复制性、流动性等多重属性,界定数据权利客体和权利主体的方式与传统财产权有所不同。但是,即便数据具有动态特征,实践中,企业能够在特定时间范围对特定数据具有某种程度的控制,这种事实上的控制依靠于各种技术手段得以实现,如通过设置各种服务条款、安全措施等拒绝他人获取数据。因此,数据作为权利客体是具备可控制性的。这种法益是基于企业合法获取并在事实上能够控制而产生的。这种数据控制的合法性,主要在于企业获取数据的方式不违反法律的禁止性规定,没有侵害他人合法权益。
如前文所述,柔性赋权模式下的企业数据应为公开数据,即能够为数据控制企业带来经济价值,且处于公开状态整体上缺少独创性的数据。具体而言,这类数据主要是数据控制企业允许公众访问、浏览的在线公开数据,如商家点评数据、用户背景数据和实时交通数据等。实务中,企业多是基于商业模式的要求而将数据向公众公开,处于公开状态整体上缺少独创性的数据属于排他性需求和法益保护力度较弱的类型,因此柔性赋权模式与其相适应。而非公开数据在符合法律规定的条件下,交由商业秘密制度保护。不同的数据类型配置不同的法律规则,以体现对不同类型数据的“分而治之”。
柔性赋权模式中的数据权利主体为数据控制企业,数据控制企业是指在特定时间范围实际控制或拥有特定数据的企业,其可以单独或共同决定数据处理目的与方式。因此,只要企业对数据具备事实控制上的合法性,那么企业作为数据控制者即可取得这部分的数据法益。
(二)权利内容
数据柔性赋权模式的权利内容包括两方面。在权利的积极方面,数据控制企业有权使用和许可他人使用其合法获取的数据。在消极方面,数据控制企业有权禁止数据获取者未经其许可获取数据,违反者需承担停止侵害等民事责任;但是,如果数据获取者对企业公开数据进行了转换性利用,则未经数据控制企业同意,数据获取者可以获取数据,但需要承担损害赔偿责任。之所以加入此项“但书”条款,主要是为了弱化数据的排他性,使相对方获取数据无需事先经过企业同意,只要支付一定的价格即可。这是基于“共享互利”的理念,在保障企业获得经济补偿的前提下,减少数据获取壁垒,以应对先发优势企业的机会主义行为对竞争和创新带来的高度阻碍。实际上,在数据柔性赋权的消极权能方面,数据获取者对数据进行转换性利用构成了数据强制许可的关键要素。数据的强制许可制度可以类比于知识产权领域的强制许可制度,例如对技术转让中的限制竞争行为(禁止利用被许可技术进行升级改造)的规制。总体上,强制许可制度旨在实现特定情形下的法益移转,以实现促进创新、增加社会公共福祉的目标。 这意味着数据控制企业享有的只是一项在法定情形中可以被相对方以法定价格强制“买断”的有限权利。基于此,本文提出数据柔性赋权模式的权利内容应当明确其有限排他性,其中的有限性首要体现为强制许可制度的构建。
具体而言,数据强制许可制度需要重点关注数据获取后的利用方式。在商业性的数据抓取中,如果企业公开数据是经数据控制企业加工处理后形成的,同时数据获取者对抓取的数据并非“额头流汗”式的重复数据控制企业的数据利用形式,而是进行了转换性使用,那么对于此类数据抓取行为的正当性持肯定态度,应当纳入强制许可范围。其中,数据的转换性使用即是考量数据获取者的数据利用行为的创新性,如数据的运用场景或算法分析等与数据控制企业是否具有差异。虽然这类数据抓取同样存在“搭便车”的行为,但其创新增量有利于增进社会公共福祉,具有高社会效用性,体现的正是竞争法所追求的自由竞争与市场效率之目标,因此应当对其持包容态度。例如,在美国的hiQ诉LinkedIn案中,LinkedIn以提供职业社交服务为主要业务,hiQ公司未经LinkedIn公司许可,对其网站上用户公开的职业背景信息等进行抓取,并用于分析用户离职风险和就业意向,同时为客户提供雇员评估服务。LinkedIn公司主张hiQ公司的数据爬取行为会影响用户隐私保护,故其采取了接入壁垒手段禁止hiQ公司爬取其网站上公开的数据。法院认为,hiQ公司抓取用户公开的姓名、职业等数据不属于违法行为,也不会影响用户的数据隐私保护。法院最终基于保护数据自由竞争秩序作出了有利于数据爬虫方hiQ公司的判决,要求LinkedIn公司移除阻止手段。
之所以需要容忍这类具有创新性的搭便车行为,主要原因在于,一方面,数据与知识的公共性类似,利用或基于他人成果是文化和经济繁荣发展的重要途径,竞争的过程某种程度上是一种模仿或借鉴的过程,这是市场经济竞争法则的体现。另一方面,市场竞争具有强烈的对抗性和损害性,相互削弱竞争优势恰是竞争的重要体现,除了特定损害,给其他竞争者造成损害并不构成否认竞争行为正当性的要件。一项竞争行为是否正当,主要考察消费者的集体利益和竞争市场的一般利益等社会福祉是否得到有效保护。如果只是影响经营者的部分利益,并不能对其产生根本性影响,同时整体上有利于促进消费者福利,则应当允许商业模式间“相生相克”式的共存。
此外,市场竞争是交织和跨界的,数据产业之间天然具有竞争属性,因此,在宽泛的市场竞争框架内,如果仅依据竞争关系来判断数据获取行为的正当性,显然不当扩大了法律的保护范围。这就是说,数据获取企业与数据控制企业存在竞争关系并不能成为强制许可的考量因素,关键在于是否会引发不合理的市场替代效果。这与前文所阐述的数据获取企业利用数据的方式是否具有转换性的立场具有内在一致性。如上文所述,这种转换性利用主要存在两种表现形式:一是创新数据的运用场景;二是在同一场景中对数据进行进一步处理,增加消费者的选择多样性。例如,在企业数据爬虫纠纷中,可能会呈现三种情况:数据控制企业的消费者转向数据获取企业;数据控制企业的消费者同时选择数据控制企业和数据获取企业;数据控制企业的消费者继续只选择数据控制企业。只有第一种情况产生了市场替代效果,但此种替代效果的持续性和引发原因还需要进一步分析。如果数据获取企业对抓取的数据进行了创新性利用,为消费者提供了更优质的选择,那么此种行为所引发的市场替代效果应当予以包容。而第二种情况只能说明数据控制企业的竞争优势被削弱,但竞争损害是常态,商业模式和先发优势不应属于法律的保护范畴。同时,对于保护需求较弱的企业公开数据,数据获取企业抓取后的转换性利用行为不应当被认为是法律的规制对象。因此,“同业竞争”并不一定被强制许可制度排除,最终还是取决于数据获取企业对数据利用方式的转换性。
(三)权利限制
柔性赋权模式的主要内容在于调整数据控制企业与数据获取者之间的关系,其着眼于企业数据在流通中的效率与保护之平衡,旨在保障数据自由竞争秩序。因此,在传统赋权内容之外,柔性赋权模式通过强制许可制度实现数据财产权的“限权”。在这个意义上,企业数据合理使用范围的划定也同样是数据权利限制的重要方面。例如,域外以网络爬虫的有益特征为基础划定网络公开数据合理使用范围,如强调抓取的对象是处于公开状态的非独创型数据;明确抓取的目的在于提高用户使用数据的效率;确认数据抓取对数据控制企业没有造成实质性损害。基于此,本文从以下三个方面对数据的合理使用范围进行阐释:
第一,获取数据的目的。如果数据获取者具有公共基础设施性质或其抓取行为的目的在于公共服务,则其获取数据的行为应当属于合理使用范围。例如,搜索引擎所进行的网络爬虫行为,由于其本身属于信息公共基础设施,爬取数据的目的在于加快信息的传播,提高用户使用数据的便捷性,因此其行为应当被认为是合理使用,美国和欧盟等地区也都确立了这一立场。殊值注意的是,如果搜索引擎或其他可以具备公共基础设施性质的主体丧失公益性,则其获取企业数据的行为不应当被合理使用制度涵摄。
第二,是否对数据控制企业造成根本性影响。数据获取企业的抓取行为或多或少都会对数据控制企业造成影响,但是,正如前文所阐述的,竞争损害是市场主体自由竞争的常态后果,对此无须有夸大的担忧。只有当抓取行为对数据控制企业的正常经营产生了根本性冲突,达到威胁其“生存”的地步,才有必要制止。这种根本性影响一般表现为两种类型,一是对数据控制企业产生了实质性损害,如由于同时段大规模抓取影响网站的正常运行功能。例如,在美国著名的数据爬虫案Ebay诉 Bidder’s Edge 公司案中,被告Bidder’s Edge公司未经许可对Ebay公司的网页进行了数据爬取,Ebay公司主张其对被爬取的数据投入了大量成本,Bidder’s Edge擅自爬取数据损害了Ebay的合法权益。法院最终认定Bidder’s Edge的行为属于非法入侵动产,影响了Ebay公司在其服务器中的占有权益,损害网站的功能。二是数据控制企业的数据体量较小,抓取的数据是数据控制企业经过深入加工处理的,而非单纯的收集占有,一经抓取将给予数据控制企业极大的压力,使其丧失市场和技术的应对能力。这就是说,符合公益目的的数据获取行为也应当符合比例原则,即需要考虑数据抓取对数据生产企业的后果,还需要考虑抓取企业的使用手段与方式,譬如其经营模式,是否简单的复制数据生产企业的模式等等。我国目前关于数据财产权益纠纷的司法裁判也持相同立场。例如,在“阿里诉码注案”中,法院认为,企业数据财产权益纠纷需要平衡私人利益和公共利益。涉案数据属于企业公开数据,但并非可以任意获取、使用的开放数据,码注公司不可以毫无节制地抓取、使用涉案数据,应当本着善良、诚信的原则,在必要限度内使用涉案数据。码注公司将1688平台数据直接用于自身网站,且并不能证明有利于市场效率和社会利益,显然超过合理限度。
第三,数据的性质。基于商业使用的目的,如果数据获取者抓取的数据不含数据控制企业的“创造性劳动”,在性质上属于不依赖于现有数据而产生的原生数据,则数据获取者在遵守个人信息保护规则的基础上,可以无偿使用该数据。这与前文所提及的数据强制许可制度的数据性质是在原生数据上加工处理形成的衍生数据相区别。从对数据的投入来看,如果数据仅由数据控制企业收集而来,未经算法加工、处理,则难言进行了实质性投资,其对数据的控制力也应当受到限制。例如,对于用户头像、教育背景、网页浏览记录等原生数据,本质上是由用户自身上传形成的,数据控制企业没有进行算法加工等进一步处理,这种单纯的收集储存行为不应当认定为实质性投资,否则很有可能把实质性投资的门槛降到极低。将这类数据纳入合理使用范围,对于互联网后发企业的投资激励意义重大。
综上,在合理使用制度的适用层面,需要纳入有益的数据抓取行为,综合考量数据获取的目的、是否对数据控制企业造成根本性影响和数据性质等因素。具体来说,企业公开数据的合理使用是指,数据获取者基于公共利益利用企业数据,且使用行为没有对数据控制企业造成根本性影响,或数据获取者抓取的数据属于原生数据,那么其未经数据控制企业许可可以无偿利用企业数据。当然,如果数据本身涉及个人信息,则应当遵循个人信息保护的相关法律规定。
(四)救济方式
柔性赋权模式中的典型救济方式主要是通过数据获取者支付一定的赔偿金来对数据控制者进行救济。确定强制性法益定价是决定法律规则是否能够实现资源有效率配置的关键。对此,有学者提出通过资源占有人“强制报价加第三方征税”(Harberger tax)的方式进行数据定价。具体来说,这种观点试图将数据的定价权交由数据控制企业,当第三方支付企业的主观估价即可实现资源移转,同时通过政府对报价的征税抑制占有者对其所占有的资源给予过高估价的激励。然而,此路径存在无法忽视的弊端。表面上,税收可以限制数据控制企业的报价,避免数据价格畸高。但实际上,由于征税发生在交易达成时,报价的当下并不会对数据控制企业征税,因此“第三方征税”不会给数据控制企业增加高定价的负担。进一步说,征税对限制报价的作用在于,只有数据控制企业想促成交易时才会根据税率调整报价,如果其根本不想实现资源的移转,反而会激励企业通过设定极高的报价实现数据独占。
理想的数据定价金额应是趋近于市场的普遍价格。目前司法实践正在探寻确定数据价格的相关要素,主要是通过激活《反不正当竞争法》,按照数据控制企业的实际损失予以确定,实际损失难以确定的按照数据获取者因数据抓取所获得的利益计算,赔偿数额还包括因调查该不当行为所支付的合理费用。如果实际损失和所得利益均难以确定,法院一般通过考察数据获取者的市场地位、经营规模、数据获取的范围、难易程度、持续时间、用户访问量等因素综合予以确定。例如,在“大众点评诉百度地图案”中,汉涛公司根据营业成本主张赔偿金9000万元,法院认为,审计报告中的营业成本不等于大众点评网获取点评信息的成本,因此不能以此作为计算经济损失的依据。当事人没有其他证据证明百度公司行为给汉涛公司造成的具体损失或者为百度公司带来的利润,故法院最终基于百度地图、百度知道两款产品的市场地位、百度公司使用信息的方式和范围、被控不正当竞争行为的持续时间以及汉涛公司获取点评信息的难易程度等因素,酌情确定经济损失300万元及为制止不正当竞争行为所支付的合理费用23万元。可见,目前法院主要采取了效用价格论,即通过数据的使用价值或数据获取者的预期获利来确定数据定价。由于数据具有多样性、流动性和价值不确定性等多重属性, 法院运用的场景性评估方式是值得肯定的,虽然现阶段无法给予企业一个确定的预期,但随着裁判经验的不断累积,加之商业会计准则的辅助,数据价格也会更贴近于其效用价格。
与此同时,我们可以考虑制定相关数据价格的修正原则,以减少法院的估价成本。例如,可以借鉴专利领域确定合理许可费时运用的“Georgia Pacific方法”。这套方法以既成许可费为基准,同时加入实践中需要考虑的要素调适基准许可费。其中的基准许可费是指“假设在侵权发生之始专利权人与侵权人愿意就专利许可达成协议,这个虚拟协议的许可费就是合理许可费”。在此基础上,法院通过考虑个案中主体的特殊情势、虚拟缔约谈判时的客观市场条件、专利权利人和侵权人关注的市场条件等要素对基准许可费进行修正。回到数据领域,如果数据控制企业在裁判时就争议数据与他人订立了许可使用合同,则合同约定的许可费可以作为基准许可费;或是如果存在与争议数据功能相似的其他数据,可以考察与之相似的数据是否存在许可使用合同,若存在,则也可参考其合同中约定的许可费。简而言之,通过参照现实中的类似交易,在类似交易所产生的价格基础之上通过具体场景中的特殊要素适时调整数据价格。其中的特殊要素一般是双方当事人对影响市场获利机会大小判断的典型事由,这属于司法实践不断归纳的经验产物。
五、结语
如何公平且有效率地配置数据资源是大数据时代提出的新命题。由于数据在物理性状、利用方式等方面有别于有形物,因此也使传统财产权制度在面临数据这类新事物时捉襟见肘。数据的分享、流通和交易是实现数据价值的重要环节,只有畅通获取数据的渠道,才能形成数据驱动经济的运行方式。
企业数据法益保护的制度设计不是零和博弈,而是一种共赢机制。企业数据法益的保护不仅关涉私主体的利益,更具有公共政策色彩,需要纳入社会整体效益框架下考虑。对此,应当在承认数据控制企业合法权益的基础上,以数据流通为主线,处理好数据控制与数据分享的关系。柔性赋权模式下企业享有的数据财产权是一种有限财产权,数据财产权的对抗性限于特定范围,且需要受到合理使用、强制许可等制度的限制,其保护强度小于绝对财产权。我国正在大力推进数据要素市场的建立,这一模式能够有效减少数据利用的障碍,契合处于公开状态整体上缺少独创性的数据的实际需求,有益于维护动态竞争和鼓励商业模式创新。这一思路可能对于传统财产权观念有一定冲击,但是,既然数据是一种随着技术和社会生活想象力不断发展的新事物,那么,法律人也应当尝试在区分不同类型和不同场景的数据的基础上,用新思维进行富有想象力的机制设计,努力实现数据利用增进社会福祉的目标。
相关阅读
推荐书目
微信号 : DigitalLaw_ECUPL
探寻数字法治逻辑
展望数字正义图景
数字法治战略合作伙伴:理财魔方
北京市竞天公诚律师事务所上海分所