查看原文
其他

【前沿观点】杨德嘉 | 数据竞争行为的正当性边界

杨德嘉 互联网法治研究 2022-08-28

数据竞争行为的正当性边界

杨德嘉  

北京市海淀区人民法院民事审判五庭庭长


摘  要:数据和数据竞争日益占据重要地位,数据多主体、多层次的特点增加了数据纠纷的复杂性,需要进行类型化和场景化的讨论。本文以HIQ诉领英案为借鉴与思考,着重探讨因数据爬取和后续使用引发的市场经营者之间的纠纷问题,其核心难点在对于“公开数据”的爬取,数据竞争行为的正当性边界究竟何在?首先,引入自然界共生、共栖、寄生的生存状态类比数据竞争形态,达到“寄生”程度,即一方明显受损、一方明显受益时引入法律调整;其次,对于不正当性的认定,以市场主体是否面临退出窘境的趋势作为市场失灵的判断依据,以市场失灵作为司法介入的依据;再次,在打破信息孤岛与互联共通的大背景下,明确控制数据权利与开放数据义务何者为常态、何者为例外是界定数据竞争行为不正当性的前提;最后,关于爬取行为许可的授权主体和范围可以借鉴著作权法的相关规定。

关键词:数据竞争;正当性;开放数据义务;控制数据权利


一、竞争数据的现状与核心问题

数据是AI发展的前提条件,是商业活动的基础,数据的价值无须赘言,数据竞争无论在当前还是在可以预见的未来都是互联网竞争的核心,本文在此基础上对因数据爬取及后续使用引发的市场经营者之间的纠纷问题进行探讨。

(一)数据的产生具有多主体、多层次特点

数据产生、获取和使用过程中,至少涉及三方主体,即用户、平台和第三方。网络用户是原始数据的提供者;网络平台在数据产生过程中扮演搜集、整理、加工、存储、管理和传播等一系列相关的角色,同时它也是数据的控制者(用户数据集合的控制者);第三方即主要依赖平台数据来开展商业活动的市场主体,大部分情况下它不直接通过协议获取用户数据,获取到数据后的主要使用方式也是多种多样的——直接使用、经过二次开发再做市场决策和研判之后进行利用、提供专门的数据决策分析,甚至直接拿去转售。第三方主要的行为是对数据的爬取和利用。当然,前面所述的平台和第三方也经常存在身份的转换和重合。

将数据的源头——个体用户产生的零星数据标注为数据A,平台通过用户协议合法占用、使用数据A,在此基础上提供一些附加的投入(资金、技术、运营成本、自身数据等)B,再将A与B相结合,通过加工和归集而成为平台数据C,即衍生数据。第三方获取数据C之后也可能进行数据再次开发,投入D、E、F等形成新的衍生数据。

(二)数据获取的核心问题

第三方获取数据的来源可以是用户或者平台,获取的对象有可能是用户原始数据A或者平台衍生数据C,获取的方式可以是协议提供或者直接爬取。因此,将会出现“有用户许可+有平台授权+平台数据C”“有用户许可+无平台授权+用户数据A”“无用户许可+有平台授权+平台数据C”等多种情况,最终使得数据获取的形式以及引发的问题多样化。

其中,需要考量的因素在于:爬取的是何种数据?被爬取的数据中包含哪些主体的贡献?毫无疑问,就获取数据的成本来看,从平台处整体获取,比从分散的用户处零星地获取,成本更低。而就数据的商业价值来看,平台数据C的商业价值又往往远远大于零散的个体数据A。

因此,平台数据有“获取成本更低、商业价值更高”的特点。那么,第三方在缺乏协议或许可的情况下,直接从平台爬取数据的行为应当如何认定?其中,对于爬取非公开数据,即绕开技术保护措施径行爬取存储在服务器上的、具有一定秘密性的数据这种情形的违法性似乎争议不大,且可以通过现有的商业秘密等规则予以解决。引起较大争议的,往往是围绕爬取所谓“公开数据”的问题展开的。对此,国内国外都有比较典型的案件,比如国内的微梦诉淘友天下案(脉脉案)、汉涛诉百度案(大众点评案)等,以及国外的HIQ诉领英案(实体审理中)。

此外,还需关注获取合法许可(明示、默示)的范围与爬取、使用的范围是否一致。爬取和使用行为之间有紧密的联系,但作为控制数据的一方,即使许可第三方进行爬取,也不代表就当然地一并授权第三方去进行任何方式的使用。爬取行为的合法也不代表后续使用行为的合法。当然,如果最初的爬取方式不合法,那么后续的使用行为也不具有合法性。


二、数据竞争行为的正当性问题思考


(一)数据竞争的特点与竞争形态

当前数据竞争更多是非同业同态企业之间的竞争。和传统的狭义竞争关系相比,现在更多是互联网企业之间的竞争,是上下游或周边关系,甚至完全不同的两个领域之间进行的竞争,而且更多是介入性的竞争,要介入到对方的经营过程、对方所获取的用户数据以及平台数据当中,因此一方竞争者对另一方竞争者的依赖性非常突出。

笔者认为可以借鉴自然界当中不同主体之间的生存状态来理解上述竞争形态:共生、共栖、寄生。共生(互利)状态下,双方受益、互利互惠;共栖(偏利)状态下,一方受益,另一方不受益也不受损或只是轻微受损;寄生状态下,一方受益,一方受损明显(消耗、死亡)。因此,笔者认为,如果对被爬取数据的平台一方不会造成根本性的、实质性的损害,引发的仅仅是一些微小的利益损失,就没有必要通过法律去强行介入和调整;但如果达到寄生程度,即一方明显受益、一方明显受损,则法律的调整就不可避免,以免造成类似生态危机式的竞争失序。

(二)不正当性的认定

界定何为数据竞争行为的正当性边界,可以从反面不正当性入手:什么是不正当的手段、不正当的损害。判断的逻辑在于:商业道德有别于普通人交往中的一般道德;损人利己不一定违法不等于损人利己一定不违法;当市场失灵出现时,司法才应当对不正当竞争行为进行介入。判断的一个重要标尺是市场是否失灵,即激励机制是不是仍然起到作用。结合数据竞争的具体场景,如果通过私力救济,比如订立合同、采取技术措施等方式约束爬取行为,解决不了问题,则需要诉诸诉讼等公力救济。而一旦以上两种方式无效或者成本过高,那么后续很可能会导致双方之间的竞争、对抗手段不断升级,甚至趋于野蛮化。朝着这个方向最终演变的结果,往往是被爬取的一方放弃、退出这个市场。笔者认为如果出现这样一种趋势或者可能,就可以判断激励机制失效,应当是反不正当竞争法介入的时机。

(三)明确常态与例外:控制数据权利与开放数据义务

互联网的核心是“互”字,最理想的状态是有所取的同时还要有所予,而不是只取不予,或者要求他人只予不取。互联互通的基础与前提是互惠互利(市场经济:平等、自愿、互利),而“寄生式的利人损己”并不是互联网精神的本质,也不具有可持续性。

与之对应的是,信息孤岛的情况越来越严重,平台间的信息越来越封闭,分享度越来越差。其背后的原因在于:在通用搜索引擎飞速发展的时代,搜索引擎通过爬取更多的网页信息提供给自己的用户,增强自己的用户粘性和数量;与此同时,被爬取的网站也希望更多出现在搜索结果中,提高自己的排序,提高自己的曝光率,从而提升自己的流量。二者之间有明显的互利关系。而现在的平台,通过自身产品所获取的数据,很多情况下可以实现自给自足,此时它是否有自主决定共享数据或信息的权利,以及在其对他人无所“取”的情况下,是否仍然必须去“予”?如果拒绝共享,这样的决定违反互联网互联互通的精神吗?具体到数据竞争语境下,在数据爬取与使用的场景下,对于拥有大量数据、掌握衍生数据C的平台来说,到底是赋予它控制自身数据的权利,还是要对它施以开放数据的义务?哪一种情况是常态,哪一种情况是例外?这完全是两个角度,最后会导致截然不同的结果。

笔者认为平台在一定情况下具有开放数据的义务,由此离不开反垄断层面的考量:是否将造成数据垄断?是否会造成限制竞争的效果?在公共利益面前如何平衡企业、其他竞争者的利益?等等。同时,反垄断对市场竞争行为的介入,应该是常态还是例外?如果认为平台具有控制自己所掌握的数据的权利是常态,那么拒绝他人爬取、使用平台数据是不是属于平台的经营自由?只有在划定了常态的情况下,才能去规定什么是例外,即在什么情况下属于不正当地拒绝他人的爬取,不合理地限制他人的正当使用。明确了常态和例外,才有对具体案件、具体问题进行判断的基本逻辑和出发点。此外,非常重要的是,明确了哪个是常态、哪个是例外,会直接决定证明责任的分配。


三、借鉴与思考:HIQ诉领英(LinkedIn)案

(一)他山之石的细节与本质

HIQ诉领英案一、二审的裁定中至少有几点值得关注:

第一,就数据的获取来说,一方面,法院充分考虑了领英对HIQ拒绝爬取、拒绝提供数据的行为所可能带来的信息垄断的风险;另一方面,法院也强调了多主体、多维度的利益平衡考量。此外,领英拒绝提供数据的行为本身有着一定的限制竞争意图,这恐怕也是法院作出禁令的重要原因之一。

第二,就数据的使用来说,HIQ并非是简单照搬式地使用领英数据,其对领英数据进行加工后,向市场推出自己的全新产品和服务,由此带来的社会和竞争层面的价值增益,是禁令中的一个重要考量因素。

第三,紧迫性问题。如果继续让HIQ爬取领英的数据,对于领英不存在生死的问题,即便存在损害,即便它这种爬取、使用是有问题的,对于领英来说仍然只是利益大小的损害,通过事后的损害赔偿大体是可以解决的,不至于导致领英面临生死问题。相反,如果领英拒绝HIQ爬取数据,那么对HIQ来说就会涉及生死问题。法院在这种情况下对于双方的利益进行了平衡,暂时允许HIQ继续爬取,避免HIQ面临退出市场等难以弥补的损害。

(二)著作权法的启示

关于爬取数据的一方获得的是谁的许可、被许可爬取的范围有多大这些问题的判断可以借鉴著作权法中权利人与授权范围、使用范围的对应性。对于使用数据行为中侵权或不正当竞争的认定,可以借鉴著作权法中作品的最终使用方式与原作品的“远与近”进行判断。结合HIQ诉领英案,第三方最终提供的数据产品或服务,与原平台对这些数据的使用方式之间的差异大小、接近程度,也可以作为判断其行为是否存在不当的一个角度。


作者:杨德嘉

编辑:徐静赛

审校:郑聪聪


来源:本院刊物《互联网法治》2021年第1期


更多内容

【课题招标】关于发布“2021年度互联网法治重点研究课题”的公告

直击“神仙打架”现场!10个互联网法治重点研究课题答辩结果出炉!

【课题招标】关于发布“2021年度互联网法治重点研究课题”的公告

专注“互联网法治”研究👉




您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存