查看原文
其他

黄晓锦 | 大数据时代数据分享与抓取的竞争法边界

财经问题研究 财经问题研究与东财学报 2021-09-15

数据是新的生产要素,是基础性资源和战略性资源,也是重要生产力。

要构建以数据为关键要素的数字经济。

——习近平

《财经问题研究》
数字经济专题”

[引用格式]:黄晓锦.大数据时代数据分享与抓取的竞争法边界[J].财经问题研究,2018,(2):17-21.


大数据时代数据分享与抓取的竞争法边界


黄晓锦

(中国政法大学 比较法学院博士后流动站,北京 100088)
作者简介:

黄晓锦(1979-),女,河南许昌人,博士,主要从事竞争法研究。E-mail:17575783@qq.com

(正文约5 600字,阅读时间约为 10 分钟)
对企业而言,大数据逐渐成为其生存和发展的重要要素。伴随而来的数据竞争则给相关法律和经济学研究带来了诸多问题和挑战。国内外已经产生了大量与数据相关的商业争议。从国内2011年开始的大众点评诉爱帮网案、2013年的百度诉奇虎360案、2015年的新浪微博诉脉脉案、2016年的大众点评诉百度案,到近来国外的hiQ诉LinkedIn案,这些案件或争议都与数据的抓取或分享相关。
本文结合大数据的特征、已有的相关研究成果和中外案例,就数据分享与抓取相关的竞争法适用进行探讨。(本文的探讨对象限于对不构成知识产权保护对象的数据的抓取和分享行为,不讨论可由知识产权相关法律进行调整的数据抓取和分享行为)具体而言,控制大数据的平台是否负有与第三方平台分享数据的义务,如果有,这一义务产生的前提条件是什么;同时,从反不正当竞争法角度,讨论处理因数据抓取而产生的争议应该考虑哪些因素。

一、大数据的特征和相关性的竞争法意义

大数据具有体量大、动态性和多样化(以下简称“3V”)三个特征,经过特定技术的分析可产生商业价值。就体量而言,以谷歌搜索为例,其平均每秒处理4万个搜索请求。就动态性而言,以地图为例,及时分析用户的定位数据有助于帮助司机实时选择通畅的道路,但过时的数据就不具有那么大的价值了。就多样性而言,能够用于实现商业价值的数据种类和来源渠道多种多样,比如可以帮助商家给用户提供机票推荐的数据既可能来源于搜索请求,也可以来源于目的地天气查询信息,或目的地地图搜索信息。

无论从反不正当竞争法的角度分析数据抓取是否正当,或从反垄断的角度分析数据分享是否应该成为一项义务,都需要先基于大数据的特征分析相关的竞争法意义。

第一,大数据不具有排他性。大数据实现排他性可以通过两种途径实现,第一种是从立法上确立权属的排他权,即权利主体对数据拥有独一无二的权利;第二种是从技术上实现排他性,即未经权利主体同意,他人从技术上无法获取数据。从法律角度而言,目前尚无法律规定前述案件或争议中涉及的数据属于特定企业或特定个人的财产,未来还需通过立法填补空白。从技术角度而言,虽然存在数据加密技术,但并不是所有的平台都有能力保护自有平台上的数据未经自身同意而不被抓取,尤其是手机制造商可以利用对操作系统部分功能的修改,实现绕过数据生成平台而直接获取数据的目的。

第二,大数据很可能具有可替代性。大数据的来源具有多样性,比如医疗数据可来源于不同的医院和医务服务平台,征信数据可来源于不同的金融机构和服务平台,用户的出行数据可来源于地图、火车票或飞机票购买网站、天气查询软件等。而且基于数据的动态性和用户的多归属性,各平台的海量数据在实时产生,很难发现哪些数据具有不可替代性。就此,欧委会在Facebook收购Whatsapp的反垄断审查决定中提到,在交易后仍然会有非常多的和Facebook一样搜集用户数据的线上广告服务提供者,并不认为存在因数据集中而导致的竞争担忧。(Case No COMP/M.7217-Facebook/WhatsApp.)在微软收购LinkedIn的审查决定中,欧盟委员会再次表示数据集中不会造成进入壁垒,微软不能单独控制网络用户的数据。(Case M.8124–Microsoft/LinkedIn.)第三,大数据不一定构成企业参与竞争的最关键资产。从竞争法角度考察企业行为时,需要理性认识数据对于企业的意义。大数据与算法是相辅相成的,如果不能快速有效处理数据并做出相应的决策,数据的价值便会减损。正如赫拉利所说,“无意识但具备高度智能的算法可能很快就会比我们自己更了解我们自己”[1]。因此,数据并不是孤立存在的资产,而是需要相应的数据存储(云)、处理和分析能力(算法)提供支撑。此外,数据是基于商业运用场景通过具体技术产生的,既是产出品也是进一步优化产品的原料。如果不能及时进行商业模式和技术的革新,那么平台会被用户抛弃,数据也随之不会再产生。

第四,基于数据产生的网络效应不总是构成企业参与竞争的实质性门槛。基于大数据提供的产品或服务具有典型的网络效应,因为机器学习能力的提高依赖于大数据的处理,处理的数据越多,算法学习的能力越强。在这方面,搜索引擎是最好的例子,其处理的搜索请求越多,就越能基于优化的算法给用户提供更精准的搜索结果。但并非所有基于数字平台提供的服务都具有强的网络效应,以社交产品为例,用户聊天记录的即兴性及信息留存的短期性(此类数据具有更明显的动态性)使得其因数据导致的网络效应并不明显。对于因数据引起的网络效应强的服务,在产生颠覆性的新技术和商业模式之前,该效应确实能够构建较高的市场进入门槛。

综上,从数据的3V特征、算法对于数据价值开发和利用的重要性、技术和商业模式对于数字平台成功的重要性,以及与数据相关的网络效应可以看出,大数据固然重要,但一般情况下并非不可替代,也很可能不是一家企业成功的最重要因素。

二、主要司法区域关于数据分享义务的执法态度

    欧盟在刚刚于2018年5月25日生效的《一般数据保护条例》(General Data Protection Regulation)中规定,数据主体有权要求将其提供给一个数据控制方的数据无障碍地直接转移到另一个数据控制方,而且前者还要以结构性的、惯常的、机器可读取的形式提供数据转移支持(数据可携权)(Regulation 2016/679, Art.20,of the European Parliament and of the Council of 27 April 2016 on the protection of natural persons with regard to the processing of personal data and on the free movement of such data, and repealing Directive 95/46/EC (General Data Protection Regulation),Accessed May 27,2018 http://eur-lex.europa.eu/legal-content/EN/TXT/?uri=uriserv:OJ.L_.2016.119.01.0001.01.ENG&toc=OJ:L:2016:119:TOC. )根据欧洲一家独立的有关数据和隐私保护的咨询机构于2016年12月13日通过的《数据可携权指引》( Guidelines on the Right to Data Portability),该权利旨在使数据主体享有将其个人数据从一个IT环境转移、复制或传输至另一个环境的能力,其主要目的在于使用户可以更为便捷地从一个服务提供者转向另一个服务提供者,从而促进不同服务之间的竞争,同时,它也将促进新服务的出现。(The Article 29 Working Party ,“Guidelines on the Right to Data Portability”,2016,Accessed May31,2018.http://ec.europa.eu/information_society/newsroom/image/document/2016-51/wp242_en_40852.pdf)因此,虽然上述条例最根本的宗旨在于保护个人数据有关的权利,但是基于此实现对竞争的促进,从而促进数字化单一市场的建立也是欧盟考虑的重要因素。

(一)关于数据分享的义务,美国与欧盟的态度截然不同

欧盟在即将于2018年5月生效的《一般数据保护条例》中规定,数据主体有权要求将其提供给一个数据控制方的数据无障碍地直接转移到另一个数据控制方,而且前者还要以结构性的、惯常的、机器可读取的形式提供数据转移支持。根据该条款的要求,Facebook的用户有权要求将其在Facebook的所有聊天记录转移到Skype上,而且这种转移方式还要简单易于操作。

而美国司法部的副助理部长Nigro Jr.指出,除了并购审查,美国反垄断法整体上不会给一方主体施加单方与竞争对手分享资产的义务。美国最高法院从来没有认可过所谓的“必需设施”理论,美国法院一直对企业有义务与竞争对手交易这一理念抱有怀疑态度。有很多理由怀疑利用反垄断法强迫分享数据的想法。强迫分享数据会降低对创新的投资,数据收集、存储和分析并不是免费的,也不容易实现。如果使用反垄断法在市场中制造竞争,那么就有减少为市场而竞争的动力的风险,而正是这个动力才使企业创造出了更新的、更好的产品。合理的反垄断执法(而不是行业管制)最能维护企业为市场而竞争的动力。当企业看到了分享的收益,相关各方会在自由和竞争的市场中进行谈判,这是最好的实现分享的方式,而不是政府的管制。

美国上述保护付出劳动一方的创新和投资积极性的态度值得称赞,而欧盟的“数据可携权”要求虽然一方面对推动其“统一数字市场”战略有所助力,充分保护了消费者的利益,但另一方面却给企业带来了很大的负担。首先,“数据可携权”的要求适用于所有企业,不论大小,适用面过宽;其次,开发保证数据在平台间可转移的软件代码是一项昂贵的投入;最后,“数据可携权”要求本身也忽视了控制数据的平台进行创新和投资的动力,因为这些平台无法从投入各项资本搭建和维护的平台上获取期待的数据竞争收益。

(二)中国可适用于数据分享义务的分析框架

在反垄断分析框架下,如果将数据分享看作一种交易,那么要讨论数据控制人与竞争对手分享数据的义务其实就是讨论其何时必须与竞争对手交易(即使有时交易的价格可能为零),何时有权拒绝交易。国家工商行政管理总局于2010年12月31日公布的《工商行政管理机关禁止滥用市场支配地位行为的规定》中第四条,规定了拒绝交易型滥用市场支配地位行为的构成要件,“拒绝交易相对人在生产经营活动中以合理条件使用其必需设施”是拒绝交易的一种表现形式,其中,分析被拒绝交易对象是否构成“必需设施”时应当综合考虑另行投资建设、另行开发建造该设施的可行性、交易相对人有效开展生产经营活动对该设施的依赖程度、该经营者提供该设施的可能性,以及对自身生产经营活动造成的影响等因素。可见中国的执法机构参考了同为成文法系的欧盟的相关理念,但对“必需设施”的构成要件设置了较高的门槛。

具体到涉及数据的拒绝交易行为,在认定市场支配地位时需要考察大数据的特征及其竞争法意义。一般情况下大数据本身很难构成竞争对手参与竞争“必需”的资源,因而相关主体很难构成市场支配地位。同时,在认定拒绝交易行为时,需要多关注拒绝分享的正当理由。例如,涉及个人信息的分享时,考察接收方是否有完善的隐私保护政策,接收方的数据使用用途是否合理、数据主体是否同意,过去是否存在既有分享行为(如果存在而突然中止,则需要说明中止的正当理由和效率说明),进行分享是否对分享方的利益造成不合理的损害(比如,提供数据接口给对方是否会造成自身平台的运营安全隐患和用户担忧)。最后,拒绝分享相关数据是否在利用大数据的市场造成了排除、限制竞争的影响,即是否如hiQ诉LinkedIn案中法官所关注的,将数据市场的垄断地位传导至下游市场,并造成了需要反垄断法介入的竞争损害。

三、数据抓规则的难点及中国的探索

反不正当竞争法主要是反对经营者通过不正当的手段攫取他人的竞争优势,保护的是受到不正当竞争行为损害的善意经营者的利益,目的是维护公平竞争的市场秩序[2]。因此,只要数据成为企业竞争的一种资源,不论相关数据是否构成一种明确被法律保护的企业财产权利,都事关公平的竞争秩序,从而使相关竞争行为能在反不正当竞争法中找到被调整的空间。

实现正当的数据共享,有两种途径,第一种是根据反垄断法逻辑,在达到一定条件时,要求数据控制方承担分享的义务;第二种是对于不具有法律和技术上排他性的数据,由第三方直接抓取,也正是这类抓取在中国引起了诸多争议和若干诉讼。第二种实现共享方式的核心问题是,数据控制方、用户和数据抓取方中间谁有权利决定数据的去向,数据的所有权、使用权和控制权归谁。为实现数据相关的社会福利最大化,有没有必要通过立法的方式确立数据相关的各项权利。

(一)数据权属是一个复杂的尚没有结论的问题

欧盟内部的联合研究中心在向欧盟委员会提交的工作报告中提到,在数字经济时代,虽然数据的体量和价值在与日俱增,但无论对于企业的商业数据而言,还是对于个人数据而言,数据的所有权、接入和交易相关的法律框架是不完整甚至是模糊不清的,这种不确定性不仅存在于欧盟,世界其他地方也面临着同样的问题。这份报告里还提出了很难以“事前”了解什么样的安排是能使社会福利达到最大化的,因此,交给私人主体和市场竞争去自主找到最佳安排也许是最可行的,但又发现私人谈判的成本很高。总结而言,权利分配问题是一个难以给出答案,还需要进一步研究的问题。

国内学者有主张基于投资激励的需要,数据在制度设计上是有可能作为一种排他性财产权存在的,另有学者认为应该放弃私权观念,而将大数据下的个人数据信息作为公共物品,依据公法性质的行政法律法规加以治理,目的是为了社会公共利益、国家和公共安全,治理的主体应该是政府设立的专门行政机关[3]。另外,在大众点评诉百度一案中,法院明确指出大众点评网上用户评论信息是其付出大量资源获取的、且具有很高经济价值的劳动成果,但这些评论信息却不属于任何一项法定权利。

(二)突破权属问题的数据抓取规则

虽然数据权属是一个还需要进一步观察和研究的问题,但是,中国反不正当竞争法相关的诉讼案例已经在权属问题之外,为建立数据抓取规则建立了有益的参考。从新浪微博诉脉脉案和大众点评诉百度案来看,法院都认定用户信息是经营者进行产品研发、提升企业竞争力的基础和核心,具有重要的商业价值,而且经营者在收集、加工用户数据时投入了大量成本,所以经营者可以对其收集的数据主张合法权益,免受不正当抓取。数据的直接生产者,以及信息所指向的特定用户对于数据抓取的知情权和选择权应当予以保障,这是所有数据收集、分析和使用的最基本前提。在这方面,新浪微博诉脉脉案做出了开拓性的尝试,法院认为,在认定互联网领域内获取并使用用户信息的不正当竞争行为时,取得用户同意及保障用户的自由选择是公认的商业道德。

结合以上对直接产生和维护数据的两类主体的权益保障考虑,新浪微博诉脉脉案一案中,法院确立的第三方通过Open API 获取用户信息时需坚持“用户授权”+“平台授权”+“用户授权”的三重授权原则,即用户授权平台许可收集信息,其他经营者在获取、使用信息时需征求平台许可和用户的再次许可的制度安排具有广泛适用的价值和意义。

当然,除了通过Open API获取数据外,还可以通过网络爬虫或更改操作系统底层设置的方法获取数据,在这种情况下如果数据控制方已经通过Robots协议(Robots协议,也称为爬虫协议、爬虫规则、机器人协议,是网站国际互联网界通行的道德规范。该协议来源于robots.txt(统一小写),即一种存放于网站根目录下的ASCII编码的文本文件,它通常告诉网络搜索引擎的漫游器(又称网络蜘蛛),此网站中的哪些内容是不应被搜索引擎的漫游器获取的,哪些是可以被漫游器获取的。因此,所谓Robots协议,就是将抓取网站内容的范围做了约定,包括哪些内容不允许被抓取,而网络爬虫可以据此自动抓取或不抓取该网页内容)等方式明确禁止数据抓取,或者,已经通过双方商务沟通或技术对抗的方式明确宣告了不允许数据抓取的态度,那么数据获取方再强行抓取则有违反公认的商业道德并破坏竞争秩序之风险。(日本《面向第四次产业革命不正当竞争防止法相关讨论》的中期报告(草案)中也将没有权利的外部人员通过破坏数据管理者的管理取得数据的行为列为不正当取得数据的行为)

参考文献:

[1] 尤瓦尔·赫拉利. 未来简史[M]. 林俊宏,译,北京:中信出版社,2017 .361.

[2] 晓晔. 再论反不正当竞争法与其相邻法的关系[J]. 竞争政策研究,2017,(4): 5-12.

[3] 吴伟光. 大数据技术下个人数据信息私权保护论批判[J]. 政治与法律. 2016,(7): 116-132.


(责任编辑:邓  菁)

公众号责任编辑:李明齐



电话:0411-84710267  

投稿网站:http://zzs.dufe.edu.cn/



数字经济专题系列文章

陈永伟 | 数据产权应划归平台企业还是消费者?

杨培芳 | 构建互联网时代的社会协同新经济模式

费方域,闫自信 | 大数据经济学视域下的竞争政策

吕本富 | 从平台经济到平台经济学

吴绪亮 | 现代经济学的数字化革命

陈   禹 | 互联网时代需要什么样的经济学

郑   磊,郑扬洋 | 区块链赋能实体经济的路径——区块链 Token 经济生态初

谷燕西 | Libra 对全球金融行业的冲击

袁煜明,王   蕊 | Libra 的运营、监管与“类 Libra”的功能畅想

孙点婧 | 首次代币发行的监管:问题与对策

郑   磊 | 通证数字经济实现路径:产业数字化与数据资产化

姜奇平 | 用网络方法解释网络经济学

龙白滔 | 全球数字货币竞争的政治经济学分析——公共数字人民币DC/EP与私人数字美元Libra
戴   龙 | 数字经济产业与数字贸易壁垒规制——现状、挑战及中国因应

曲   创,刘重阳 | 互联网平台经济的中国模式

杨 望, 彭 珮, 穆 蓉 | 全球区块链产业竞争格局与中国创新战

吴汉洪,刘雅甜 | 互联网行业的竞争特点与反垄断政策

孙康勇 | 数字经济时代的企业创新

张  穹,曾  雄 | 数字经济领域的创新与公共政策的匹配

方  燕 | 网络产业反垄断规制的重新审视

寇宗来,刘雅婧 | 数字经济下的监管挑战

丁文联 | 数据竞争的法律制度基础

蒋传海,应珊珊,陈青祝 | 互联网反垄断面临的挑战和难点


(点击图片链接浏览目次)

封面图片@视觉中国


投稿请点击

  阅读原文

   

: . Video Mini Program Like ,轻点两下取消赞 Wow ,轻点两下取消在看

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存