查看原文
其他

“数据垄断”:从表象到本相

青苗法鸣 2022-07-25

编者按:当数据成为企业经营的核心要素,数字经济市场的所有未解之谜似乎都在导向这样一个问题,即数据持有量是否构成限制、排除竞争的绝对因素而为《反垄断法》所规制。陈兵教授依次从数据排他性、市场进入壁垒、企业市场力量三个维度对数据垄断性的表象进行分类与评判,同时鲜明地指出数据垄断的本相为数据产生的市场力量而非数据本身,这将为当前数字经济平台反垄断执法提供有益参考。


作者简介

陈兵,南开大学法学院教授、博导,竞争法研究中心主任。


目  录

一、问题提出

二、数据是否具有排他性

三、数据是否会构成难以突破的市场进入壁垒

四、数据持有量是否等同企业市场力量

五、结语:需重点关注与数据相关的竞争行为


摘要:当前数据已成为互联网市场竞争的核心资源,也是互联网企业特别是平台企业获取竞争优势的关键要素。近年来,与数据的收集、使用相关的竞争和反竞争愈演愈烈,引发了全球主要国家和地区竞争主管机构以及理论界对“数据垄断”的普遍关注,有关企业是否能凭借数据积累获得或者维持市场支配地位的问题仍存在较大争议。通过对相关热点事件、案件及有关文献的梳理,从数据是否具有排他性、数据是否构成市场进入壁垒以及企业的数据持有量是否等同企业市场力量等维度出发,对数据是否存在垄断作出初步判断。对“数据垄断”的不同认识在很大程度上源于对不同类型数据所具有的排他性的判断,数据持有量并不构成经营者进入市场的主要壁垒,且数据持有量对持有者市场力量的获取和维持的作用是有限度的,基于此,经营者持有大量数据并不必然导致对数据驱动型业态竞争的限制、并不等同于排除竞争等违法行为的发生。然而,这并不意味着“数据垄断”的潜在风险和威胁在实践中不存在,仍需重视数据在数字经济市场竞争中的作用,高度关注与数据相关竞争行为的合规性审查,以有效推动数字经济高质量发展。


关键词:数字经济;数据垄断;数据壁垒;原始数据;衍生数据


一、问题提出

新科技时代的数据已成为企业的核心资产,尤其在全球遭受新冠肺炎病毒肆虐之际,经济社会发展缓慢,无接触经济、在线经济却异军突起,成为疫情期间各国和地区经济社会生产生活的关键通路和重要形式。此时,数据已成为人类经济社会、政治生态、教育文化、法治实践等方面的关键要素,尤其是各类以电子形式存在的、内容丰富的数据。数据不仅关乎经济发展,更关涉社会治理与国家安全,因此越来越受到重视。特别是当海量数据由巨型平台所控制和占有时,“得数据者得天下”的趋势更加明显,更有学者基于当前数据控制和占有的现实状态,提出了“得平台者得天下”的观点。事实上,两者并不矛盾,相反折射出当下数据被平台所掌握的事实,特别是海量数据为少数超级平台所掌握,在形式上呈现“数据垄断”的现象,以致于在有关数据收集存储、分析计算、流转分享、复用创新等过程中,出现数据竞争与垄断的现象,引起了全球各界广泛的关注。数据垄断问题不仅是理论界亟待探明的学术争议,亦是实务界亟须澄清的实践困惑。


近年来与数据相关的竞争行为已引起各国和地区反垄断执法机构和司法机关的重视。譬如,欧盟委员会于当地时间2020年8月4日宣布,将对谷歌收购可穿戴智能设备巨头Fitbit的交易进行为期四个月的深度审查,以确保这起收购不会违反反垄断的规定。2019年11月,谷歌宣布对Fitbit高达21亿美元的收购,欧洲反垄断机构称,这项交易可能进一步巩固谷歌在线广告业务的市场地位,因为谷歌能够收集大量的用户数据进行个性化的广告投放。可见,数据集中已成为当前互联网巨头市场竞争行为中值得特别关注的问题。又如,德国联邦卡特尔局曾对脸书(Facebook)展开调查,并于2019年2月7日裁定脸书在收集、合并和使用用户数据时滥用了市场支配地位,要求其在12个月内停止这些滥用行为。在裁定公布后不久,联邦卡特尔局又发表声明,称如果脸书对Whats App、Instagram和Messenger这三款应用进行合并,将会对其启动反垄断调查,以阻止其对数据的收集和滥用。同时,在我国2020年12月16—18日召开的中央经济工作会议中,更是明确将反垄断监管与规范数据采集使用行为联系起来,特别是在对金融创新的监管上,对于金融领域的数据巨头需要加强反垄断监管。综上,当前数据已成为主要国家和地区竞争监管机构审查互联网企业,特别是具有金融属性的科技平台企业经营者集中时,以及评估其是否滥用市场支配行为时重要的观察要素,数据竞争与反竞争行为已成为新科技时代市场竞争规制无法回避的重心与中心。


经济合作与发展组织(OECD)指出,数据驱动市场与其他市场相比,其市场集中度较高且更容易出现垄断。国内外一些学者也持有类似的观点,认为企业能够通过收集大量用户数据来获得或维持市场支配地位。优势企业对大量数据的排他性支配,使它们有能力将竞争对手赶出市场。因为新进企业无法或很难获取或购买与优势企业竞争时所需的大量数据,在互联网市场竞争中数据的差距会导致企业所提供的服务或商品的质量出现差距,从而可能使新进企业无法有效进入市场,此时存在无形的市场进入壁垒将导致互联网市场趋向垄断。然而,也有学者持相反观点,主张“数据垄断”并不存在,因为数据具有非竞争性和瞬时性,且企业无法对用户数据形成实质性的控制,用户可以通过多归属对个人数据进行共享,所以企业积累大量数据并不必然产生竞争优势,也无法由此获得持续性的市场力量。可见,理论界对数据垄断存在与否的问题仍然存在较大的争议,本文主要结合相关案例、事件及有关文献,从数据是否具有排他性、海量数据是否构成市场进入壁垒、企业所拥有的数据量是否等同于企业市场力量等三个维度,解析“数据垄断”的表象与本相,在此基础上评价数据集中对市场竞争产生的现实的和潜在的影响。在这一过程中,主要论及数据的非排他性、可共享性等基本特征,以及基于数据特征而展开的各类数据行为,特别是数据持有、控制行为及其数据持有量和使用方式可能与其竞争力量的关系,是在基于数据全周期行为展开场景下的一种述评,目的是揭示和解释“数据垄断”的表象及其可能被误读的原因,以及不可忽视的数据行为的反竞争风险。


二、数据是否具有排他性

一般来说,数据是对客观事物的逻辑归纳,是信息的表现载体与形式,是在计算机及网络上流通的,在二进制上以0和1的组合表现出来的比特形式,具有无形性、可复制性以及非消耗性等特征。对数据是否具有排他性的问题,社会各界尚未达成一致意见。主张存在“数据垄断”的学者认为,从数据的实然属性看,数据具有一定程度的排他性,特别是在强化数据权属明确及其保护优先的前提下,经营者可利用数据权属的排他性,运用合法或非法的手段在大数据市场获得或维持支配地位。而否认存在“数据垄断”的学者则认为数据不具有排他性,因为数据无处不在,任何企业都无法对数据进行实质性和绝对性的支配,且数据并不是消耗品,企业对数据的使用并不会影响其竞争对手获取并使用相同或相似的数据。然而,上述截然相反的两种观点,对数据排他性的分析皆过于笼统,未充分考虑数据排他性会因数据类型的不同而存在差异。以近年来受到社会各界广泛关注的作为消费者的用户数据为例,依据用户数据是否经过加工处理,可以分为用户原始数据与用户衍生数据。虽然两类数据都包含可识别用户个人的信息且蕴含巨大的商业价值,但是二者具有的排他属性存在一定差异。


(一)用户原始数据,指包含用户身份、联系方式以及喜好等个人信息的未经处理或简化的第一手数据。此类数据一般不具有排他性,这是由该类数据所具有的特性决定的。

首先,用户原始数据具有非排他性、共享性的特点,数据作为一种无形物,不可能被某特定主体独占。当前,在互联网企业特别是平台企业的用户协议中都没有规定排他性条款,也并没有限定其用户只能向该企业提供数据的约定。实践中在互联网场景下用户多归属是常态,用户可使用多个不同的平台,享有多种不同或相同的服务。当用户多归属性存在时,用户与多个平台之间是共享数据的关系。


其次,用户原始数据具有非竞争性和复用性,不会因使用而发生损耗,其使用具有“无损性”和“同时性”。即便大型平台拥有大量的数据,其对所收集数据的分析和使用并不会影响其他竞争者收集数据的质量,也不会减少其他竞争者可获取数据的数量。


最后,用户原始数据具有一定的可替代性。虽然,中小型平台难以获取与大型平台相同或者等量的数据,但是,大型平台所持有的用户原始数据理论上能被其他与此类数据使用目的相关的数据所替代。究其原因在于企业收集和使用用户数据的目的主要有两个:一是用于改进产品和服务的质量,二是用于提高定向广告的准确性,中小企业即便无法直接获取大型企业所持有的数据,也可通过自行收集或者向出售数据的第三方企业购买的方式获得可用于实现上述目的的用户数据。


(二)用户衍生数据,指用户原始数据经算法或简化技术加工处理所获得的数据。虽然,用户衍生数据所具有的部分特性与用户原始数据相同,但是,此类数据在事实层面和法律层面上已经在很大程度上具有排他性。

在事实层面上,用户衍生数据具有的不可替代性以及独占性,使得企业能够对此类数据实现实质上的支配。尽管加工前的数据源于用户原始数据,但是,经算法等技术加工的用户原始数据在数量、质量以及分析结果相关性等方面都会发生实质变化。实践中不同企业即便持有相同或大致类似的用户原始数据,这些数据也会因算法算力及应用场景的不同出现差异,故此,不同企业所持有的用户衍生数据往往不具有可替代性。且由于此类数据的计算、加工及处理过程,皆在不具有开放性的系统内部运行,企业可以通过设置访问权限以及运用数字加密技术等方式禁止其他企业访问此类数据,所以用户衍生数据也具有一定的独占性。


在法律层面上,用户衍生数据所具有的排他性还源于知识产权法所赋予的产权保护。此类数据可视为一种商业秘密,商业秘密是指不为公众所知悉、具有商业价值并经权利人采取相应保密措施的技术信息、经营信息等商业信息。《关于审理侵犯商业秘密纠纷民事案件应用法律若干问题的解释(征求意见稿)》第5条规定:对特定客户的名称、地址、联系方式、交易习惯、交易内容、特定需求等信息进行整理、加工后形成的客户信息,可以构成反不正当竞争法第9条第4款所称的经营信息。可见,企业不仅能够在事实上实现对用户衍生数据的直接支配,且在法律的保障下可以排除其他竞争者对此类数据的访问或获取,因此用户衍生数据在法律层面也具有一定的排他性。


可见,不同类型的数据具有的排他性的程度存在差别,不能笼统地对数据的排他性作出认定,故在判断平台是否可基于对大量数据的排他性支配而获得市场力量时,需要结合平台所持有数据的类型进行判断。以用户数据的两种类型为例,如果企业持有的用户原始数据能被其他与数据使用目的相关的数据替代,那么对该数据的排他性控制不会导致市场垄断。反之,如果企业获取的用户衍生数据在事实或法律上受到保护,且其他企业获得相同的数据存在困难,则独占这些数据的企业可能会由此获得一定的竞争优势。但是需要注意的是,由于数据通常不会独立提供价值,算法分析技术的加工处理才是数据发挥自身巨大商业价值的关键,所以不能简单地将企业拥有的强大市场力量归因于对数据的排他性支配。


三、数据是否会构成难以突破的市场进入壁垒

随着互联网科技巨头的规模不断扩大,新进企业进行有效竞争所需具备的规模也随之增加。有学者进一步指出,当新进企业无法收集或购买与老牌企业相同的数据时,该企业对数据数量和种类的需求可能会形成进入壁垒。还有学者认为对于新进企业而言,高昂的前期沉没成本构成了市场进入壁垒,会限制潜在的竞争者进入市场。


虽然新进企业的确可能会因数据持有量不足而面临竞争劣势,但有学者指出,这种竞争劣势的形成并不仅仅源于数据的持有量,实际上还源于算法技术、产品质量以及经营策略等多方面因素。数据形成的壁垒往往是企业以竞争对手无法复制的方式提高了产品的质量,因此,不能把新进企业无法与老牌企业竞争的原因简单地归因于数据的持有量。此外,尽管老牌企业可能由于经营时间较长而拥有更多的数据,但企业之间的资产存在差距并不是形成进入壁垒的充分条件。而且新进企业对数据的要求要比老牌企业灵活得多,因为这些企业可通过创新开发满足用户需求的产品,并从由此吸引而来的用户处收集可用于改进产品的数据。所以与老牌企业相比,新进企业在数据的收集或分析方面并不会处于竞争劣势。当然,数字市场中也确实存在大量被市场淘汰的新进企业,但是没有直接证据表明这些企业的失败源于缺少足够的数据量。不能仅因为其他竞争者在某个时间点没有拥有与当前竞争对手相同的数据量或内容而将数据视为进入壁垒,这实质上是将生产要素输入的差距视为构成进入壁垒的原因,这相当于断言资本可能会形成进入壁垒。


除数据持有量不同形成的进入壁垒外,数据所形成的壁垒还源于企业对数据访问所设的各类限制。然而,否认此观点的学者指出,该观点的成立需证明用户数据是企业进入市场必不可少的输入,且是不可替代的。关于用户数据的可替代性此处不再赘述,此处需要分析的问题在于,用户数据是否是“必不可少”的。实际上,除了专门收集个人信息的企业,用户数据并不是企业必不可少的输入。譬如,Duck Duck Go是一款定位为“把隐私放在第一位”的搜索引擎,不会以主动存储用户的IP地址或记录用户的搜索信息等方式获取用户信息。虽然Duck Duck Go同样通过广告盈利,但是其提供的广告并非基于用户数据,而仅基于用户输入的搜索词,且用户在查看搜索结果时,Duck Duck Go不会向第三方提供任何可识别个人身份的数据。Duck Duck Go凭借其注重保护用户隐私的优势获得了用户的支持,如图1所示,Duck Duck Go日均搜索流量保持逐年增长趋势且增速明显,截至2020年8月7日,Duck Duck Go的日均搜索流量已达5.4千万,2020年的总搜索量已突破129亿次。Duck Duck Go的市场影响力也日渐扩大,是Firefox、Chrome等浏览器的默认搜索引擎之一,且在商业上与Bing、Yahoo、亚马逊和eBay等知名企业存在合作关系。此外,据近期有关报道显示,Duck Duck Go还将成为欧盟安卓(Android)设备的默认搜索引擎中的首选项。可见,Duck Duck Go在未获取用户数据的情况下仍取得了成功,在一定程度上表明用户数据并不是企业进入市场必不可少的要素。除搜索引擎外,诸如视频平台、音乐平台,乃至社交平台,这些平台在向用户提供产品和服务之初,即便没有用户数据的积累,其提供的商品和服务同样也可以满足用户的基本需求。譬如,音乐平台Spotify即使没有数据的积累也成功超越拥有大量用户数据的iTunes成为在线音乐的领先平台。诚如有学者主张,即使大型企业所拥有的数据是唯一且具有巨大价值的,然而这并不意味着新进企业必须获得相同或相似的数据才能进行有效竞争。


申言之,数据形成进入壁垒的主张仅看到了成功企业拥有大量数据的事实,而忽略了企业成功是多种因素共同作用的结果,过分夸大了数据对企业成功的决定性作用。事实上,数字经济与传统经济相比,市场进入壁垒相对较低,且实践中新进企业颠覆老牌企业的诸多例子也表明,创新,特别是高科技创新,具有强烈的颠覆市场的竞争效果,能够帮助新进企业有效突破市场壁垒。故此,数据持有量的差异及获取数据的难易度,虽然可能会给新进企业带来一定的甚至巨大的竞争挑战,但是其并非新进企业难以突破的市场壁垒,即数据很难成为反垄断法意义上的市场必需设施。



四、数据持有量是否等同企业市场力量

若要判断企业的数据持有量是否等同于市场力量,需要先对数据在市场竞争中的作用有清晰的认识。可以肯定的是,在数字经济背景下,数据对企业自身的发展以及市场竞争都具有重要作用。数字经济的技术革新彻底改变了数据运用的传统方式,在近期发布的《关于构建更加完善的要素市场化配置体制机制的意见》中明确将数据纳入生产要素,并提出要加快培育数据要素市场。不仅如此,企业通过向用户提供免费基础服务,将用户个人数据视为关键输入变量,实时追踪用户喜好和日常生活,及时调整和优化服务,为商家依据用户消费画像投放在线定向广告提供基础,实现数字产业化,这已构成了诸多互联网超级平台的主要盈利模式和竞争优势。由此可见,数据本身对于企业的发展与竞争具有重要意义,甚至成为企业竞争的关键资源要素。


那么企业的数据持有量是否决定市场力量呢?主张存在数据垄断的学者认为,数据已成为数字经济背景下最重要的生产要素之一,数据的积累有助于获得竞争优势和市场力量,由于新进企业难以获得与老牌企业相同数量的数据,所以新进企业往往无法进行有效竞争。随着数据差距和质量差距在老牌企业和新进企业之间扩大,老牌企业在质量和创新方面受到的竞争约束也将减少。这种由数据差距形成的质量差距源于“反馈回路”,即在直接和间接网络效应的影响下,随着平台用户数量不断增长,其可以收集的数据也不断增多,从而能够知悉消费者的需求并对产品进行改进和创新。而随着产品服务质量的提高,将会吸引更多用户,并由此收集到更多数据,以此类推,最终形成“反馈回路”。在反馈回路理论下,拥有数据量较多的企业往往能够在市场竞争中脱颖而出,因为反馈回路会扩大这些企业与其他竞争对手之间差距,进而形成无可比拟的竞争优势。因此,企业能够通过获取或持有大量数据而获得市场力量。


然而,上述观点存在较大的误导性,且高估了数据持有量对企业市场力量形成的作用。实际上,数据积累对企业市场力量形成的作用是有限的。首先,数据并不能直接用于改进产品或者提供个性化服务,比数据本身更重要的是对数据进行的加工,以及如何使用这些数据对产品进行改进和创新。数据虽然是这个过程的重要输入,但是其作用并不是绝对的。即使企业拥有大量数据也无法确保获得成功,企业的成功往往还取决于技术、服务质量、创新速度以及对消费者需求的满足等多方面要素。可见,数据的经济效用不取决于数据本身,而是取决于公司分析数据的能力。所以,认为数据持有量等同于市场力量的学者,仅关注到成功企业拥有大量的数据并从中获得巨大利益的事实,即便这些事实是正确的,也无法说明数据就是这些企业成功的源泉,因为这些企业的成功可能源于产品创新或者更高的效率。


其次,网络效应下形成的反馈回路效果可能被严重高估。多数互联网企业所具有的积极的间接网络效应一般是单向的,虽然广告商的确会优先选择拥有大量用户的搜索引擎或其他在线平台,但随着广告数量的增多,可能会影响用户使用产品服务的体验,进而导致用户流失。可见,这种消极的间接网络效应反过来削弱了“反馈回路”效果。而且,也没有证据表明用户在网络效应的影响下不能或不会转向使用其他产品,例如在2006年,Facebook在印度推出社交网络时并没有任何印度用户,而竞争对手Orkut是当时印度最受欢迎的社交网络平台,拥有数百万用户,理论上具有非常强的网络效应。但四年后,Facebook取代Orkut成为印度领先的社交网络平台。可见,网络效应所形成的“反馈回路”效果并不是绝对的。


最后,数据存在一定的时效性。有研究表明,随着时间的推移,数据价值会大大降低。数据的寿命是有限的,旧数据的价值不及新数据。数据的时效性可能在一定程度上削弱主导经营者的优势地位,若忽略数据的时效性而仅考虑数据规模可能会高估老牌平台与新进平台之间存在的市场力量差距。即使在社交网络和通信应用等直接网络效应较强的市场中,也存在许多能够表明创新足以颠覆市场的经典事例。


总之,虽不可否认数据对互联网企业竞争具有重要作用,但也不能高估数据持有量在市场竞争中的作用。企业能够从数据中获得巨大竞争优势的根本原因可能并不在于数据本身,而在于企业处理数据的效率、分析数据的能力以及更新数据的速度等因素。新进企业若不提高其收集和分析数据的能力,即便能够拥有与老牌企业相同量的原始数据,也难以在市场竞争中获胜,由此可见,企业的数据持有量并不等同于市场力量。


五、结语:需重点关注与数据相关的竞争行为

通过对国内外与数据垄断相关案例和文献的解析,可以发现“数据垄断”表象背后的本相是企业持有相对较多的数据量并不当然意味着拥有无可比拟的市场力量,这一点从Duck Duck Go在面对搜索平台巨头谷歌,拼多多面对电商平台寡头天猫、京东,以及抖音面对社交霸主微信的强大竞争压力下,亦取得了成功的事例中可窥见一斑。当然,这类后发平台企业的创新突破仍然面临着持续不断的竞争“围堵”,即便是这些后发平台本身亦发展为持有海量数据的企业之际,也并未因为其持有海量数据就可以高枕无忧,相反还需更加谨慎地面对业内先发者与后来者的竞争压力,更加聚焦于对海量数据的合法合规的有效采集与创新使用。首先,对数据排他属性的判断需充分考虑案件或事件中涉及数据的具体类型,同时,也不能简单地将企业拥有的强大市场力量归因于数据的排他属性。其次,数据并不是形成进入壁垒的主要因素,因为数据进入壁垒的表象背后是多种因素共同作用的结果。最后,数据积累对市场力量的影响是有限的,数据持有量并不等同于市场力量。综上所述,虽然数据对企业的发展与竞争具有重要作用,但企业持有的数据量并不是市场垄断产生的决定性因素,因此并不存在所谓的“数据垄断”。


然而,这是否意味着竞争管理机构可放松对数字经济市场的竞争管控?答案是否定的,虽然持有大量数据的企业并不一定拥有强大的市场力量,但是这些企业仍然可能会对市场良性竞争产生一定的威胁,正如学者大卫·埃文斯指出的,不论是否是成功的企业,都肯定会从事反竞争行为,不能指望这些企业会像“天使”一样。竞争监管机构应在主导企业可能实施违法行为并损害消费者的情况下,对其进行审查。尤其是在网络效应、技术优势以及缺乏外部选择等因素的作用下,主导市场的企业可能会在一定程度上免受竞争约束的影响,而更容易滥用其市场支配地位。且在某些特定情况下,数据的收集和分析可能是导致反竞争效果的一个因素。譬如,具有市场支配地位的企业限制数据的访问和共享可能限制竞争,尤其是当独特数据集合构成竞争对手赖以生存的关键输入时,这种限制行为将可能从根本上抑制竞争对手的进入或扩张,或致使其他竞争者退出该市场,造成数据市场的封锁效果,从而给相关市场带来竞争损害。此外,竞争管理机构还需关注企业对限制用户自由移转进行不合理的锁定,或是滥用其支配地位对用户数据进行过度收集等损害用户利益的行为,也可考虑将用户的隐私保护水平视为一个非价格竞争因素,若具有市场支配地位的企业实施的行为降低了用户的隐私保护水平,也可认定企业的行为具有一定的反竞争性或剥削性。由此可见,即使“数据垄断”并不存在,也不能忽视数据在市场竞争中的作用,仍需重点关注与数据相关的竞争行为,以保障数字经济市场的健康有序发展。


本文责编 ✎ 清风

本期编辑 ✎ 张睿哲



推荐阅读

天价互联网平台垄断处罚评析

互联网平台反垄断,你需要了解这些前沿问题

大数据背景下公民个人信息刑法保护的问题

跨境数据流动的国际规制探析与中国因应

互联网行业经营者集中反垄断规制的挑战与解决思路


联系我们

长期收稿邮箱:qmfmbjb@163.com


社群交流请添加公共微信:

公共微信1:qmfmggwx  

公共微信2:qmfmggwx2


付费咨询与讲座请添加小助手微信:qfxzsggwx


商务合作请添加微信:Fuermodian


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存