如何设计数据交易市场?(下)
本文编译自《数据的市场》(Markets for Data), 原文载于Industrial and Corporate Change 2020年第3期,作者Pantelis Koutroumpis, Aija Leiponen, Llewellyn D. W. Thomas。
本文上篇内容已发布,可点击(如何设计数据交易市场?(上))阅读。
为了阅读的流畅性,本文对正文及脚注部分略有删减。
3.2 数据市场的匹配模型
表1根据上述市场设计原则描述了四种常见的不同类型的数据市场,买家和卖家匹配数据概念上与任何其他类型的市场并无不同。可以应用Roth的市场设计方法对一些创新市场进行有效的市场设计。然而商品的非竞争性、必要的互补性资产以及薄弱的知识产权破坏了创意或技术市场的自发和不协调发展。薄弱的知识产权无法满足市场厚度和市场安全的条件。数据市场和创意市场面临许多相同的问题,但治理补救措施不同。
表1 按匹配机制划分的数据市场类型
Acxiom是一家位于加利福尼亚州旧金山的SaaS公司,提供数据连接平台,其服务包括数据上载,用于营销目的的在线离线数据传输。
Waze是一个基于GPS的导航移动软件应用程序,提供免费的地图导航和基于位置数据的广告投放服务,于2013年被谷歌收购。
3.2.1. 一对一
一对一匹配是一种双边关系,涉及一个买家和一个卖家,通常以协商交换条款为特征,建立关系合同。双边数据交易商包括个人或行业数据供应商和经纪人。这些公司从数百名线上和线下的消费品和服务卖家那里购买、汇总和销售消费者数据。
在双边市场设计中,关系契约通常控制商业关系中的重复互动。这种关系的持续性质使得交换的某些方面可以被非正式地定义,而不能在法庭上强制执行。然而对长期关系的期望为双方提供了善意行事的激励。
在双边数据市场中,许可协议通常管理持续的服务关系,建立双边期望。此外,一些关键问题可能无法在双边数据合同中预期或正式确定。因此,关系合同的成功取决于双方维护关系的利益及其在市场上的外部声誉。双边数据交易通常由支持交易但与高交易成本相关的关系契约管理。
该关系中低下的市场效率使流动性成为问题,因为在交易保密的情况下,很难找到贸易伙伴。另一方面这也可能会限制参与者的战略行为:更全面的合同及其受监控的执行使得与来源和拨款相关的安全性和清晰度更容易实现。较少数量的交易解决了拥堵问题,但搜索、谈判和关系管理提高了交易成本。此外,由于双边市场经常处理机密数据,因此更可能令公众反感。因此,尽管双边数据市场的关系方面可以改善一些问题,但这些市场仍可能无法奏效。
3.2.2. 一对多
当一个卖方与多个买方就同一数据进行交易时,由于单独协商的高成本,通常采用一对多匹配的标准化交换条款。我们可将此类市场称为分散市场,例子包括通过应用程序编程接口或API分发的大多数开放数据。许多金融市场数据都通过这种方式访问。实现市场厚度可能需要营销和品牌推广,但实现过程可以自动化,减少拥挤和交易成本。然而,在没有关系监控的情况下,基于API的自动交易可能会导致一些买家的战略行为,由此降低数据对卖家和其他买家的价值。自动化标准合同也可能无法全面描述数据的来源和质量,因此削弱了来源。但市场的公开性和可见性使其不可能涉及令人反感的数据。
3.2.3. 多对一
多对一市场涉及多个卖家和一个主要买家。用户将其数据提供给单一的服务提供商,交换条件通常类似于易货:用户获得“免费”服务以交换数据。收集的数据通常用于内部产品开发,并通过数据代理和其他营销公司在外部商业化。因此,数据采集公司通常在两个数据市场中运营,获取数据的多对一市场和将数据货币化的一对一或一对多市场。
这种市场的流动性取决于邻近市场对以物易物的“免费”服务的欢迎程度。然而,唯一可用的数据类型是与邻近市场提供的活动相关的数据。同时,收集数据的拥挤程度和交易成本可能非常低。然而,如果数据收集与隐私相关规范等令人反感的担忧相冲突,交易成本可能会迅速飙升。GDPR赋予用户“被遗忘权”对于旨在将用户数据货币化的在线服务提供商来说便有可能意味着高昂成本。战略行为也可能是该市场的问题所在。对于数据采集器和采集器市场中的数据提供商来说,挪用制度可能很薄弱,因为在大规模环境中,通常有包罗万象的条款条件,用户对数据使用几乎没有控制权。数据来源将根据其收集情况而有所不同。由于标准条款和条件可能无法验证数据的来源,只能要求确认用户可以合法共享数据。因此,在多对一市场中,专有机制可能会受到影响,数据来源可能会有所不同,但往往是浅层的。
3.2.4. 多对多
最后,多边市场是大量注册用户可以上传和维护数据集的交易平台,通过标准化或协商的不同许可模式对数据的访问和使用进行监管。在这些市场中,一个平台可能会调解来自整个数据生态系统的参与者之间的交易,包括数据创造者、管理者、分析师、服务提供商和聚合者。在一般形式下,多对多市场是一个双边市场。
与传统的市场中介不同,双边市场通常不拥有商品所有权,而是通过促进交易来缓解(并从中获利)瓶颈。多方市场理论对多边数据市场的潜在结构和定价有直接影响:数据平台所有者原则上可以利用定价策略优化参与度,并通过内部化大量数据实现盈利网络外部性。
与其他市场设计相比,多边市场可能实现规模经济、范围经济、创新经济、互补性经济、交易经济和搜索经济。原则上,由于高交易量、资源分配效率和稳定匹配,此类数字平台可以通过提高市场效率使数据卖家和买家从规模效应中获益。大量数据抵消了元数据的固定成本。由于这种规模经济和网络效应,可能会出现赢家通吃的动态,即针对特定类别的数据只会出现一个或几个数据平台。
然而,尽管数字技术可以降低直接交易成本,促进稳定匹配,但战略行为可能会带来重大治理问题。数据供应商可能不会如实披露数据的来源和质量,而逆向选择可能会导致劣质数据充斥市场。数据购买者可能不遵守使用和访问限制,降低数据的价值、机密性和安全性。没有关系契约的情况下,在多边平台上设计技术或契约系统来激励和执行参与者的适当行为极为困难。实现市场厚度可能非常具有挑战性。
因此,目前还没有可持续多边数据平台的运行实例。可观察的繁荣的多边数据市场的唯一例子是暗网。然而,目前仍有人试图创造合法的替代方案。
表2总结了Roth对四种数据市场设计原则的讨论。双边市场的流动性较低,但其他三种设计有望达到市场厚度。双边市场交易成本高昂,但有望在来源和防止不良交易方面提供更大的安全性,减少参与者的战略行为。其他市场设计会受到有限的安全性的影响,即缺乏来源和可专有性,受到参与者战略行为的阻碍。然而,如果明确的来源与限制数据购买者战略行为的监管框架相结合,多对一的收集市场可能相对安全。然而,这种监管机制很难在分散或多边市场中实施和执行。
因此,目前可用的市场机制似乎有(1)可以实现控制较少的大型市场或(2)控制更大的小型市场。然而,当专有性不是一个关键问题时,多对一或一对多市场可能运行良好,而无需在交易后对数据进行严格保护。什么样的治理安排能够使多边平台适应商业大规模数据交易还未从得知。
4. 未来研究方向
根据目前可用的市场机制,有可能实现大型但不安全的市场,或小型且稍安全的市场。
鉴于难以确保数据的质量和可专有性,若无额外的治理创新来加强各方的数据来源,大型多边数据平台难以实现。拥有众多数据供应商和买家的通用数字市场将无法监控和实施使用限制,这意味着参与者将能够通过在平台外进行双边交易或与未经授权的第三方共享数据等行为,从战略上影响同行的行为或估值。当合同高度不完整时,可以通过反复互动和建立信任,通过关系治理来防止市场失灵。或者,做市商可能会尝试使用“智能合约”等复杂技术编写更完整的合约,减少数据交易中的战略行为。
未来研究可考虑评估改善来源的技术解决方案,例如分布式账本技术(DLTs)。DLT是分布式数据库,可以自动跟踪交易网络中的交易,并提供不可变的来源记录,促进数据质量评估。此外,DLT将使交易能够由市场参与者集体直接执行和验证,无需中介机构。原产地证明将被分散和自动化,有可能允许更大的市场和更大的控制。然而,DLT并不能完全消除战略行为的风险。市场参与者仍有可能将数据从分类账中删除,并与第三方进行双边交易,甚至试图接管用于验证每笔交易合法性的网络共识。虽然这会牺牲追踪、来源和合法性的好处,也会打破市场规则,并可能使违规者面临法律风险,但即使没有交易验证的好处,也可能存在足够有价值的数据类型。例如,如果各方被大量短期利润所吸引,且审计和执行的可能性较低,则支持DLT的数据交易可能无法防止数据泄露。因此,DLT等技术解决方案不会完全消除市场参与者的战略行为,但为潜在可行的多边数据市场设计指明了方向。
另一方向是市场设计,涉及共同管理和共享数据的参与者。与数据作为公共资源的概念相呼应,这些数据收集机构可能会通过详细审查采用严格的边界,通过合同和细则建立明确规则,有程序集体更改它们,并通过大量的审计来进行有效的监控和执行,以实现数据交易。虽然在这种资源集体中存在着显性契约的某些方面,但在很大程度上,强制执行依赖于隐性关系契约中嵌入的“未来阴影”。然而,在多边环境下,搭便车问题可能会加剧。
还有一些新兴的混合设计融合了集体和双边设计的元素。例如ID Analytics公司提供欺诈和信用风险评估以及其他风险管理解决方案,以交换客户数据。真正的多边数据集合和数据中介之间的区别在于,前者允许用户直接检索彼此的数据,而中介在重新打包并将其提供给其他客户之前收集和处理所有客户数据。然而,这些多边数据集合不一定容易建立,进一步研究它们的动态和演变将是有益的。
未来研究还可以探索数据集合模型的具体治理安排。一些新兴金融服务应用建议在集体数据共享安排中采用DLT解决方案。关系契约在一些数据市场中起着重要作用,鉴于目前的理论假设是双边关系,可对关系契约如何在多边环境下运作进行更多研究。具体多边数据市场模型的详细案例研究将说明治理问题如何运作,以及可以结合哪些特征来提高长期生存能力。
数据治理在工业物联网中的发展进路中也存在许多研究机会。如通用电气Predix等平台提供的工业数据表明,出现了孤立的工业数据共享池而非跨行业连接的全球数据网络。当私人工业数据的利益取决于许多可能使用不同技术的不同方持有的互补性私人数据时,如何释放其价值值得思考。这是一个典型的反公地悲剧,换句话说,由于过度私有化,社会上的信息可用性处于次优状态。当数据的价值巨大,参与者的数据之间存在显著的互补性,且集体成员拥有高度一致且合理稳定的利益时,数据集体有可能充分解决此类治理问题。然而,这种数据共享安排更有可能在特定的、狭义的环境中涉及有限数量的合作伙伴。
最后一个重要问题是如何构建市场。数据集合的概念意味着市场是共同创建和管理的。相比之下,多边市场设计的一般模式涉及建立和运营市场的平台领导者。一种提案是“个人数据银行”,其中一个集中组织的“个人数据管理服务”使消费者能够通过提供安全可靠的空间来利用其个人数据。从业者正在考虑个人数据的收获市场模型的替代方案。例如,让每一用户选择数据存储在哪里,哪些特定的人和组可以访问选定的元素,以及哪些应用程序可以使用它们。因此,数据市场可能由专门的平台提供,该平台支持但不参与数据交易本身。每种模式的优缺点尚不清楚。更广泛地说,数据交易的挑战可能是更广泛经济中向平台和生态系统转变的一些基础。由于平台和生态系统是通过模块化实现的新的协调方式,它们可以通过价格以外的方式促进信息和数据交换。数据、平台和隐私之间的相互作用是受GDPR等法规影响的动态,也可能对市场结构和竞争产生重大影响。这些法规的执行对各国的竞争主管部门至关重要,以适应新的技术和市场条件。考虑到数据交换在平台生态系统设计、运营和竞争中的作用,还有很多研究要做。
5. 结论
数据市场的法律和监管环境正在迅速演变。数据所有权的概念争议仍存。针对各种数据丑闻,《金融时报》称关键部分在于让消费者拥有自己的个人数据。法律学者和数据治理专家认为,数据所有权无法解决数据经济带来的社会和经济挑战。由于数据市场的基本问题仍在讨论中,任何市场设计的可行性都可能在不久的将来发生巨大变化。本文分析则表明,数据的来源和专有权问题对于任何一个市场的运作都至关重要。
(完)
往期文章:
数据权属与数据治理之争 如何设计数据交易市场?(上) 如何实现大数据价值?(下) 如何实现大数据价值?(上) 政策制定者应密切关注数据治理(下) 政策制定者应密切关注数据治理(上) 当讨论数据所有权时,我们到底在讨论什么? 没有人拥有数据?(下) 没有人拥有数据(上) 数据所有权:问题盘点与总结(上) 数据所有权:问题盘点与总结(下)
请扫描二维码获取该系列文章中英文原文: