查看原文
其他

【数据法学】Catarina Arnaut等:欧洲经济区内公司之间数据再利用

Catarina Arnaut 大数据和人工智能法律研究 2022-11-09

B D A I L C 

 欢 迎 关 注 


江寒汀、张大壮、陆抑非、张守成、唐云




欧洲经济区内公司之间数据再利用

文 / Catarina Arnaut, Marta Pont, Elizabeth Scaria, Arnaud Berghmans, Sophie Leconte

译 / 徐慧碧 殷忠鸿



1.再利用其他公司数据的原因

在过去的六年里,百分之五十多一点的受调查公司都曾经将其它公司的数据再利用。下面的数据展示了根据再利用其它公司的数据年限,数据使用公司再利用数据的一个分布情况统计。

图36. 根据再利用其它公司的数据年限,数据使用公司再利用数据的分布情况统计

 

像很多数据提供者一样,很多再利用其它公司数据的公司的目的在于探索发展新产品或服务的可能性,提升完善产品或服务的清单,或者是提高公司的效益。下面这个表格呈现了一个从其它公司获得数据的数据使用者的动机的概况:

 

数据再利用的原因

受访者的数量

%

探索发展新产品或服务的可能性

32

59%

帮助自己公司提升完善产品或服务的清单

31

57%

使得自己的公司效率更高

21

39%

提升自己公司和客户之间的关系

17

31%

进一步优化公司的内部发展

9

17%

使得公司能够制定更加有目标的市场活动

7

13%

表格7.公司数据再利用的动机(一个公司能够有三种选项)

 

尽管很多欧洲经济区(EEA)内的数据使用者获得其他公司的数据有一定时间了,但是这些数据使用者依然面临着诸多障碍。百分之五十九的数据使用者宣称当他们尝试获取其他公司数据时会遇到障碍。三分之二的数据使用者表示被拒绝访问数据时他们所面临的主要问题。[1]




2.数据再利用的特点

与数据分享的研究发现相一致的是,两种最为一般的受调查公司的数据再利用形式为:由物联网和物理装置(包括传感器和移动电话)(59%),以及由内部电子技术商业系统产生数据(主要包括有关产品、服务、销售、物流、消费者、合伙人和供应者的信息)(50%)。在各种数据类型中,最为一般化再利用的数据特征是实时或者接近实时的数据(59%)、交互数据(30%)以及定位/位置数据(30%)。下图中的统计数据展示了受调查公司最为常用的再利用数据的类型和特征。

图37.数据再利用的类型(一个公司能够选择两个选项)

图38. 数据再利用的特点(一个公司能够选择两个选项)

 

超过60%的受访数据使用者能够在每年里访问100GB的数据。下图显示数据使用者从其他公司获取数据的容量的分布情况。

 

图39. 数据使用者从其他公司获取数据的容量的分布情况

 

和早前的发现相一致的是,应用界面接口(APIs)是最普遍的访问其他公司数据的技术途径(74%)。除此之外,许多公司使用文件交互协议、在线数据资源库/门户(48%)和私人应用客户端来作为访问其他公司数据的技术途径。下图展现了数据使用者获取其他公司数据的技术途径。

 

图40. 数据使用者获取其他公司数据的技术途径(一个公司能够选择两个选项)




3.数据再利用的情况

数据用户访问其他公司数据的各种条件分布均衡。数据一般都是免费的、无需报酬的或者是通过服务条款进行补偿的。下面的表格对于通过访问其他公司数据的数据使用者的分布情况进行了统计展示。

 

公司访问数据的情况

受访者的数量

%

大范围的免费用户并且没有或极少的限制(数据开放)

17

31%

通过进行个别谈判的排他使用并给付报酬

13

24%

特殊一部门用户免费并且没有或极少的限制

12

22%

基于个别情况协商的、针对特殊范围内的人员并给付报酬

12

22%

对于大范围内的用户进行正式的无差别的给付报酬

11

20%

进行个人协商并通过服务条款进行补偿

10

19%

表格8. 公司访问数据的情况(一个公司能够选择两个选项)




4.数据再利用的平均年度花费

在过去的三个财年中,超过40%的数据使用者在访问其他公司数据上的花费,平均每年在50万欧元之上。相反地,在同一时间段里,相似比例(39%)的数据使用者在访问其他公司数据的花费上仅仅为每年5000欧元。下图展现了过去三个财年里数据使用者访问获取其他公司数据的花费分布情况统计。

图41. 过去三个财年里数据使用者访问获取其他公司数据的花费分布情况统计[2]




5.没有参与B2B数据再利用的公司

超过129名受访者中,58%的公司并没有再利用其他公司的数据。最通常的对于没有参与B2B数据再利用的公司的原因有以下几种情况:所有相关数据都在内部产生(41%),公司商业模式中无需用到数据(39%)以及无法获得对于实现公司目标所需要的、要求的数据(32%)。其他原因将会在下表中呈现。

 

公司访问数据的情况

受访的数量

%

内部产生所需要的数据

31

41%

商业模式之中无需数据

29

39%

所需数据无法获得

14

32%

安全、安全保障和责任因素

17

23%

经济花销(例如费用、数据分析、数据保护)

14

19%

对于数据的使用权和所有权不明确

8

11%

缺乏适用数据的专业知识

8

11%

图9. 没有再利用数据的原因(有的公司能够选择三个选项)

 

在过去从未再利用数据的公司中,有40%的公司看到了未来五年内参与B2B数据再利用的可能性。下图展现了受访公司在未来成为数据使用者的可能性。

图42. 未来五年内参与B2B数据再利用的公司的可能性分布

 

将近一半的当前没有再利用其他公司数据的公司(47%)看到了未来参与B2B数据共享的潜在收益。数据再利用的可预期收益包括有:促进产品或者服务的发展(74%),提升公司与客户之间的关系(43%),提升完善公司产品清单(43%)和行销努力(37%),增加生产效率(34%)和降低成本(11%)。

 

收益

受访的数量

%

促进产品或者服务的发展

26

74%

提升完善公司产品或服务清单

15

43%

提升公司与客户之间的关系

15

43%

提升市场营销的努力

13

37%

增加公司生产力或效率

12

34%

降低公司成本

4

11%

表格10. 数据再利用的利益(一个公司可能选三项)

 

已经在数据再利用方面获得收益的公司中,不同类型的公司对于数据访问所产生的兴趣有所不同。IT(46%)、制造和加工业(43%)表示在未来对于数据再利用有着浓厚的兴趣。下图表现出对于数据再利用感兴趣不同类型[3]的企业的情况。

图43. 不同行业对于参与B2B数据再利用的意愿情况(一个公司能够符合五个方面)




6.欧洲经济区内因未参与B2B数据分享而错失的商业机会

在这项研究的框架内,错失的商业机会被理解为由于不可能从其他公司获取数据而无法创新或改进公司的产品或服务。该概念的简化表示在下文中介绍。


图44.错失的商业机会概念的简化表示


为了估计由于缺乏从其他公司获取相关数据而导致错过的商业机会,此次调查使用了一个统计模型。这一模型主要通过调查收集的数据和信息(详细描述模型可在附件1中找到)。这个模型是根据一般假设建立的数据用户(即公司再利用来自其他公司的数据)更有可能为公司带来更多新的或改进的产品或服务,而非再利用其他公司的数据。反过来,通过使用受访者的人口统计特征、与数据再利用有关的方面(例如,获取数据的支出,重复使用的数据量)以及少数宏观经济指标(如国内生产总值),预测公司推向市场的新的或改进的数量产品或服务。该模型不考虑其他因素公司比如公司的研发支出或者产品的生命周期。

选择广义线性模型[4]来预测每年公司向市场推出的新的或改进的产品和/或服务的数量。其中一个建立线性模型的目标是将各种因素的影响分离出来,并量化数据再利用的实际影响。该模型可以分离数据再利用的影响和另一个选定变量对提供给市场的新产品或改进产品和/或服务数量的影响。

从所测试的15个变量(完整列表可在附件1中找到)中,证明了五个变量对公司可以向市场投放新产品、改进产品或服务的数量产生了积极影响,即:对数据重复使用的支出、访问实时或定位/定位数据会产生的不同的影响、公司规模、公司的生命周期[5]、该公司在国外的存在[6]。下图显示了在预测提供给市场的新产品和/或改进产品和/或服务数量方面在统计上极具重要性的变量。

 

图45. 广义线性模型来预测推向市场的新产品或改进产品和/或服务的数量


根据线性模型的结果,有可能推断出投入大量资金用于实时或本地化/定位数据,可以对公司投入市场的新产品和/或改进产品和/或服务的数量产生重大影响。

更具体地说,该模型表明,只有当从其他公司获取数据的投资高于某个阈值时才会产生这种影响。在调查中,查明了其他公司持有的重复使用数据的九年平均年度投资范围。[7]这些范围是基于以前的研究结果[8]而建立的,旨在为公司提供他们在数据重复使用方面支出的指示性数字。在分析中,结果被汇总为三个范围,以便收集这些范围中的数据,从而足以做出更精确的估计。[9]因此,下面讨论的新阈值应该被解释为迹象,而不是真正的截点。还区分了获得实时或本地化/定位数据与其他类型数据。从调查结果来看,每年投资高达5万欧元用于获取其他公司的数据的花费,并未对公司投入市场的新产品或改进产品和/或服务的数量产生重大影响。在过去三个财政年度每年花费5万至100万欧元的公司,有可能确定投入市场的新产品或改进产品和/或服务数量增加的正相关性,达到了系数7.5,但这发生在只有在实时或本地化/定位数据被访问时。对于每年投资5万至100万欧元但未获得实时或本地化/定位数据的公司,对市场上新产品或改进产品和/或服务数量的影响并不显著。

值得注意的是,在过去三个财政年度中,每年花费超过一百万欧元并且访问实时或本地化/定位数据的公司,对新的或者改进的产品和/或服务推向市场的影响甚至更高(16.6倍)。

下图显示了数据再利用和实时或本地化/定位数据访问的支出如何影响投入市场的新产品或改进产品和/或服务的数量。所有完成调查的公司都报告从其他公司获取再利用实时和/或定位数据的公司的数据已花费了超过100万欧元。对于数据再利用超过100万欧元的公司(实时或定位数据除外),下图未显示任何结论,因为没有一个受访者属于此类别。

图46.支出对重复使用数据、获得实时或本地化/定位数据的数据影响,对于提供给市场的新产品或改进产品和/或服务数量的影响

 

如上所述,该模型还能够识别公司为市场带来的新产品或改进产品和/或服务的数量产生积极影响的其他变量,其中包括:

  • 公司规模:公司规模对公司能够为市场带来的新产品或改进产品和/或服务的数量产生重大影响。特别是与微型或小型公司相比,中型企业平均可以为市场带来2.6倍以上的新产品或改进的产品和/或服务。同样,与微型或小型公司相比,大型公司平均可以为市场带来3.4倍的新产品和/或改进产品和/或服务。

图47.公司规模对提供给市场的新产品或改进产品和/或服务数量的影响

 

  • 公司年龄:公司的生命周期似乎也对公司可能带入市场的新产品或改进产品和/或服务的数量产生了积极影响。

  • 在国外的存在:在一个以上的国家运营并重新使用其他公司的数据的公司似乎能够为市场带来更多新的或改进的产品和/或服务。

 

尽管需要谨慎解读这一分析的结果,但可以提出一些结论性意见。从其他公司获取数据没有超过5万欧元的公司,尤其是实时数据或本地化/定位数据似乎失去了商机。在参与调查的129家公司中,有108家公司因此失去了商机。另一方面,20家公司由于正在投入的超过5万欧元从其他公司获取实时或本地化/定位数据,来增加其商业机会。下图显示了由于缺乏从其他公司访问实时或本地化/定位数据的大量投资而错失商机的公司数量。最后,通过投资超过5万欧元从其他公司获得实时或本地化/定位数据,在多个国家运营数年具有一定规模的公司(特别是中型或大型公司)可获得更高的回报。

图48.错失商机的公司数量



参考文献

(请向下滑动)


[1]针对数据再利用的障碍详见第六章

[2]数据总和为99%,有1%的受访公司并没有提供其访问获取其他公司数据的花费情况。

[3]尽管在调查问卷中分了18个部分,但是只对回复达到平均率或者高于20%的进行了统计。

[4]Hardin, J.W. and J. M. Hilbe (2007), Generalized Linear Model and Extensions, Second Edition. Stata Press.

[5]公司自成立以来经营的年数。

[6]公司在公司总部所在国以外的其他国家经营。

[7]所使用的范围指最近三个财政年度,可在附件2的问卷中找到。

[8]IDC和“欧盟数据景观公开证据”的研究,同前。他们发现,2016年中小型企业平均花费27,000欧元从其他公司获得数据,而拥有250名雇员和更多员工的大型公司则花费了600万欧元,整个公司的总体平均支出为91,000欧元。

[9]汇总的范围是:高达50000欧元,5万欧元到100万欧元之间,超过100万欧元。




本文仅作学习交流之用

吴作人




往期荐读




编辑:钟柳依


欢迎点击“阅读原文”

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存