查看原文
其他

研究速递|数据和市场

图灵财经 图灵财经
2024-09-16

点击蓝字 关注我们


研究速递

Data and Markets

数据和市场

作者:

Maryam Farboodi and Laura Veldkamp

来源:Annual Review of Economics

年份:2022


摘要:

大数据正在改变经济和金融的每一个角落。美国经济中最大的公司主要因其数据而受到重视。然而,这些数据在很大程度上被排除在宏观经济和金融研究之外。我们回顾了衡量经济活动、市场力量、数据市场以及数据在金融市场中的作用的工作和相关工具。我们还强调了未来需要开展工作的领域。

关键词 大数据、数据经济、数据市场、数据反馈回路、数据估值、金融数据


1.什么是大数据?

大数据指的是大量数据(通常来自多个来源),以及收集、存储和处理这些数据的能力,从而产生有关个人客户的新型观察、测量和预测结果。NIST(美国国家标准与技术研究院)将大数据定义为 "大数据由大量数据集组成--主要体现在数量、速度、种类和/或可变性方面--这些数据集需要一个可扩展的架构来进行高效存储、操作和分析"。重要的是,大数据不仅指快速增长的数字化数据集,还指处理、分析和管理这些数据集所需的伴随而来的技术创新。

公司通过大数据了解到的信息可用于设计产品和服务,为消费者个人提供更多价值,并/或使消费者能够更有效地找到自己想要的产品。同时,在缺乏充分竞争的情况下,卖方能够更好地预测消费者的支付意愿,可能会导致价格歧视,减少消费者剩余。另外,当企业收集大量有关消费者行为的数据时,消费者可能会认为自己的隐私受到侵犯。

2. 在数据经济中衡量GDP

数据经济的兴起给经济活动的计量带来了新的挑战。大量在线活动所产生的消费者盈余是没有定价的。在质量调整中,通常不会考虑节省时间的便利性。最重要的是,许多实物商品和服务的价格可能低于其消费价值,因为它们的部分费用是用数据支付的。

在每笔交易中,都出售了一件商品,以换取货币付款和数据。在每笔交易中,有价值的数据都从买方转移到卖方。部分易货贸易是指提供一种商品或服务,以换取货币付款和另一种有价值的资产。因此,现代经济中几乎每一笔交易都是部分易货贸易。这一观点对衡量具有巨大影响,因为它意味着商品和服务的价格并不能反映其价值。价格不再是消费者的支付意愿。消费者购买商品和服务需要支付费用和数据。当我们用商品和服务的数量乘以价格来衡量总体活动时,我们系统性地低估了它们的价值,因为我们忽略了交易中数据易货部分的价值。对于某些特定的交易来说,这可能只是一个很小的误差。然而,对收集客户数据并将其货币化的公司价值的巨大估价表明,所有这些数据交易的总价值一点也不小。

但是,如何根据这种数据易货贸易来修正 GDP 或公司估值呢?一种方法是调查消费者对数字商品的支付意愿。例如,Allcott 等人(2020 年)询问人们,如果放弃访问 Facebook 四个星期,需要支付多少钱。与赋予 Facebook 服务零 GDP 权重(对应其货币价格为零)相比,这种方法有了很大改进。然而,即使是这种调查方法,也可能无法完全捕捉到以个人数据为交换条件的 Facebook 价值部分。

3.数据隐私

虽然数据具有经济价值,但其使用方式也可能侵犯消费者隐私。最近的研究探讨了让消费者更直接地控制分享他们在经济交易中产生的数据,还是允许他们要求分享数据的直接补偿。交易数据的所有权是一个重要的辩论话题,也是近期一些数据法规的核心,如加利福尼亚州颁布的《加州消费者隐私法案》(CCPA)和欧盟颁布的《全球数据保护条例》(GDPR)。

关于隐私问题对消费者网络行为影响的经验证据并不明确。一方面,Goldfarb 和 Tucker(2011 年)利用对 2,892 个不同网络广告活动的大规模随机现场实验数据,探讨了影响网络广告效果的因素。他们发现,将广告与网站内容相匹配以及增加广告的妨害性都能独立地提高购买意向。但是,这两种策略结合在一起效果不佳,而且对隐私偏好最高的人的负面影响最大。另一方面,最新的实证研究证明了 "隐私悖论",即一个人打算如何保护自己的网络隐私与他们的实际网络行为--以及他们如何不保护自己的网络信息--之间的对立。Chen 等人(2021 年)将支付宝针对用户对支付宝小程序数据共享的担忧所做的调查结果与用户在调查前后对小程序的实际访问和授权数据共享活动相结合。他们没有发现不同隐私关切程度的用户在数据共享授权数量上有任何统计上的显著差异。

4.不断增加的回报和市场力量

4.1. 数据反馈回路

与其他形式的信息一样,数据也有规模回报。这意味着大公司比小公司能从同样的数据中获取更多价值。大公司可以利用一个数据集接触许多客户、优化许多部门或调整许多产品。

数据反馈回路可概括为三个直观的等式。第一个等式是最简单的生产经济形式,即 AK 模型,在该模型中,产出的生产率水平为 At,资本为 Kt:

第二个方程式将一家公司已经拥有的数据与其生产率联系起来:

第三个方程式,当人们生产和销售商品时,就会产生新的数据。这个新数据被添加到现有数据的库存中,现有数据以δ的速度贬值:

参数 z 将销售量 Yt 的单位数缩放为正确的数据量。这种简单的结构被嵌入到 Farboodi 和 Veldkamp(2022 年)以及 Jones 和 Tonetti(2020 年)的更丰富的动态模型中。

这个简单得令人难以置信的三方程模型足以产生超级明星企业。开始时规模稍大的公司在第一阶段会产生更多数据。这样,相对于规模较小的公司,该公司就能更快地成长,产生更多的额外数据,走上不同的成长道路。


4.2 超级明星企业

Mitchell and Brynjolfsson (2017)认为,数据和数据技术是解释超级明星企业现象的最重要因素。为了将这一观点正式化,Benzell 和 Brynjolfsson(2019 年)建立了一个模型,以解释为什么大多数工人和资本所有者没有从数字化中获益,而少数超级明星公司却从中获益。这些公司拥有大部分数据,并从不断增长的回报中获益。


4.3 数据与市场竞争

数据的竞争效应可能难以发现或揭示,原因之一是数据会同时影响企业的三个方面:i) 规模、ii) 效率和 iii) 风险。通过对数据反馈回路的讨论,我们知道,数据可以促使企业做大,而做大的企业可以产生更多的数据。这样的大公司可能有能力以损害消费者剩余的方式扭曲市场。Goldfarb 和 Tucker(2019 年)的一篇评论文章探讨了第二个方面,即效率。文章详细介绍了数据帮助企业优化业务流程的方式。这种优化有助于企业提高效率,降低成本,这可能表现为更高的标价,但不会损害消费者利益。数据的第三部分影响,风险降低,可能是最少的。

5.数据市场

拥有大量交易的大型企业(如数字平台)在数据生产方面具有比较优势,它们可以在内部使用这些数据或将其出售给其他企业,从而在企业间形成了一个活跃的数据市场,即企业间数据市场。在这个市场中,两个关键特征使数据不同于其他无形资产,甚至是那些是生产的副产品,如干中学。首先,数据是可交易的。第二个数据是非排他性的(或非竞争对手)。

第二个潜在的数据市场是企业与消费者之间的市场,即消费者-企业数据市场。许多论文利用以买方、卖方和中介为特征的框架对这一市场进行了研究。在平台企业方面,消费者数据会给中介带来信息优势,损害卖方的外部选择权。在消费者方面,特定消费者的数据可被用来对他和/或其他消费者进行价格歧视,使用个性化定价。

6. 财务数据

大数据和大数据技术对金融业的渗透超过了大多数行业。据 Kolanovic 和 Krishnamachari(2017 年)估计,投资管理行业在大数据方面的支出在 20 亿至 30 亿美元之间,且每年呈两位数增长。金融大数据最重要的用途之一是预测收益和风险。投资者利用数据降低资产收益的不确定性,相应调整投资组合的持有量,提高收益。

大数据技术的增长。当数据技术得到改进时,投资者不仅会处理更多相同类型的数据,还会寻找新的数据类型。当数据变得更加丰富时,与其他知情的投资者竞争的价值就会下降,但寻找不知情的交易(“愚蠢的钱”)的价值却会增加。

收入不平等。关于收入不平等加剧的文献很多。收入不平等加剧的一部分原因是金融收入的增长。富裕的投资者可能获得更高的金融回报,原因之一是更富裕的投资者可能获得更多的数据(Peress,2009;Kacperczyk 等人,2019)。当然,克服这一劣势的方法之一是小投资者联合起来共同获取数据。这就是共同基金的本质。另一部分文献侧重于劳动收入不平等,Abis 和 Veldkamp(2020 年)使用职位发布和工资数据来跟踪金融管理公司对拥有和不拥有新数据技能的金融分析师的聘用情况。他们发现,人工智能和机器学习降低了金融收入中的劳动份额。

数据驱动的信用分析。客户分析也被积极地用于抵押贷款的发放和信贷扩展。信贷大数据可带来更多的金融包容性。金融科技有望通过两种方式将金融服务扩展到更广泛的客户群体:首先,数据可用性和数据处理技术的改进使传统上被排除在外的客户也能获得信贷服务。其次,完全基于客户金融活动的算法分析有朝一日可能会提供不分种族、性取向或性别的平等待遇。

开放式银行。银行内的客户交易为特定机构提供了宝贵的数据,从而使其在定价、营销和定制金融服务方面具有相对优势。为了让客户从其金融交易产生的数据中获得更多利益,并促进传统银行与金融科技公司之间的竞争,全球多国政府发起了一项名为 "开放银行 "的倡议。

7. 数据评估

数据估值已被证明是一项艰巨的任务。原因之一是严重缺乏公开的分类数据。

对金融数据进行估值的工作大多建立在旨在探索金融市场信息不对称的框架之上。目前论文都侧重于为具有代表性的投资者进行数据估值。然而,数据估值如此具有挑战性的一个原因是,数据对不同投资者的价值不同,这取决于他们将如何使用数据。换句话说,数据有很大的私人价值成分。这使得数据与许多消费品相似,但又与典型的金融资产截然不同。Peress (2004)开始研究对信息的异质需求;他考虑了不同财富水平的投资者对信息获取的选择,发现大投资者对信息的需求更高。Farboodi 等人(2022b)增加了更多的异质性程度,提出了充分的计量统计方法,并对数据值进行了量化。他们发现,不同特征的投资者对相同数据的估值相差很多数量级。


如何获取论文?

关注本公众号:图灵财经


来源:Annual Review of Economics

编辑:张丽(国科大经管学院研究生)


精彩推荐


经典重温:将数据作为资产进行价值评估

经典重温:数据经济中的知识积累、隐私和增长

经典重温|人工智能和数据网络效应对创造用户价值的作用

孙毅专访|解读“数据要素×”三年行动计划:三方面重点发力,释放数据要素乘数效应

2023年中国数据交易市场研究分析报告


更多精彩内容



继续滑动看下一个
图灵财经
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存