查看原文
其他

我们是否应该把数据当作劳动来对待?

课题组成员 图灵财经
2024-09-16

Should We Treat Data as Labor? Moving beyond “Free”

作者:Imanol Arrieta-Ibarra、Leonard Goff、Diego Jiménez-Hernández

来源:AEA Papers and Proceedings


免费数据的高成本

数字经济或许是当今创新的主导力量,为用户带来了海量的盈余( Brynjolffson , Eggers和Gannamaneni 2017),对用户来说是"免费"的(在使用点)。尽管有这些好处,大众的焦虑和反弹却在上升。

最普遍关注的是就业和收入分配问题。许多人担心人工智能( AI )系统会取代工人。经济学家正确地回应说,过去更大的技术破坏在引起就业转移的同时,在很大程度上使劳动收入份额保持不变甚至增长( Autor 2015 )。然而,最近劳动收入份额的长期下降证明了它的普遍稳定性。

此外,Facebook、谷歌、微软等公司的市值和附加值与沃尔玛等公司相似或更高,但雇佣的工人却少1 ~ 2个数量级,我们最初试图从公开统计数据中估算这些公司的劳动收入份额,表明它们只占传统平均水平的60 % ~ 70 %。这些公司所代表的"未来"将验证皮凯蒂( 2013 )关于高资本份额的预言。

同时,缺乏对用户数据的支付可能会拖累人工智能对生产率增长的贡献。尽管人们对AI进行了广泛的炒作,但迄今为止,AI对生产力的贡献似乎是有限的。一个潜在的解释涉及数据的作用。第一代人工智能系统在很大程度上未能实现其目标,因为它们过于依赖硬编码。新一代的人工智能使用称为"机器学习" ( ML )的统计方法,它们适应人类执行类似任务( "大数据")的例子中的模式。然而,自由数据模型使得与生产率相关的数据比面向消费的数据的可获得性低得多。尽管存在潜力,但在实践中,大多数人工智能都是针对广告的,而不是生产力的提高。期望获得补偿的工人是生产率相关任务的主要执行者,而这些任务往往发生在不愿意将其专有内部资料免费交给人工智能公司的企业内部。更广泛地说,许多人工智能系统依赖于人类的积极参与来生成相关数据。这包括用户授予访问在消费体验过程中自然产生的数据的权限,通过用户在使用这些系统时提供翻译的实例或对人工智能生成的翻译的反馈。


资本还是劳动?

我们认为,造成这些问题的当前数据政治经济学的关键方面是将数据视为资本而非劳动。虽然似乎资产要么是一个,要么是另一个,但对这些类别的资产的社会态度的变化具有历史意义。封建主义,特别是奴隶制把(主要是农业的)工作当作主人或领主的占有,而自由主义和劳工改革则把承认及其边际经济产品赋予劳动。为了解释我们的目标,我们将目前在"数据即资本" ( DaC )范式下对数据的几种态度与我们将数据视为劳动( DaL )的世界中对数据的几种态度进行对比。

DaC将数据视为企业从消费中收集的废气,而DaL则将其视为应主要使其所有者受益的用户资产。DaC将收益从数据渠道输送到人工智能公司和平台,鼓励创业和创新;DaL将收益从数据渠道输送到个人用户,鼓励提高数据的质量和数量。DaC通过支持UBI或为人类保留人工智能将失败的工作领域,为人工智能取代工人做准备,而DaL则将ML视为提高劳动生产率和创造一类新的"数据工作"的另一种生产技术。


数据是怎么到这儿的?

如果单纯地把数据当作资本来处理,在经济和社会上都是不合理的,那么我们又是如何在现在的均衡状态中结束的呢?正如在十九世纪的劳工斗争中,通常的罪魁祸首是偏见(即历史意外事件产生的先例的权重)和特权(即从无效率均衡中获得租金的根深蒂固的利益)的结合。在目前的环境下,用户对"轻量级"在线体验的期望与科技巨头(我们其中一个人所说的"警报器服务器")的垄断势力合谋维持现状。

互联网经济在很大程度上始于风险资本助长的泡沫,追逐使用而对商业模式没有意义。"自由软件"的社会运动与硅谷的反文化运动相碰撞,宣称"信息想要自由",并建立了用户对数字服务的期望。谷歌( Google )和脸书( Facebook )在寻找将这一活动货币化的方法时,转向了利用用户数据进行定向广告。这种习惯于用户交出数据以换取免费服务(卡拉斯卡尔等2013),随着此类数据的价值持续到更广泛的AI服务的期望已经上升。很少有用户甚至意识到他们的数据的生产价值或他们在实现ML中扮演的角色。

最近的证据表明在线任务市场中存在显著的垄断势力。Dube et al . ( 2018 )在亚马逊土耳其机器人上使用随机变化的工资来发现面对远低于单位的任务-招贴时劳动供给曲线的弹性。这些小的任务发布者几乎肯定比警笛服务者拥有更多的弹性剩余劳动力供给,这意味着后者拥有极端的垄断力量。在正在进行的工作中,使用一个大型的微软程序来支付用户对Bing搜索的忠诚点,我们估计在程序的活跃用户中执行的搜索数量的弹性更小。这强化了垄断可能是阻碍DaL潜在生产率收益的重要力量的观点。


一个激进的数据市场

最终,我们相信所有这三个因素都必须协调才能使DaL取得成功,就像在历史工人运动中一样。然而,不管是哪种组合,为数据劳动力建立市场为经济学家提供了一个令人兴奋的机会,可以在比以往大多数市场设计工作更广泛的规模上设计市场( Roth 2015 )。例如,我们目前正在努力使用数据点边际价值的正则化措施来设计和为数据工作者提供透明有效的支付。有研究预测,未来数十年人工智能可能会使多达50 %的工作岗位自动化( (弗雷和奥斯本2017) ),数据劳动有可能构成国民收入的一大部分。


如何获取文献?

关注本公众号:图灵财经


来源:AEA Papers and Proceedings

导读:课题组成员


精彩推荐


独家盘点 | 2022年数字经济大事记

权威快报丨中共中央国务院“数据二十条”解读(附全文)

腾讯研究院:2023年十大数字科技前沿应用趋势

行业报告|埃森哲:三步打造数据驱动型企业

2023全球数字科技发展研究报告:全球科研实力对比


更多精彩内容


继续滑动看下一个
图灵财经
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存