学术前沿 | 机器学习如何改变劳动力市场?
介绍
尤其是在过去十年中,称为机器学习(ML)的AI分支取得了卓越的成绩,这在很大程度上反映了深度学习领域的进步,该技术可以在大型数据集上训练大型神经网络(Brynjolfsson&Mitchell,2017)。三种不同的进步结合在一起(大约两个数量级),使它成为可能:1)数字数据中质与量的提高;2)计算能力的改善,这不仅反映摩尔定律的发展,还反映了诸如GPU和TPU之类的新专业架构;3)算法的改进(McAfee&Brynjolfsson, 2017),即机器学习算法的性能大大提高。在一个被高度引用的例子中,ImageNet数据集上的图像识别算法从2010年的70%改善到如今的97%以上,而如今在相同数据上超越了人类的性能。声音识别和自然语言处理、机器翻译、推荐系统、游戏以及许多其他任务也得到了明显的改善(Shoham et al.,2018)。对于大多数职业而言,由于职业技能,像视听、决策等能力,都是至关重要的,这些技术的进步表明工作性质可能会发生重大的变化。
尽管机器学习取得了卓越的进步,但是它仍然无法胜任人类全部认知任务。这就提出了一些很显而易见的问题,比如——
Q
机器学习可以很好地完成哪些任务,而人类最好完成哪些任务?
Q
不同行业和地区,对工作有什么影响?我们如何量化人类技能对企业不断变化的价值?
本文中,我们试图利用已经开展了数年的研究来说明这些问题。
其次,反过来,我们应用该量表对横跨美国大部分经济体的950个职业中的18112项任务进行评分,通过一个指南,说明随着ML的使用越来越普遍,不同职业、行业和地区可能受到的影响(Brynjolfsson、Mitchell&Rock,2019)。
最后,为了说明不同类型的人力资本,如教育和技能,如何影响企业价值。我们利用来自LinkedIn、Compustat和其他来源的数据来重新量化这些关系。我们的第一组调查发现,尽管现有的机器学习技术,无法自动完成我们所研究职业的全部任务,但它们已经足够先进,可以在几乎每项工作中至少执行某些项目。这表明要充分利用机器学习的潜力,需要进行大量的重新设计工作,并需要进行大量的新技能培训。进一步发现,从事低工资工作的人,将受到与从事零售和运输行业的人一样的影响,而小城市的人比大城市的人更容易受到影响。
投资于重新设计工作可以为公司带来巨大的价值。在第二组调查结果中,我们利用LinkedIn数据,发现技能和教育不仅对获得这些技能的员工很有价值,而且对这些员工所在公司的所有者也具有价值。事实上,近年来,与IT相关的投资价值急剧增长。根据一些上市公司的样本发现,截至2016年底,IT投资的价值约占已安装物业、厂房和设备价值的39%(样本中每家公司的ITIC约为8-9亿美元)。这意味着随着这些技术变得越来越普遍,公司有很大的动机去投资于创建和更新利用新兴IT(最近就是ML)所需的技能。尽管许多技能都会受到影响,但实现ML所需的技能是一个特例:如同Tensorflow等新技术一样,ML的价值在增长,其影响力也在不断提高(Rock,2019a)。把ML付诸实践,所需要的技能和业务流程,以及规模和范围的重新设计意味着,就像早期的技术突破一样,需要数年甚至数十年的时间,才能感受到效果。(Brynjolfsson,Rock和Syverson 2018)。
劳动力市场对机器学习技术的认知
我们应用任务级方法,来认知ML的影响。这是分析特定功能的最自然法则。通过汇总有关任务级别的ML所暴露的详细信息,来加深我们对经济各个方面(包括职业、公司、行业和地区)影响的理解。特别是,可以将职业视为分配给相似类型工人的有用任务包。任务级方法,是将工人的劳动投入与生产功能中的新型技术资本相关联(Autor,Levy&Murnane,2003;Acemoglu&Autor,2011)。管理决策中用资本服务代替人工任务的内在决定是,在支付给工人的工资和完成相同任务机器的资本租赁成本之间进行权衡。
尽管它们通常在短期内是稳定的,但每个职业中的任务集会随着时间而变化,许多任务本身的性质也会发生变化。创建新任务、改变旧任务的价值,改变了给定职业中最具生产力的组合。相关模型(Acemoglu&Restrepo,2018)阐明了自动化技术投资与创建新任务投资之间的权衡。在这些模型中,自动化程度的提高,增加了在创建新的人工任务时创新活动的回报。但是几乎所有情况下,新技术对劳动力需求的影响都取决于简单的人工劳动替代潜力。
由于任何一个给定的职业通常会执行各种各样的任务,因此预测ML对劳动力需求的影响具有挑战性。不可避免地,其中一些任务更适合于机器学习。然而,专注ML对于工人当前完成的任务做些什么,可以深入了解哪些任务最容易接触到技术。Brynjolfsson&Mitchell(2017)、Brynjolfsson、Mitchell&Rock(2018,2019)以及(Brynjolfsson et al.,2019)建立、完善并扩展了一个规则,其旨在确定经济中最适合机器学习的任务(SML)。评估表由23个评估性问题组成,潜在答案范围从1(非常低的SML)到5(非常高的SML)不等。评估准则用于从美国政府的O*net数据库中,为2059项详细的工作活动评分。反过来,这些分数被汇总成950个职业,由18112个任务组成,这些任务在各个职业之间共享详细的工作活动。经过机器学习专家的验证并由麻省理工学院的一个团队评估了一组代表性任务后,被评估者在CrowdFlower上将评价标准扩展到一整套任务,如Brynjolfsson,Mitchell&Rock(2018)所述。Brynjolfsson,Mitchell&Rock(2019)和Brynjolfsson等人进行后续迭代——使用来自Amazon Mechanical Turk受访者的数据进行改进和质量控制。这些设计问题的方式是:“ 1”(完全不同意)对应较低的SML,而“ 5”(强烈同意)对应较高的SML,而中性暴露对应于3分(既不同意也不不反对)。在大多数的分析中,这些个人得分经过任务加权得到总体职业水平SML得分。
接触ML并不一定意味着该职业中人类劳动将被取代甚至减少。正如Brynjolfsson&Mitchell(2017)所讨论的那样,除了替代,机器学习还可以至少以五种方式使用:补充劳动力、通过降低成本来增加对劳动力的需求、通过改变总收入来改变需求、通过改变信息流来改变信息不对称和推动工作重组。虽然这些可能性中的第一个(自动化和替代)得到重视,但研究表明,未来几年最大的影响将是推动工作的重新设计,因为在大多数职业中只有某些任务适合于机器学习,而另一些任务将继续需要人工。
图1显示了SML在作业,任务和活动中的分布。很少,如果有的话,工作完全暴露在ML。任何任务的最大SML值为4.0,所有任务的最小值为2.13。令人惊讶的是,几乎所有职业都有至少一项分数较高SML的任务。
图2显示出了在SML(水平轴)第九十和第五十百分位以上的任务SML的比例(垂直轴)的计数。没有任何职业的任务完全在第90 个(或更高)SML百分位,但是大多数职业至少有一些任务超过此阈值,几乎所有工作都有一些任务超过了50%阈值。如果ML可以完成特定职业中的所有任务,则几乎没有必要或机会重新组织该工作中的任务。这将是完全自动化的。同样,如果ML在该职业中无能为力,则没有理由重新组织该职业以释放ML技术带来的收益。事实上,大多数职业介于这两个极端之间,这凸显了机器学习将推动重新组织和设计,并如何把任务捆绑和分配到职业中的可能性。实际上,Brynjolfsson(2019)强调工作的重新组织,而不是自动化或替代,是劳动力市场上最大ML的经济潜力(见图1和2)。
图1
图2
机器学习对职业的影响在许多不同类型的劳动中共享,但也将是不均衡的。与其他职业相比,某些职业更容易受到ML的侵害。
图4中4A和4B分别显示了按职业类型聚合到区域级别的标准化SML得分和图像数据得分。大城市的SML总体相对得分较低。相比之下,使用ML进行图像分析的潜力更多地集中在大城市。
最后,图5显示了按行业划分的就业加权SML。与教育和医疗保健相比,住宿和食品服务、运输和仓储以及零售贸易相对更容易受到机器学习的重组影响(见图3-5)。图3
图4a
图5
较高的SML任务通常是文书任务,例如平衡账目或医疗记录,或工厂中可能执行的常规工作类型(例如,检查物品是否有缺陷)。大多数职业都有一些做文书工作的组成部分。但是,要利用这项新技术,就需要调整如何一起执行这些任务。这意味着要改变职业,还要改变业务流程。
公司和组织必须建立新的无形资本,以补充机器学习进步所产生的新型技术资本。同时,为旧的经济环境建立的专门技术和隐性知识将失去价值(Greenwood & Yorukoglu ,1997)。这样,机器学习技术带来的变化与许多早期的信息技术类似。现在正发生事情的一部分是对过去的扩展,其特征是网络计算、数据库和其他信息技术的投资热潮。
IT,无形资本和价值
从新兴技术(例如ML技术)释放价值所需的业务流程重组,可以构成公司资产的增长类别(RE Hall 2001;Brynjolfsson&Hitt,2000;Bresnahan,Brynjolfsson&Hitt,2002)。这种“与IT相关的无形资本”(“ ITIC”)是公司为信息处理组织而进行的投资结果,包括对促进快速信息获取、员工学习和决策的业务流程重组进行的投资。这些类型的资产在解释经济增长和公司业绩中可能扮演着越来越重要的角色。在某些方面,这些投资类似于企业在卡车或制造设备等有形资本方面的投资。正如实物资本单位能够将原材料转化为商品一样,信息技术产业也能够使企业将信息和想法转化为产品和服务。
最大的区别在于,这些以IT为基础的无形资产的计量,已被证明难以实现。对于研究人员而言,这种形式的资本的投资基本上是看不见的,而且折旧率是不固定的并且是可变的,因此传统的衡量资本存量的方法不容易应用(BH Hall ,1993)。对于其他类型的资产,可能会使用市场交易(例如租赁价格或转售价格)来得出价格,但没有可观察市场的独立交易ITIC公司,也就无法出售其管理实践或学习文化。
作为衡量这些资产的另一种方法,我们可以使用有关无形资产的文献中的方法,得出美国公司中ITIC的价格和数量的变化。这些文献认为,企业无形资产的数量可以从其证券的价值中推断出来(RE Hall,2001)。这种方法的直觉是,在合理的条件下,公司证券的价值等于其资本资产的价值,而资本资产的价值又等于建设资本的价格乘以其数量,或者等价地说,市场价值与建设资本的比率等于其价格(方程式1)。
由于企业对这些资产的投资受调整成本条件(等式2)支配,因此根据边际调整成本函数以时间t的投资率评估:
因此,我们有两个方程,其中有两个未知数,可以通过求解这些方程来恢复有形或无形资本的数量。换句话说,即使不能直接观察到对资本的投资,也可以使用公司资产价值的变化来计算其数量。在IT方面,没有记录公司ITIC的价值,但是可以使用对相关投入(例如IT基础设施)进行代理投资来推断ITIC的价值(Brynjolfsson,Hitt&Yang ,2002)。我们使用上述方法得出ITIC的数量。
这种方法面临的挑战在于,需要一系列冗长的公司级IT投资数据,而此类历史数据很难在公司级获取。为了解决这个问题,我们生成了一系列IT信息,这是ITIC建设中最重要的投入之一,即IT劳动力,从而能够应用上述方法。
这些数据是从LinkedIn上获取的,个人可以在该网站上发布自己的职业经历,包括他们在雇主所担任的每份工作的信息、职称以及在该公司工作的年限。雇主数据通常包括名称、规模和行业。我们使用LinkedIn的员工的就业历史,以衡量大型上市公司在大约三十年的时间中IT就业的分布情况。
这个劳动序列的长度很重要,有两个原因。首先,它在网络泡沫破灭期间、崩溃之后以及过去十年中一直可用,包括捕获围绕大数据、数据科学和机器学习的支出增长,因此我们可以测试20世纪90年代末与IT相关的无形资产的价值中有多少是由于投资者错误定价或是在该资产的支出恢复时造成的。其次,由于缺乏直接的与IT相关的基础设施支出的措施,支付给IT劳动力的工资是ITIC建设的主要投入之一。换句话说,公司可以围绕旧的IT资本建立新的信息结构,因此与IT资本支出相比,IT工资可能是ITIC投资更相关的投入。
将这些IT劳动力数据应用到先前描述的模型中,主要结果显示在下面的图6中。
首先,到2016年,我们公司小组中与IT相关的无形资本的存量已增长到实物资本存量价值的25%。尽管在互联网繁荣和萧条期间,ITIC的价值出现波动,但公司在萧条之后以及2008年的经济衰退期间,仍继续积累与IT相关的无形资本(见图6)。
图6
我们还发现,在美国经济中这些IT无形资产的分布存在明显异质性的证据。
图7按五分位数绘制了ITIC存量价值的数量图。该图表明,这种资本形式的增长非但没有均匀分布,而是集中在相对较少的公司中,这与最近经济数据中观察到的其他数字化模式和公司主导模式是一致的。这些公司的ITIC数量较大,表明它们将来享有基于生产的巨大优势。
图7
实现机器学习的技能的市场价值
我们的ITIC评估方法,对可用于实现机器学习的技能有何解释?公司建立的无形资产的类型会随着时间的推移而变化,以适应IT环境。技术的变化也会改变建设资本基础的价值,包括人力资本的价值。Rock(2019a)使用LinkedIn的技能数据发现,谷歌对TensorFlow的开源发布将使用上市公司的人工智能市场价值提升了4%至7%。TensorFlow是一个软件包,它使软件工程师和数据科学家可以更轻松地实现深度学习模型。与使用Python或C ++进行编码比使用汇编语言进行编码更容易一样,TensorFlow节省了构建和训练神经网络所需的大量工作。因此,TensorFlow推出后,拥有与AI相关的无形资本的公司的价值增加了。这些公司从其无形资产创造价值所需的辅助工人变得更加丰富。尽管对相关公司产生了影响,但这是与IT相关的无形资产总体上涨趋势的一个相对较小的例子。要实现AI技能投资的回报,通常需要对其他IT技能(如云计算,数据工程和专业管理)进行大量投资。所有这些技能种类都需要对与IT相关的无形资产进行补充投资(Tambe ,2014)。
ITIC增长的影响
我们的研究结果表明,对信息结构和相关技能的投资会产生相对长期、持久的资产。对于政策制定者而言,这些发现表明,与IT相关的无形资产的巨额投资浪潮和重要的生产能力的发展有关。而且,在所有其他条件相同的情况下,这应会提振长期增长的前景。近年来,ITIC资产的表现与其他资本资产类似,这一事实本身很有趣。这可能是因为将组织创新转化为生产性资本需要在重组和技能进行大量投资。
但是,ITIC与实物资本之间存在重要差异。与大多数类型的有形资本不同,ITIC已经降低了公司外部价值。这对公司的估值和收购具有重要意义。传统上,发展研究人员将资本积累视为增长的引擎。与IT相关的无形资产的二级市场的缺乏,将这些问题紧密联系在一起,对企业健康具有重要意义。当公司解散后,ITIC可能会消失。因此,我们有必要继续进一步了解,ITIC的重要性不断上升,以及ITIC资产与实物资产之间的显著差异,是如何影响经济行为的。
结论
自工业革命以来,蒸汽机和电力等通用技术推动了经济增长和更高的生活水平。我们相信,我们时代最重要的通用技术是AI,尤其是ML。通用技术的关键特征是,它们可以实现互补性创新和投资。其中最重要的补充是新技能和新业务流程。与工厂和设备不同,技能和工艺创新是无形的。这使得它难以衡量,并且容易受到投资不足和投资不当的影响。通过使用SML框架,我们可以确定一些最有可能受机器学习影响的任务,以及它们的一些相关技能。
通常,与IT相关的无形资本的大幅增长,再加上特别是实现ML所需技能的价值激增,表明企业在重新雇佣劳动力方面发挥了重要作用。我们的分析表明,当公司员工拥有更多正确技能时,股东将从中受益。然而,尽管技术进步常常令人叹为观止,但劳动力的重新配置和业务流程的重新发明却滞后了。例如,根据Decker(2016)等人的研究,这反映在业务活力下降。释放价值的关键瓶颈通常不是技术而是人。因此,为了适应支持ML的工作,21世纪的重大挑战将是加快采用支持这些技术的新技能和组织实践。
____________________________________________
Acemoglu, Daron, and David Autor. 2011. Skills, Tasks and Technologies: Implications for Employment and Earnings. Handbook of Labor Economics. Vol. 4.
Acemoglu, Daron, and Pascual Restrepo. 2018. “The Race between Machine and Man: Implications of Technology for Growth, Factor Shares and Employment.” American Economic Review.
Autor, David, Frank Levy, and Richard J. Murnane. 2003. “The Skill Content of Recent Technological Change: An Empirical Exploration.” The Quarterly Journal of Economics 118 (4):1279–1333.
Bresnahan, Timothy F, Erik Brynjolfsson, and Lorin M Hitt. 2002. “Information Technology, Workplace Organization, and the Demand for Skilled Labor: Firm-Level Evidence.” The Quarterly Journal of Economics 117 (1). MIT Press:339–76.
Brynjolfsson, Erik, Morgan R. Frank, Tom Mitchell, Iyad Rahwan, and Daniel Rock. 2019. “Machine Learning, Labor Demand, and the Reorganization of Work.”
Brynjolfsson, Erik, Lorin M. Hitt, and Shinkyu Yang. 2002. “Intangible Assets: Computers and Organizational Capital.” Brookings Papers on Economic Activity 2002 (1):137–98.
Brynjolfsson, Erik, and Lorin M Hitt. 2000. “Beyond Computation: Information Technology, Organizational Transformation and Business Performance.” Journal of Economic Perspectives 14 (4):23–48.
Brynjolfsson, Erik, and Tom Mitchell. 2017. “What Can Machine Learning Do? Workforce Implications.” Science 358 (6370):1530–34.
Brynjolfsson, Erik, Tom Mitchell, and Daniel Rock. 2018a. “Machine Learning and Occupational Change.” Unpublished Working Paper. MIT.
———. 2018b. “What Can Machines Learn, and What Does It Mean for Occupations and the Economy?” AEA Papers and Proceedings, 43–47.
Brynjolfsson, Erik, Daniel Rock, and Chad Syverson. 2018. “Artificial Intelligence and the Modern Productivity Paradox: A Clash of Expectations and Statistics.” In Economics of Artificial Intelligence. University of Chicago Press.
Decker, Ryan A, John Haltiwanger, Ron S Jarmin, and Javier Miranda. 2016. “Declining Business Dynamism: What We Know and the Way Forward.” American Economic Review 106 (5):203–7.
Greenwood, Jeremy, and Mehmet Yorukoglu. 1997. “1974.” In Carnegie-Rochester Conference Series on Public Policy, 46:49–95.
Hall, Bronwyn H. 1993. “The Stock Market’s Valuation of R&D Investment during the 1980’s.” The American Economic Review 83 (2):259–64.
Hall, Robert E. 2001. “The Stock Market and Capital Accumulation.” The American Economic Review 91 (5):1185–1202.
McAfee, Andrew, and Erik Brynjolfsson. 2017. Machine, Platform, Crowd : Harnessing Our Digital Future. Harnessing Our Digital Future.
Rock, Daniel. 2019a. “Engineering Value: The Returns to Technological Talent and Investments in Artificial Intelligence.”
———. 2019b. “Essays on Information Technology, Intangible Capital, and the Economics of Artificial Intelligence.” Massachusetts Institute of Technology.
Shoham, Yoav, Raymond Perrault, Eric Brynjolfsson, Jack Clark, James Manyika, Juan Carlos Niebles, Terah Lyons, John Etchemendy, and Z Bauer. 2018. “The AI Index 2018 Annual Report.” Stanford.
Tambe, Prasanna. 2014. “Big Data Investment, Skills, and Firm Value.” Management Science 60 (6):1452–69.
作者简介
丹尼尔·洛克(Daniel Rock)是麻省理工学院斯隆分校(MIT Sloan)的博士生;
普拉桑娜·坦贝(Prasanna Tambe)是宾夕法尼亚大学沃顿商学院运营、信息与决策副教授。
点击左下角阅读原文查看更多。
►往期推荐
回复【Python】👉简单有用易上手
回复【学术前沿】👉机器学习丨大数据
回复【数据资源】👉公开数据
回复【可视化】👉你心心念念的数据呈现
回复【老姚专栏】👉老姚趣谈值得一看
►一周热文
数据呈现 | Python中交互turtle包,让图形多点艺术
工具&方法丨 关于交互项的那些事(三):遗漏变量偏差 vs 多重共线性
数据Seminar
这里是大数据、分析技术与学术研究的三叉路口
欢迎扫描👇二维码添加关注