查看原文
其他

机器学习和经济学, 技术革命正在改变经济社会和学术研究

计量经济圈 计量经济圈 2022-09-04

凡是搞计量经济的,都关注这个号了

稿件:econometrics666@126.com

所有计量经济圈方法论丛的code程序, 宏微观数据库和各种软件都放在社群里.欢迎到计量经济圈社群交流访问.

1.机器学习之KNN分类算法介绍: Stata和R同步实现(附数据和代码),2.机器学习对经济学研究的影响研究进展综述,3.陈硕: 回顾与展望经济学研究中的机器学习,4.最新: 运用机器学习和合成控制法研究武汉封城对空气污染和健康的影响! 5.Top, 机器学习是一种应用的计量经济学方法, 不懂将来面临淘汰危险!6.Top前沿: 农业和应用经济学中的机器学习, 其与计量经济学的比较, 不读不懂你就out了!7.前沿: 机器学习在金融和能源经济领域的应用分类总结,8.机器学习方法出现在AER, JPE, QJE等顶刊上了!9.机器学习第一书, 数据挖掘, 推理和预测,10.从线性回归到机器学习, 一张图帮你文献综述,11.11种与机器学习相关的多元变量分析方法汇总,12.机器学习和大数据计量经济学, 你必须阅读一下这篇,13.机器学习与Econometrics的书籍推荐, 值得拥有的经典,14.机器学习在微观计量的应用最新趋势: 大数据和因果推断,15.R语言函数最全总结, 机器学习从这里出发,16.机器学习在微观计量的应用最新趋势: 回归模型,17.机器学习对计量经济学的影响, AEA年会独家报道,18.回归、分类与聚类:三大方向剖解机器学习算法的优缺点(附Python和R实现),19.关于机器学习的领悟与反思,20.机器学习,可异于数理统计,21.前沿: 比特币, 多少罪恶假汝之手? 机器学习测算加密货币资助的非法活动金额! 22.利用机器学习进行实证资产定价, 金融投资的前沿科学技术! 23.全面比较和概述运用机器学习模型进行时间序列预测的方法优劣!

正文

关于下方文字内容,作者:钟秉睿,中央财经大学财政税务学院,通信邮箱:zunity@163.com

目录

一、基本情况

本文选自2019年2月刊发的TNIT(Toulouse Network for Information Technology) News第19期,是一篇对Susan Athey(诺奖得主Guido Imbens的妻子)的个人采访,主要探讨了机器学习在经济学研究领域的现实应用及其前景。

二、主要内容

1.受访者介绍

苏珊•阿西(Susan Athey)在斯坦福大学担任技术经济学教授,是第一位获得克拉克奖的女性。根据她最近题为 "机器学习对经济学的影响 "的工作论文,她向TNIT新闻讲述了技术革命是如何改变经济和社会的。

2.访谈内容

2.1作为微软顾问的经历影响了Susan对机器学习(ML)的兴趣

Susan受雇于微软期间,与一群工程师合作,他们致力于建立搜索广告平台,大多没有经济、市场或广告方面的背景。但微软的工程师们掌握了很多关于ML的知识,在去中心化的团队中工作,改进专门的ML算法。他们使用同时进行多组随机控制实验,测试推广策略某种改变的效应,并在审查了实验结果后集中开会讨论,确认这种改变的有效性。

Susan的经济学家同事对于ML的态度发生了从轻视、不解到逐渐接受、主动学习的转变。ML技术被越来越多的计量经济学家所采纳,如今已经得到广泛认可。

2.2机器学习的应用将对学术研究和政策制定带来什么影响

首先,ML方法将广泛用于预测、分类和聚类等预定任务。在政治学和计算社会科学的研究中,使用ML进行文本分析已然成为标准方案。使用ML与卫星图像和街道地图来预测经济数量(如贫困、安全和房屋价值)的文献正在迅速增长,这种方法可以用来在一个非常细微的层面上比较不同时期的结果。

2.3为什么机器学习对上述类型的应用是有用的

传统的计量经济学模型是 "手工 "指定的——在实践中,研究人员会尝试几十个备选方案,最终选择几个进行展示。这样做的好处是可以依据专业领域的知识和原理设计实验,但亦存在可能找不到最适合数据的模型的缺点。

Susan使用ML方法来解决因果推断的问题,其应用包括估计处理效应(treatment effect)或参数估计值如何随外生协变量而变化;估计最佳的处理策略;以及在估计平均处理效应时有效控制混杂因素。

2.4机器学习能提高科学可信度吗

ML能够提高可信度,原因如下:

首先,假设研究者已经分解了他们的问题,确保预测性的ML方法可以用于解决部分问题。ML提供了一种严格和系统的方法来寻找最佳模型,以在一个被保留的测试数据集中实现最大的拟合度。当研究者选择一个算法时,该算法又会选择模型的最佳规格来拟合模型(或在因果模型中,最优化另一个目标)。研究者可以在论文中充分描述算法,其模型的选择也可以被复制,而研究者依传统方法实验不同模型的过程则很难记录。ML的应用将消除研究者对结果的选择性展示带来的偏差,增加研究的透明度。

其次,ML的应用可以产生积极影响的另一个领域是,它更加强调稳定性和稳健性,以评估研究的可信度。利用ML来测试大量不同的模型,可以评估关键参数估计的稳健性。

2.5 既然ML的预测能力这么强,我们为何还需要别的方法

大多数真正的商业问题或政策问题都不是直接的预测问题。现成的ML方法可以预测,但并不能直接实现资源最优分配。虽然预测往往是资源分配问题的很大一部分,但在有风险的单位和那些干预最有利的单位之间存在着差别。确定哪些单位应该接受处理,是一个因果推理问题,需要不同类型的数据。可能需要随机实验或自然实验来估计异质性的治疗效果和最佳分配政策。

2.6 数据是否已变得比理论更重要

ML非常容易在测试集上进行评估,并且不需要统计理论。研究者可以凭借数据直接衡量该模型的预测效果如何,对应的算法可以是一个黑箱,只需竞相成功地制造出越来越好的黑箱。

而在因果推理中,如果识别因果效应所需的假设在现有的数据中不被满足,训练集和测试集中均无法得到正确的答案。经济学家们习惯于将一个模型的大部分预测能力丢弃,以获得对因果效应的无偏估计。

ML方法可以在估计方法中提供巨大的改进,但统计理论仍然是指导着其应用。对于更复杂的反事实情景,如果不引入理论和行为模型,很难取得重大进展。有了行为模型,再加上对偏好参数的估算参数,就有可能对数据中未观察到的情景做出预测数据中没有观察到的情况。人工智能(AI)算法也有可能需要推理它们以前没有遇到过的情景,理论模型可以帮助确保反事实预测的合理性。

2.7大数据是否会改变我们看世界的方式

我们将看到生产力及测量科学的复兴,以及设计和分析大型行政数据集的新方法。我们将试图汇集不同来源的数据,以向个人或公司提供更全面的视角,金融、物理和数字世界中的行为将被连接起来。在一些情况下,ML能够将不同的身份匹配到同一个人身上,我们将随着时间的推移观察行为,进行高频率的测量。

2.8机器学习将对经济学家的工作方式产生什么影响

经济学研究的组织结构、资助和传播方式将发生变化。从事大量复杂数据分析的学者将开始采用更类似于计算机科学的 "实验室 "模式,一个实验室可能包括一个博士后、多名博士生、博士前研究员、本科生和全职工作人员。这样的实验室很昂贵,所以资助模式也将需要调整。在传播上,即使一些数据来源仍然是专有的,也会更加强调证据和可重复性。

2.9 经济学家将如何与数字时代的政策制定者互动

我们将看到经济学家与政府、工业、教育和卫生的接触方式发生变化。数字化将为经济学家带来制定、实施和评估政策的机会--如农业咨询、在线教育、健康信息、政府服务提供和个性化资源分配--可以通过数字方式提供。反馈将来得更快,将有更多机会收集数据、适应和调整。

2.10 最有希望的ML创新是哪些

ML方法适合渐进式改进,可以使用随机对照试验进行评估,一个新的趋势是将实验直接建立在算法中。具体而言,情境Bandit算法在社会科学中有许多潜在的应用,它们可以被用来作为行为经济学的现场实验原型,以及在健康和教育等应用中学习个性化的治疗分配政策。

2.11 我们应该如何让学生为数字化的未来做好准备

10年内,大多数学生在进入大学(或商学院)时都会有丰富的编码经验。许多人将在大学里学习编码和数据分析,教学将需要补充这些材料。在短期内,更多的学生可能在进入计量经济学课程时已经接触过ML,并认为数据分析只是关于预测或分类问题。计量经济学将需要更多地关注其比较优势和其他领域已经领先的重要方法。

2.12 机器学习专家能从经济学家那里学到什么

如果没有正确的经济学训练和适当类型的数据,就很难知道如何使用ML算法工具来制定价格,评估广告活动的有效性,或类似的事情。人工智能是一项对经济非常重要的新技术,它需要从过去的数据中进行推断,这是一个因果推理的问题。在社会科学中,遗漏一个协变量会使某些种类的解释更加复杂。简单的回归可能看起来更容易解释(因为它很简单),但实际上发生的是误解,而这正是经济学家所重视的,也是机器学习专家需要注意的。

2.13 机器学习是否打破了学术的边界

跨学科的研究将大量增加。随着数字化的普及,所有学科都将获得更大的能力,以促进测量和因果推理的方式干预环境。我们还将看到更多的跨学科专业,社会科学、统计学、计算机科学和工程学的结合将非常重要。

2.14 机器学习将创造更好的世界吗

ML在很多方面改善了世界,帮助人们更有效地搜寻信息、寻找最合适的产品、更有效地学习。然而,大量的监管问题也需要得到解决。我们还需要制定一个研究议程,重点是使AI对人类安全和有效。这个议程包括关于公平、意外后果、人工智能与人类系统互动时的平衡行为、稳健性、稳定性以及许多其他问题。

2.15 如何总结经济学家面临的新挑战

经济学将被ML深刻地改变。经济学家将建立更稳健、更优化的统计模型,使之具备更理想的性质。各种新的研究领域将提供更好的测量、新的方法和不同的实质性问题。许多最深刻的变化正在进行中。有令人振奋和充满活力的研究领域出现,但并没有降低经济学家对因果关系和其他传统问题的关注。随着ML将数据分析的一些常规任务自动化,对于经济学家来说,完成可信和有影响的实证工作所需的专业知识越发重要。

正文

关于下方文字内容,作者:赵雪梅,华中科技大学经济学院,通信邮箱:m202174308@hust.edu.cn



下面这些短链接文章属于合集,可以收藏起来阅读,不然以后都找不到了。

2.5年,计量经济圈近1000篇不重类计量文章,

可直接在公众号菜单栏搜索任何计量相关问题,

Econometrics Circle




数据系列空间矩阵 | 工企数据 | PM2.5 | 市场化指数 | CO2数据 |  夜间灯光 | 官员方言  | 微观数据 | 内部数据计量系列匹配方法 | 内生性 | 工具变量 | DID | 面板数据 | 常用TOOL | 中介调节 | 时间序列 | RDD断点 | 合成控制 | 200篇合辑 | 因果识别 | 社会网络 | 空间DID数据处理Stata | R | Python | 缺失值 | CHIP/ CHNS/CHARLS/CFPS/CGSS等 |干货系列能源环境 | 效率研究 | 空间计量 | 国际经贸 | 计量软件 | 商科研究 | 机器学习 | SSCI | CSSCI | SSCI查询 | 名家经验计量经济圈组织了一个计量社群,有如下特征:热情互助最多前沿趋势最多、社科资料最多、社科数据最多、科研牛人最多、海外名校最多。因此,建议积极进取和有强烈研习激情的中青年学者到社群交流探讨,始终坚信优秀是通过感染优秀而互相成就彼此的。

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存