《财务研究》| 李莹 曲晓辉:机器学习如何帮助我们识别公司未来违规可能?
▼更多精彩推荐,请关注我们▼
原文载于:《财务研究》2022年第4期,原标题为《基于机器学习的公司违规预测研究》。
作者简介
李莹,南京审计大学社会审计学院讲师。在《管理科学》《财经问题研究》、Asia Pacific Journal of Accounting & Economics等期刊发表多篇论文。曲晓辉,哈尔滨工业大学(深圳)教授、博导、会计学科带头人。厦门大学退休教授、博导。国家社科基金学科评审组专家、中国成本研究会副会长、中国会计学会会计基础理论专业委员会主任委员、粤港澳高校会计联盟常任委员会首任主任,《中国会计评论》《当代会计评论》、China Accounting and Finance Review、China Journal of Accounting Research等学术期刊编委。享受国务院政府特殊津贴专家、美国富布莱特研究学者、全国先进女职工、全国会计硕士专业学位(MPAcc)项目论证发起人、《当代会计评论》创刊主编。主要研究领域:资本市场会计和国际会计。培养硕士73位、博士53位。先后主持国家重点和面上项目、部级重大重点项目16项,出版专著、译著和教材24部,国内外发表论文150篇,入选国际会议论文47篇次,部委采用咨询报告8份,企业采用咨询报告3份,国家及省部级科研1-3等奖16项,中国会计学会优秀论文一等奖2项,葛家澍奖(科研奖)1项(首届),ACCA卓越成就奖。
引用本文请复制此条目:李莹,曲晓辉.基于机器学习的公司违规预测研究[J]. 财务研究,2022,(4):54-66.
李莹 曲晓辉
一、研究背景
公司违规是资本市场研究的一大重要问题。监管机构、投资者、审计师和分析师如何更早地发现公司违规行为,并进行重点关注或跟踪调查,对资本市场的健康发展至关重要。然而,现有传统预测方法大多基于线性回归模型,从主观认知或局部经验出发确定影响要素,很难准确预警公司违规行为,事前发现和事中监管面临巨大挑战。因此,如何构建具有事前提示功能的公司违规预警模型,是学术界与实务界的重要研究课题。
近年来,人工智能技术的发展为公司违规预警研究提供了新的突破口。机器学习作为人工智能的代表性技术,是借助高级的数学方法和新型的算法从大数据中寻找出有用的数据并进行挖掘的技术。在经管领域,机器学习能够为统计预测问题提供高维模型和大量候选模型,并能够进行有效算法的筛选。
二、主要内容
本文以2007~2017年我国A股上市公司为研究样本,构建了基于机器学习算法的公司违规预测模型并实施检验。研究发现:
(1)通过比对分析可知,广为使用的线性回归模型不能充分挖掘数据信息并进行有效预测,机器学习的树模型(Random Forest 和 GBDT)和神经网络模型(RNN 和 LSTM)的预测效果更优。
(2)采用 SHAP 方法探寻公司违规的重要预警因子及其贡献度,发现公司治理相关变量对违规预警具有重要贡献,传统线性回归模型过分强调财务数据的预警能力,弱化了公司治理因子对违规预警的贡献。
(3)进一步采用 SHAP 方法将 Random Forest 和 GBDT 模型的运作过程和贡献分布可视化,挖掘重要因子对公司未来违规的影响机理 ;考虑到传统线性回归模型无法明确变量对公司违规行为产生有效影响的具体范围,本文以 Random Forest 为例,计算主要影响因子的警惕阈值。
三、研究贡献
第一,随着人工智能的发展,机器学习方法已经在许多领域取得令人满意的成果。然而在资本市场领域,学者们仍然较多基于研究样本推导公司违规的因果关系,如许多文献采用线性回归方法构建预测模型(吴世农和卢贤义,2001;Dechow等,2011;洪荭等,2012)。本文创新性地融合人工智能与公司违规研究,将机器学习方法应用于预测公司违规,扩展了公司违规研究数据分析与建模工具箱,强调了机器学习在财务研究中的重要价值,为此类问题在大数据环境下的发展提供了新方法和新思路。
第二,本文通过对基于机器学习的公司违规模型的特征因子进行重要性分析,发现公司违规记录、盈利能力及外部治理水平是公司违规发生的重要预警指标。相比于内部公司治理,外部公司治理为公司违规预测模型提供了显著重要且易于取得的有用信息,该结论为以往未充分考虑公司外部治理特征的预测模型提供了补充证据。
第三,机器学习复杂的模型使人们难以理解其性质,为此本文采用SHAP方法将模型运作过程可视化,打开机器学习“黑箱”,深入挖掘和分析公司违规预测模型中因子的影响机理及有效作用范围,打破了以往机器学习模型在因子效度检验方面缺乏经济依据和解释力的局面,提供了数据间经济关系解释的可能性。
基金项目
教育部人文社会科学重点研究基地重大项目( 16JJD790035);江苏高校哲学社会科学研究项目( 2021SJA0356);江苏高校优势学科建设工程资助项目(PAPD);深圳市人文社会科学重点研究基地哈尔滨工业大学(深圳)大数据会计与决策研究中心基金(KP191001)
▷来源:《财务研究》2022年第4期
▷责任编辑:王安琪
▷值班编辑:任宇欣 穆雍韬
▷版式设计:刘莹
往期精彩回顾
财务理论前沿2022学术研讨会征文启事《财务研究》2022年第4期目录及摘要《财务研究》| 韩洪灵等:论资本市场吹哨人制度的性质、治理逻辑与实施机制
《财务研究》| 许金叶:会计块数据:探解会计智能机器人数据悖论的关键
《财务研究》丨王鹏程 殷雅坤:上市公司商誉核算和管理问题研究:现状讨论与政策建议
《财务研究》| 李诗 黄世忠:从CSR到ESG的演进—— 文献回顾与未来展望
《财务研究》|杨雄胜等:论现代财务管理的“资本观”
魏明海 张芮杳:以五重信号为资本及其扩张设置“红绿灯”
黄世忠:TCFD框架的践行典范——微软气候信息披露案例分析
罗党论等 | 北交所成立:动因、制度分析与发展建议
巫岑 饶品贵:并购能化解企业的产能过剩吗?
陈志斌等:基于区块链技术的企业风险管理体系构建
▼大家都在看▼
声明:“财务与会计”微信公号刊载此文,是出于传递更多信息之目的。若文章、图片等来源标注错误或侵犯了您的合法权益,欢迎致电010-88227096,我们将及时更正、删除或依法处理。
学习/创造/分享
分享财务与会计之美