查看原文
其他

基于MD&A的支持向量回归(SVR)法在解释应计项目时的有效性检测(二)【学术前沿】

洪振瀚 智能财会联盟 2023-02-24

往期回顾:《基于MD&A的支持向量回归...(一)


4、样本选择与结果


在本节中,我们将评估MDA Accruals[i,t]自身的解释效果,并关联其他方法(语调分析和字典法等)得出结果。我们首先对样本进行描述,然后再给出结果。


4.1、样本

我们的样本包含了从1994年到2013年的71847份公司年度观测数据,所有的观测都包含了足够的数据以计算营运资本应计项目,以及Dechow和Dichev(2002)的模型中使用的所有变量。我们所有财务数据来源于Compustat。我们将样本的描述性统计的结果放在下表中。发现我们所测公司的平均Accruals[i,t]和MDA Accruals[i,t]都为负。样本公司从t-1年到t年平均经历10.7%的销售增长t (ΔSales[i,t]),并且总资产的大约56.7%是以产权、厂房、设备的形式存在的(PPE[i,t])。第t年的平均经营现金流(CFO[i,t])为0.078,第t-1年的平均经营现金流(CFO[i,t-1])为0.115。最后,大约33.9%的样本观察的经营现金流小于零(Neg CFO[i,t])。

 

我们也为我们的主要分析中包含的所有变量计算了单变量皮尔逊和斯皮尔曼相关性(Pearson and Spearman correlations),结果在下表中。我们发现Accruals[i,t]和MDA Accruals[i,t]的斯皮尔曼相关性为0.18,在1%的水平上足够显著的,为基于MD&A的SVR法解释应计项目提供了证据。我们还发现MDA Accruals[i,t]与公司应计项目的其他基本决定因素相关。例如,我们发现它与ΔSales[i,t]正相关,与PPE[i,t]负相关。与实际应计项目不同的结果是,我们发现MDA Accruals[i,t]与CFO[i,t]变量正相关。我们还得出Accruals[i,t]和CFO[i,t]斯皮尔曼相关性为负,Accruals[i,t]与CFO[i,t-1]为正,Accruals[i,t]与ΔSales[i,t]为正,这与已有的文献结论相同。



4.2、MDA Accruals[i,t]的解释效果

我们对MDA Accruals[i,t]内容的第一次测试是用普通最小二乘法在MDA Accruals[i,t]上回归 Accruals[i,t]。求值公式如下(公式1):

 


我们将以上公式的回归结果放在下图第1栏中。我们考虑了年份和行业的固定效应,并整合企业的标准误差进行相关系数的调整。如果MDA Accruals[i,t]无偏差地解释应计项目,那么我们期待它的系数应该是1,如果变量期望中存在偏差,那因数就应该小于1。如果MDA Accruals[i,t]对公司水平的应计项目有解释效果,那么我们就期望它的系数足够大,可以有效解释Accruals[i,t]的变化。而结果证实了我们的想法,在1%的水平上,我们发现了一个足够大的正系数0.544,模型的调整后R平方等于0.097,这意味着MDA Accruals[i,t]可以解释大约9.7%的Accruals[i,t]变化。

 


4.3、改进后的MDA Accruals[i,t]拥有更好的解释效果

然后,我们检验MDA Accruals[i,t]是否可以提取出一些财务报表中难以获得的内容,SEC强调MD&A部分不应该是对财务报表的叙述性重复,也不应该仅仅用一些技术上的手段来应对监管的要求。我们对公式1做了补强,添加了对一些因素的控制(那些读者仅在财务报表中就能获得而不需要在MD&A中获得的)。我们使用McNichols,Ball 和 Shivakumar(2005)修改的Dechow和Dichev(2002)模型将这些因素包含进来。这个模型比基本的模型产生了更高的调整后R平方,其公式如下(公式2):

 


该公式里的变量之前都已经被定义过了,按照之前的思路,我们期望CFO[i,t-1]的因数为正,CFO[i,t]的因数为负。Neg CFO[i,t]的概念以及与变量CFO[i,t]的互相作用是Ball和Shivakumar引入的,他们并没有预测Neg CFO[i,t]的符号,但他们预测了CFO[i,t]与Neg CFO[i,t]之间的符号有正相关关系,这表明在现金流为负的时期更易发生应计项目损失。McNichols引入了ΔSales[i,t]和PPE[i,t]两个变量,并用它们来识别由销售增长与非现金项目引起的应计项目变化。根据McNichols的理论,我们预计ΔSales[i,t]为正来反映销售额的增长,PPE[i,t]因数为负来反映和应计项目相关的有形资产的减值。


我们将公式2包含MDA Accruals[i,t]和不包含MDA Accruals[i,t]的结果分别在上表的第二列和第三列展示。不包含MDA Accruals[i,t]的模型调整R方为0.153(第二列),表示它可以解释大概15.3%的应计项目变化。而包含MDA Accruals[i,t]的模型调整R方为0.191,相比不包含MDA Accruals[i,t]的模型有着24.8%的增长。我们还发现变量MDA Accruals[i,t]的因数为0.398,这个数值在1%的水平上是显著的。这些结果证明了MD&A对应计项目变动的解释是企业基本数据对应计项目变动解释的有效补充。


与早先的文献相同,我们发现在1%水平上足够大的正CFO[i,t-1]系数与负CFO[i,t]系数,同时变量CFO[i,t]与变量Neg CFO[i,t]的相互作用在1%的水平上也是非常显著的,这同样说明在现金流为负的时期更易发生应计项目损失。我们同样发现在1%水平上ΔSales[i,t]的正系数足够大这表明更高的销售增长会导致更高的应计项目。同时在1%的水平上PPE[i,t]的负系数也足够显著,这说明更高的有形资产值会导致更高的折旧。


4.4、MDA Accruals[i,t]相较字典法更好的解释效果

我们还使用会计字典中应计项目术语的计数来创建另一个应计项目估计,并将该估计的解释力与MDA Accruals[i,t]进行比较。这一测验有两个目的:1、找到SVR法相较于传统会计字典法的优势。2、搞明白MDA Accruals[i,t]的解释能力是否来源于MD&A中那些直接描述应计项目水平的单词或短语。


SEC申明MD&A部分不应该是对财务报表的简单重复,然而,如果管理层真的只是简单地重述财务报表表面上的权责发生部分,我们对MD&A的分析可能并不符合证交会的目标。我们使用超过3000个来自牛津会计参考词典的会计相关术语来代表应计项目词汇。字典中的许多术语在所有MD&A中出现的次数少于10次,对于这些词语我们会排除,最终的结果列表包含1083个与会计相关的术语。


之后,我们按照与评估MDA Accruals[i,t]类似的步骤,评估了应计项目的样本外值。具体来说,使用前一年的观察数据,我们对这些会计相关术语进行了OLS应计项目回归估计。然后,我们将此估计的系数应用于它们在第t年的各自的计数上。我们将此过程产生的应计项目称为Dict MDA Accruals[i,t]。由于回归数(K)明显大于行业层面上的观察数(N),因此我们仅按年对这一过程进行横向估计。使用这种方法,我们还会丢失1374个观察值,因为在样本的最初几年,当每年的观察值小于回归数时,我们无法进行OLS回归估计。我们对公式1补充了Dict MDA Accruals[i,t],补充后的公式如下(公式3):

 


我们在之前那张图的第4和第5栏分别展示了公式3包含MDA Accruals[i,t]和不包含MDA Accruals[i,t]的结果。不包含MDA Accruals[i,t]的模型调整后R方为0.052(第4栏)。Dict MDA Accruals[i,t]的因数是0.304,这在1%的水平上是显著的。而包含MDA Accruals[i,t]的模型调整后R方为0.106,相较于不包含MDA Accruals[i,t]的模型有着104%的提升。MDA Accruals[i,t]的因数为0.476,Dict MDA Accruals[i,t]的因数为0.157在1%的水平上也非常显著。这些结果代表着:1、SVR法对应计项目的估计是词典法的有效补充。2、它的来源并不单是MD&A部分中关于应计项目水平的直接描述。


我们还实行了三种额外的表外测试,来测验MDA Accruals[i,t]对应计项目的解释效果是否来源于对应计项目水平的直接引用。我们首先检验了SVR额外的解释力是否来自于MD&A中对一次性项目的直接引用。我们通过复制之前所说的词典法制造了另一个对应计项目的估计。我们将原来使用的牛津词汇列表替换成“冲销、特殊项目、减值、重组、持续经营、处置和损失”等词。结果发现这个模型的调整后R方为0.066。然后我们进一步添加了MDA Accruals[i,t]变量到这个模型里面,调整后R方增长到0.12,增长率达到80%。这个结果支持SVR法的解释效果并不是源自于MD&A中对一次性项目的直接引用的结论。


其次,我们使用Chen和Li(2014)确定的49个脚注头(对应于特定会计活动的存在)来评估SVR对应计项目的解释是否简单由于其对应计项目的辨别。我们在49个指示变量上进行了MDA Accruals[i,t]回归。如果在MD&A中有对该相应会计活动的描述,那么该变量的值设为1,然后,我们将该回归的残差值作为应计项目模型中的唯一回归变量,并得出调整后的R方等于0.066,这证实了MDA Accruals[i,t]不单单包含了各类会计项目是否存在的信息。


最后,我们从MD&A中排除了所有在《牛津会计和重估SVR参考词典》中提到的术语。然后将这个替代的SVR应计项目估计值作为应计项目模型中的唯一回归变量,并发现调整后的R方等于0.065。这一结果证实了之前表中行中字典法的结果,并表明排除会计术语并不会消除SVR估计的解释力。总结以上,这些与字典法相关的测试证明了的解释效果并不是完全来自于对应计项目的直接描述和会计术语。


4.5、MDA Accruals[i,t]相较于MD&A语调分析更优秀的解释效果

最终,我们测验MD&A的语调分析是否能够达到与MDA Accruals[i,t]相似的解释效果。根据Loughran和McDonald (2011)的积极与消极词汇列表,i公司第t年MD&A的语调(Tone[i,t])等于积极词汇的个数减去消极词汇的个数后再除以MD&A总词汇数。我们将其补充在了公式1中,补充后的模型如下(公式4):

 


对于公式4的包含MDA Accruals[i,t]和不包含MDA Accruals[i,t]的结果,我们展示在了前面图中的第6和第7栏中。的系数为正并且足够大,表明越乐观的MD&A对应更好的应计项目水平。然而不包含MDA Accruals[i,t]的模型调整后R方仅有0.017,这表明(Tone[i,t])对Accruals[i,t]几乎没有解释效果。包含MDA Accruals[i,t]的调整R方为0.098,这表明(Tone[i,t])无法达到与MDA Accruals[i,t]相似的效果。



5、可读性


接下来我们测试在MD&A可读性更差的情况下MD&A应计项目的解释效果是否也会更差。Li认为当公司的业绩不好的时候,公管理层会做出可读性更差的报告来混淆企业糟糕的表现。如果管理层真的这样做了,并且自动化技术无法排除这些变量,那我们认为MD&A应计项目的解释效果应该会下降。我们用以下公式(公式5)来测试当MD&A报告的可读性下降时,SVR的用处是否也会下降。

 


我们通过三个方法来定义MD&A的可读性:FOG指数(详情可见公众号文章《会计与金融中的文本分析》)、单词长度和文件大小。FOG指数是较早的评估10-K文件可读性的 方法,但随着后来10-K文件变得越来越复杂和难读,测量其可读性的手段也随之增加。后来的一些研究者也提出文件长度越长、文件大小越大的10-K文件的可读性越差。Bonsall(2015)认为10-K文件大小受与10-K中的底层文本无关的内容(HTML\XML\pdf等)的影响,因此,我们仅对10-K文件与相关的年度报告等文件进行文件大小测量。如果文件是HTML形式的,那么我们对指示变量中的文件大小变量回归为1,如果文件是基于文本的,那么回归值为0。


我们对三个测量标准都分别实施了回归。如果三个指标均高于样本中位数,那么Low Readability[i,t]变量为1。如果可读性下降时MDA Accruals[i,t]的解释效果也更差,那么Low Readability[i,t]与MDA Accruals[i,t]之间的系数应该是负相关的。


  我们把结果展示在了下图中,第1栏是用FOG指数计算Low Readability[i,t]变量时的结果。第2栏是用MD&A单词长度计算Low Readability[i,t]变量时的结果,第3栏是用文件大小计算Low Readability[i,t]变量时的结果。与我们所想的结果一致,我们发现Low Readability[i,t]与MDA Accruals[i,t]之间存在着显著的系数负相关性,这一结果证实了SVR有效性与MD&A可读性之间的关系。

 



6、MD&A应计项目的持续性


现在,我们开始关注:与其他不使用我们方法解释的应计项目相比,它的持续性是更好还是更差。Dechow(2010)认为,理解应计利润的持续性是股票估值的一个有用手段。我们使用这些持续性测试来探索在SVR估计中确定的应计项目的性质。


我们首先检测了经营现金流和应计项目总额的持续性来为评估SVR所识别的应计项目提供一个基准,公式4是我们的基础公式。而我们最终所使用的公式如下(公式6):

 


为了达到与Sloan(1996)等人相似的样本组成,我们在计算公式6时会用到CRSP数据,并且将我们的年度样本观测减少到55637个。公式中的ROA[i,t] +1表示公司i第t+1年的净利润除以第t年的总资产。我们将公式6的结果展示在下图的第1栏中。CFO[i,t]的系数为0.511,在1%水平上非常显著。与之前的文献结论一致,我们发现Accruals[i,t]的系数在1%的水平上显著小于CFO[i,t]的系数,这表明现金流比应计项目更具持续性。


为了测试用SVR解释的应计项目与其他方法所解释的应计项目相比是否更具持续性,我们将公式6中的Accruals[i,t]替换成MDA Accruals[i,t]和Non-MDA Accruals[i,t](Accruals[i,t]减去MDA Accruals[i,t]),替换后的公式如下(公式7):

 


替换后的结果在上表第2栏中展示,我们发现MDA Accruals[i,t]的系数为0.447,Non-MDA Accruals[i,t]的系数为0.372,这两个值在1%的水平上都非常显著。我们还注意到在1%的水平上,的MDA Accruals[i,t]系数要明显优于Non-MDA Accruals[i,t]的系数,这表明使用SVR解释的应计项目的持续性要优于其他。



内容转载自智能财会研究院(执笔人/洪振瀚)



智能财会系列公益讲座第四期预告


主    题:从云计算到云会计--历史陈述和企业现实

时    间:2020年5月20日(周三)

主讲人:吴武清 中国人民大学商学院副教授、博导

直播间:请点击“阅读原文”





      推荐阅读      

“智能财会联盟”共同发起单位邀请函


学术前沿专题回顾


(点击题目即可跳转阅读)

基于MD&A的支持向量回归(SVR)法在解释应计项目时的有效性检测(一)

基于文本分析的新行业划分方法(一)

基于文本分析的新行业划分方法(二)

当客户用上大数据,审计行业该如何应对(一)

当客户用上大数据,审计行业该如何应对(二)

当客户用上大数据,审计行业该如何应对(三)

会计与金融中的文本分析(一):研究背景,文本结构与可读性会计与金融中的文本分析(二):几种典型的分析方法会计与金融中的文本分析(三):文本相似度、实操、展望与总结会计欺诈预测的AUC法与NDCG法更高效的会计欺诈预测模型——集成学习与基于会计原始数据的回归模型预测会计欺诈行为大数据时代对会计与审计标准的新要求大数据审计:五大趋势与五大挑战内部审计的新方法——流程挖掘(Process Mining)当在线学习(online learning)遇上元学习(meta learning)大共享助推中小企业恢复运营的应急管理研究德勤全球机器人卓越中心调查:战略、架构和实践启示AI驱动算法成功预警武汉肺炎,背后的支撑是哪些?阿里达摩院发布2020十大科技趋势AI人机交互趋势研究(2019)新一代人工智能产业白皮书(2019 )


人才&实务专题回顾


(点击题目即可跳转阅读)财务机器人案例专题(一财务机器人案例专题(二财务机器人案例专题(三加快企业数字化转型,中国核电财务共享中心的智能化升级之路硬核:企业财务智能化转型实施路径--人大会计系主任张敏独家分享各大高校纷纷开启智能财会专业建设与人才培养,智能财会浪潮已来【南京理工大学】面对信息技术新挑战,开启智能化改革新征程-南理工开展“智能会计”人才培养【山东财经大学】山东财经大学“智能会计”诞生记数智战“疫”,智能财务在行动--线上课堂专题智能财务助力千亿级国企山东高速集团战疫情保复工人工智能迎来重大机遇!三部委发文:扩大“双一流”高校人工智能研究生培养规模180所高校新增人工智能专业,“人工智能+X”复合型人才未来有多稀缺?


会议动态专题回顾


(点击题目即可跳转阅读)上海国家会计学院第二届智能财务高峰论坛成功举办上海国家会计学院刘勤:智能财务时代已来临 “人机共生”协作模式或将出现元年科技李彤:智能财务的关键在认知智能和生态协同

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存