查看原文
其他

基本无害 | 约翰·梅纳德·凯恩斯对计量经济学的批判

数据Seminar 2023-02-21

The following article is from 奎星楼笔记 Author 李井奎

本文转载自公众号奎星楼笔记

奎星楼主人按:1939年9月,凯恩斯在Economic Journal上公开撰文批评计量经济学创始人之一简·丁伯根在国际联盟所作的对经济周期理论的统计检验研究,从此引发了计量经济学史上的一场公案:凯恩斯与丁伯根之争。我正在撰写有关于这一争论的历史和之后的计量思想发展的思想史著作,特将他们的争论文章译出,以飨读者。

丁伯根教授的方法
在这本书的序言中,洛夫戴伊先生解释说,它可被视为国际联盟关于商业周期研究的第二阶段的第一项成果,冯·哈伯勒教授的《繁荣与萧条》是关于商业周期研究的第一阶段。最终目标是将统计检验应用于冯•哈伯勒教授汇编的各种商业周期理论。但是,这一项成果只限于解释它所建议采用的统计方法,然后是给出三个例子。在第一章中,丁伯根教授讨论了一些相关的逻辑问题;第二章对多元相关分析方法进行了概括性的阐述;在接下来的三章中,他将这种方法应用于三个精选出来的例子,即投资波动、住宅建筑和铁路车辆投资。
第二章对该书采用的统计方法作了简明扼要的说明,确实很好。但是,本书的第一章,本应讨论在应用经济数据方法时所涉困难的逻辑问题,而这些方法是根据性质完全不同的材料研究得出的,却令人失望透顶。就其内容而言,它是有帮助的;但是这一章只有四页,而且它没有回答许多问题,如果所提出的方法是恰如其分的话,这些问题是经济学家在对经济材料必须满足的条件感到满意之前必然要问的。既然洛夫戴伊先生欢迎就未来的研究程序提出批评和建议,我想提出的劝告是,下一项工作应该主要致力于这一逻辑问题,如果将这种方法应用于经济材料是富有成效的,那么就应该充分而仔细地解释该经济材料必须满足的条件。
丁伯根教授显然不想说得太多。只要允许他继续下去,他就会很乐意在最后以一种迷人的谦虚态度承认,这些结果可能没有任何价值。他最糟糕的地方在于,他对如何继续工作更感兴趣,而不是花时间来决定这份工作是否值得继续下去。他显然更喜欢算术的迷宫,而不是逻辑的迷宫,因此我必须请他原谅这样一个人的批评,这个人不是对统计理论一窍不通,而是相反,他对统计理论的兴趣从许多年前就开始了。且让我把我希望在国际联盟下一项研究工作中得到答案的问题编列如次。
(1)丁伯根教授首先承认了一个非常重要和必要的事实。“统计学家在分析过程中所能发挥的作用”,他在第12页解释道,“绝不能被误解。他加以研究的理论是由经济学家交给他的,经济学家必须对这些理论负责;因为没有统计检验可以证明一个理论是正确的。”然而,统计检验能证明一个理论是不正确的吗?丁伯根教授在这里也对他的主张进行了限定,但走得更远,他甚至说:“通过表明它不包括一组特定的事实,确实可以证明这个理论是不正确的,或者至少是不完整的。”但这是不是走得太远了?至多,只有那些在提出这些理论的经济学家看来,承认下列各种条件适用的理论才能被证明是不正确的。

无论如何,丁伯根教授同意,他的方法的主要目的是,在经济学家事先正确分析了因果关系的定性特征的情况下,发现每一种因果关系的作用强度。如果我们已经知道原因是什么,那么(假定下列所有其他条件都得到满足)丁伯根教授就可以声称,在给定统计事实的情况下,他能够把适当的数量重要性归于那些原因。如果我们事先知道经济周期部分取决于现在的利率,部分取决于20年前的出生率,而且这些是与结果成线性相关的独立因素,他就能发现它们的相对重要性。至于反驳这样一个理论,他不能证明它们不是一成不变的原因,他最多能证明的是,如果它们是一成不变的原因,要么这些因素不是独立的,要么所涉及的相关性不是线性的,要么还有其他相关方面,其中经济环境在一段时间内不是同质的(也许是因为非统计因素是相关的)。
多重相关分析的方法本质上依赖于经济学家提供的不仅是一个重要原因(这些重要原因确实是重要原因)的清单,而是一个完整的清单,我这样想对吗?例如,假设考虑到三个因素,它们实际上应该是不同的原因还不够;我们还要肯定没有其他重要的因素。如果还有一个进一步的因素,却没有考虑到,那么该方法就不能发现前三个因素在数量上的相对重要性。如果是这样的话,这就意味着这种方法只适用于经济学家能够事先对重要因素提供正确的、毫无疑问的完整分析的情况。这既不是一种发现的方法,也不是一种批评的方法。它是这样一种方法,使我们已经从完整的理论分析中得到的东西,在定性方面具有定量的精确性,但条件总是满足下面要给出的其他考虑因素。
(2)下一个条件是,所有的重要因素都是可测量的(而且,大概还应该加上一点,我们对它们的测量有足够的统计学知识)。丁伯根教授强调了这种情况,但他没有进一步解释,他这样做无法令人感到满意。他这样写道(第11页):——
“这种探究,就其性质而言,局限于对可测量现象的考察。当然,不可测量的现象有时可能对事件的发展产生重要影响;目前的分析结果必须辅之以可以从其他来源获得的关于这种影响程度的信息。”
他在这里建议,如果某些因素是可测量的,从检查这些因素中获得的结果由其他信息予以“补充”之后,那么这种方法就可以有效地应用。但这是怎么做到的呢?他没有告诉我们。他计算这些可测量因素的相对重要性的方法基本上依赖于这样一个假设,即它们是全面的因素。他给了它们这样的回归系数,这些回归系数完全解释了所研究的现象。它们如何被其他信息“补充”?
如果所有的重要因素都必然是可测量的,那么这种方法是非常重要的。因为它把所有那些经济问题都从这种方法的操作中撤出了,在这些经济问题中,政治、社会和心理因素,包括诸如政府政策、发明的进展和预期的状态等,可能发挥着重要的作用。这尤其不适用于商业周期的问题。
(3)我们必须把我们的初步分析推进到我们确信不同的因素基本上是相互独立的地步吗?本书没有讨论这个问题。但我认为这很重要。因为,如果我们所使用的因素不是完全独立的,我们就会陷入“虚假的”相关性所带来的极其困难和具有欺骗性的复杂性之中。
此外,丁伯根教授关注的是“序列分析(sequence analysis)”;他处理的是非同时事件(non-simultaneous events)和时间滞后问题。如果正在研究的现象本身对我们用来解释它的因素产生反应,那又会发生什么?例如,当他研究投资波动时,丁伯根教授让它们取决于利润的波动。但是,如果利润的波动部分地(事实上,很明显地)取决于投资的波动,这又会发生什么呢?丁伯根教授在第17页的一个脚注中笼统地提到了这个困难,他在没有进一步讨论的情况下说,“我们必须小心从事”。但他小心从事了吗?他采取了什么预防措施?第39页,在一段我没有完全理解的段落中,他提出,这个困难可以通过调整时间滞后项来克服。对于读者来说,要看透这类逻辑问题是不容易的,因为在没有给出清晰而全面的讨论的情况下,它就被安然地抛在了一边。
实际上,丁伯根教授似乎完全不关心他的基本因素是否相互独立。例如,当他考察投资的波动时,他的基本因素是:(1)赚取的利润,(2)资本品的价格,(3)利率,(4)利润率,(5)消费品生产指数,(6)一般价格水平的增长率。我推断,他认为独立性是无关紧要的。但这让我回想起了一段过去的日子,彼时尤尔先生发现虚假相关性,在乐观的统计学家制作的玩意儿之下,尤尔先生埋下了一颗地雷。简单地说,很明显,如果真正相同的因素以各种伪装出现在几个地方,自由选择回归系数可能会导致奇怪的结果。这就像那些给孩子们玩的谜题,你写下你的年龄,对它做一通加减乘除,最终会得到《启示录》中野兽的数目。
上面的这个例子还表明了另一个值得进一步说明的问题。可以看出,丁伯根教授将利润和利率作为影响投资的因素之一。但是,正如丁伯根教授自己所指出的(第66页),有些经济学家会认为,重要的是这两个因素之间的差异,而不是它们的绝对数量。这会对事情造成什么影响呢?此外,它们将意味着不同以资本品当期成本的百分比计算的利润与利率之间的差额。现在,丁伯根教授似乎并不关心他用什么单位来衡量利润。对于战前的美国,它是股价指数,对于战前的英国是非劳动收入,对于战前的德国是股息占资本的百分比,对于战后的美国,它是公司净收入,对于战后的英国,它是净利润占资本的百分比。因此,它有时是比率,有时是绝对量;他在最后结果中有时以较大的系数乘以这种大杂烩,有时以较小的系数与之相乘,然后从中减去由一个(通常)较小的系数相乘得到的利率,我不知道这里是否存在这样一种理论,即投资可能受成本利润率和贷款利率之差的影响,或者是否我们已经得出了野兽的数目。丁伯根教授绝不是不知道他衡量利润的方式会产生多大的差别。他高兴地指出(第57页),这是一件令人感兴趣的事情,但并不令人担心,他用来表示德国利润的序列数据导致该因素的回归系数是他用来表示美国利润的序列数据的两倍,而他用来表示英国利润的序列数据的系数几乎是它的四倍。(这是一个非常直接的例子,只要允许他不受阻碍地继续进行所有这些算术,他就会在最后承认,对读者来说这一定是毁灭性的不一致。)他坚持认为他的因素必须是可测量的,但是关于他用来测量这些因素的单位,他却特别地漫不经心,尽管事实上他最终要把它们全部加起来。

(4)丁伯根教授解释说(第25页),一般来说,他假设所研究的相关性是线性的:——
“一般来说,在下列研究中,只有在有强有力的证据存在的情况下才考虑曲线关系。介绍曲线关系最重要特征的一种粗略方法是使用变化系数(changing coefficients)——例如,一个系数系统用于描述不高于正常水平的情况,另一个用于描述极高水平的情况。这相当于用两条直线来近似一条曲线。引入曲线关系的另一种方法是在‘解释性序列数据’中取变量的平方或其他函数。”
我在这本书中没有发现任何曲线相关的例子,他也没有告诉我们什么样的证据会导致他把它引入进来。如果像他上面所建议的那样,在这种情况下,他使用不时改变线性系数的方法,那么对这些线进行相当容易的操作,就有可能对任何事实给出某种解释。我认为他的结果的唯一性取决于他事先知道相关曲线必须是一种特定类型的函数,无论是线性的还是其他类型的函数,我这样想对吗?
除此之外,人们还希望着重地知道线性假设所涉及的内容。这意味着任何因果因素对被研究现象的数量影响都与该因素本身的大小成正比。在第26页的一个读者不太可能重视的圆括号中,丁伯根教授确实顺便提到了这一点。但是,假设所有的经济力量都具有这种性质,在所研究的现象中产生独立的变化,这种变化与所研究的现象本身的变化成正比,这是一个非常极端的、通常是不可能的假设;事实上,这是一个荒谬的假设。然而,这正是丁伯根教授一直以来的假设。例如,在他关于投资波动的例子中,线性假设意味着,如果某一年的利润增长是另一年的两倍,那么它对投资量的影响也将恰好是另一年的两倍;同样,利率变化对投资的影响总是与该变化量的大小成正比。如果要作出这样一种不太可能的假设,人们在选择测量方法和基准时就必须非常谨慎,特别是当人们牢记丁伯根教授的测量方法几乎总是间接的,就更是这样。也就是说,它们不是对因素本身的直接衡量,而是一些相关现象的指数。因此,即使这些因素本身产生了直接的比例效应,这对所采用的间接指数来说也不太可能是真的。
是否有理由怀疑线性的假设排除了周期性因素?(例如)根据储蓄倾向是绝对活动水平的函数,而投资引诱是活动水平变化的函数,那么(例如)加速原理又处于什么位置?丁伯根教授主要通过利润的波动来解释投资的波动;因此,如果利润周期性波动,那么投资就也会周期性波动。但他并没有试图解释利润的波动。假设利润所依赖的所有因素也都是线性相关的,可以以此类推,直到最后的分析吗?在一个系统中是否可能存在周期性波动,其所有最终独立的决定因素都具有固定的回归系数,并且与其结果呈线性相关,除非其中一个最终决定因素本身是时间的周期函数(例如太阳黑子)?导致反转的元素从何而来?我问这个问题,并不假装可以回答它。但我很想知道答案。因为如果它是否定的,那么丁伯根教授从事的工作就是用这样一种方法来解释商业周期,这种方法的其中一个假设前提是,周期只能由其他周期来解释。
(5)如果读者要清楚地了解它所涉及的内容,时间滞后项和趋势项的处理就值得进行更充分的讨论。据我所知,丁伯根教授的时间滞后项并不像他的定性分析那样,是由他的经济学家朋友引入的,而是他自己发明的。他似乎是通过某种试错法来做到这一点的。也就是说,他一直在不停地折腾,直到找到一个与他正在检验的理论和他的方法的一般假设不太相符的时间滞后项。他没有举例说明确定时间滞后项的过程(参看第48页)。但在另一段落(第39页)中,丁伯根教授似乎同意时间滞后项必须是先验给出的。
趋势因子的引入更加棘手,讨论也更少。这一要素不是通过参考整个经济规模的长期变化而得到的,而是与所讨论的因素严格相关。在投资波动的情况下,丁伯根教授解释说(第47页),“趋势”被计算为战前时期的9年移动平均值——这段时间足够长,可以省略头四年和最后四年——以及战后时期的直线趋势——这段时间太短,不能省略8年”。这似乎相当武断。但是,除此之外,难道不应该允许基本因素的趋势反映在结果现象的趋势中吗?为什么需要校正?我很可能误解了这一论点,因为这不是丁伯根教授可能犯的那种错误。
虽然可能有很多不同趋势的因素,但只有一条趋势线,我没有理解这一单一趋势的演变过程。使用直线趋势(在战后年份)显然意味着在该系列的第一年和最后一年之间画一条直线。结果当然是,你终止在哪一时期会有很大的不同。以美国为例(第56页),该系列是从1919年到1933年,由于头几年和最后几年的不正常情况,这就涉及到一个悖论,即美国在整个时期,包括1929年结束的时期,都处于严重的下降趋势,总共下降了20%;然而,如果丁伯根教授选择终止在了1929年,那么他就会使用同期急剧上升的趋势线,而不是急剧下降的趋势线。这看起来是个灾难性的程序。丁伯根教授很清楚这一点。在第47页的一个脚注中,他提到“为美国数据(战后时期)所选择的趋势可能有一定的偏差,因为这一时期以繁荣之年开始,以萧条之年结束”。但他并没有感到不安,因为他已经说服了自己,如果我没理解错的话,你采取什么样的趋势线实际上并没有什么不同。
(6)我把结论转到争论的另一个方面。这些曲线和方程在多大程度上只是一段历史性的曲线拟合和描述,它们在多大程度上对过去和未来做出了归纳性的主张呢?我没有注意到丁伯根教授自己在任何一段话里做出过归纳式的主张。他似乎只关心统计描述。然而,洛夫戴伊先生在前言中概述的最终目的无疑是归纳的。如果这个方法不能证明或否证一个定性的理论,如果它不能给未来一个定量的指导,那么它值得一做吗?因为,毫无疑问,这不是描述过去的一种非常清晰的方式。

30年前,我曾忙于研究在简单相关的情况下从统计描述过渡到归纳推广的棘手问题;今天在多元相关的时代,我没有发现在这方面的实践有很大的改进。以防洛夫戴伊或其他人抱着归纳上的期待,有必要指出的是,丁伯根教授为这种归纳转换做了最少的准备。
概括地说,最重要的条件是,除了我们特别考虑的那些因素的波动之外,所有有关方面的环境在一段时间内应该是一致的。即使我们在过去发现了这种情况,我们也不能肯定这种情况将来会继续存在。但如果我们在过去发现了它们,我们就有了归纳论证的基础。因此,第一步是将所考察的期间分解为一系列的子期间,以便发现把我们的方法应用于分别选取的各个子期间的结果是否合理一致。如果是合理一致,那么我们就有了一些依据来预测我们的结果。
但这是丁伯根教授从未尝试过的。的确,他的序列数据被分为战后和战前时期,但这似乎不是有意为之的,而是由于现有统计数据的紧迫性所致。在战前的调查中,他用了大约四十年的时间,并没有试图把它分成子时期。如果他这样做了,那么他为每十年单独计算的回归系数,是否会与为整个时期计算的最佳回归系数有较大差异呢?这是值得研究的。因为,对多元相关方法应用于复杂经济问题的主要初步反对意见在于,所研究的环境明显缺乏任何充分程度的一致性。
归纳上的困难不仅源于那些没有特别考虑到的因素缺乏统一性。在该研究计划所包括的那些情况下,也会出现这种情况。因为,由于误差范围很大,只有那些实际上显示出较大波动的因素才有可靠的影响。如果一个因素(其波动具有潜在的重要意义)实际上变化很小,那么如果它将要发生更剧烈的变化,可能就没有线索知道它会产生什么影响。丁伯根教授在一个段落中指出(第65页),在得出利率对投资影响的一个非常小的回归系数之后,这可以用这样一个事实来解释:在这段时期内,利率的变化非常小。
这许多的怀疑,由于所采用的大多数统计数据的可怕的不充分性而叠加在了一起的,这是一个如此明显和不可避免的困难,以至于几乎不值得对之加以深思。考虑到这所有因素,成功地将这种方法应用于商业周期这样一个极其复杂的问题,在我看来,以我们目前的知识水平,确实是一个非常没有前途的项目。
这并不意味着经济材料不能提供更多的基本案例,在这些案例中,这种方法将是富有成效的。以丁伯根教授的第三个例子为例,即交通增长率、铁路利润率、生铁价格和利率对铁路车辆净投资的影响。在这里,似乎有一个合理的初步理由预期某些必要条件得到满足。但即使在这种情况下,也可能需要一种与丁伯根教授所给出的截然不同的公式。很明显,无需特别询问,对新机车车辆的需求将主要取决于交通的增长。此外,利润并非独立于交通流量,而是很大程度上取决于交通流量的再次增长。为了得到一个单独的因素,有必要将由于交通流量的增长而产生的利润,与由于相对于工资和其他成本的更好的费率而产生的利润分开。我们想知道的不是这样一种显而易见的观点,即对车辆的需求大大影响交通流量的增长,而是这与下述这些更为微妙的因素相比能主导形势多么深远,这些微妙的因素包括:(1)现有的车辆,(2)现有工厂生产更多车辆的产能,以及(3)关于交通流量维持下去的信念状态,和对其他形式的运输方式竞争影响的信念状态。
我希望我没有冤枉一个勇敢的先锋的努力。这项研究所耗费的劳动一定非常巨大。这本书充满了智慧、独创性和坦率;我是带着对作者的敬意放下这本书的。但阅读它的过程对我来说一直是一场噩梦,我想,其他读者也会有同样的感受。我有一种感觉,丁伯根教授可能会同意我的大部分评论,但他的反应将是再使用10台计算机,把自己的悲伤淹没在算术之中。就1939年而言,这本书似乎是国际联盟的主要活动和存在理由,这本书是这种情况的一个奇怪的反映。



星标⭐我们不迷路!想要文章及时到,文末“在看”少不了!

点击搜索你感兴趣的内容吧

往期推荐


基本无害 | 第四章第一节(全)— 工具变量和因果关系

基本无害 | 使回归有意义 —— 附录:平均倒数加权函数的推导

基本无害 | 使回归有意义——回归的细节(全)

基本无害 | 管用的工具变量——工具变量和因果关系(三)

基本无害 | 管用的工具变量——工具变量和因果关系(二)

基本无害 | 管用的工具变量——工具变量和因果关系(一)




数据Seminar




这里是大数据、分析技术与学术研究的三叉路口


    欢迎扫描👇二维码添加关注    

点击下方“阅读全文”了解更多

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存