【广发宏观陈礼清】如何对GDP进行月度估算?
广发证券资深宏观分析师 陈礼清 博士
chenliqing@gf.com.cn
广发宏观郭磊团队
报告摘要
第一,GDP是描述经济运行最为重要的指标,它衡量的是一个时段所有商品和服务的“综合增加值”,无疑比任何单一领域的经济数据都靠近于经济真实表现,也是我们判断增长周期位置和边际变化方向的主要依据。但目前的GDP数据公布频率最高也仅为季频,不利于市场实时跟踪经济变化,把GDP高频化具有重要意义。
第二,GDP如何高频化?一个最简单便捷的做法是用月度工业增加值同比去粗略估算月度GDP。工业增加值有“小GDP”之称,占GDP的比重超过30%,可以视为GDP的一个大样本;且经济中所有终端需求的变化,如出口、消费、资本开支,最终都会映射到工业生产上。从历史经验看,季度工业增加值与实际GDP之间具有同步性,1992年以来与GDP相关系数达0.93,变动方向一致率达84%。但一则在有些时段二者会有方向背离,比如在建筑业、第三产业波动较大的时候;二则二者的变动幅度不同,工增序列标准差为5.5,而实际GDP序列标准差仅为3.3。
第三,所以我们需要进一步去对模拟方法进行细化。GDP的核算有生产法、支出法、收入法,我们选择以生产法作为估计月度GDP的主要框架,支出法在指标选择方面提供补充。主要考虑到生产法下数据可得性较高、映射关系较为直接,而支出法下需要两阶段建模,会隐含着两层误差。
第四,方法一是用工业增加值、服务业生产指数建立两变量ARDL模型,其中“AR”部分表示GDP季同比过去值对当前GDP同比的影响,“DL”部分表示工业增加值、服务业生产指数当期同比,及两者的前期值(T-1期、T-2期……)对当前GDP同比(T期)的影响。这一方法拟合度较高,2017年以来误差平均0.01%;缺点是时效性有一定影响,需要等到每月15日经济数据公布。
第五,方法二是用工业增加值、社零、地产投资建立三变量ARDL模型。由于服务业生产指数只有2017年以来的数据,对观测过往的经济周期可能样本不够,我们用第三产业中占比相对较高的批发零售业、房地产业两个行业来替代。相较于方法一,这一方法在拟合优度没有损失过多的前提下,可以进行更长序列的月度GDP分析。当然,缺点同样是需要等待每月15日的经济数据公布。
第六,方法三是高频的三变量模型。为了能进行月度GDP同比的提前预测,我们选择工业增加值的代理指标工增同比扩散指数,社零的代理指标社零同步扩散指数,地产投资的代理指标30城商品房销售同比进行ARDL模型回归。这一模型的缺点在于拟合优度有所下降,需要进行误差调整;而优点相当于以此为代价换取提前15天左右的预测,至少可以当作一个环比方向上的参考。
第七,我们用方法一和方法二估算了2023年以来单月的GDP模拟同比增速,并对两种方法下的结果取平均值。这一测算方法下6-8月月度GDP同比分别为4.7%、4.1%、4.9%,8月经济较6-7月数据已初步回升,与我们报告中所说的“较为全面的边际好转”结论一致。今年二季度基数较低,为避免基数干扰导致二三季度不可比,我们进一步测算了这一方法下的两年复合增速,8月两年复合同比为4.2%左右的水平(年度4%的两年复合增速对应年度GDP增速5%左右),本轮经济的谷底在4-5月已经形成,7月是修复过程中的一个增速回撤点,但也高于4-5月。
报告简版
第一
GDP数据是衡量经济运行最为重要的指标,它衡量的是一个时段所有商品和服务的“综合增加值”,无疑比任何单一领域的经济数据都靠近于经济真实表现,也是我们判断增长周期位置和边际变化方向的主要依据。但目前的GDP数据公布频率最高也仅为季频,不利于市场实时跟踪经济变化,把GDP高频化具有重要意义。
金融市场越来越有效,所以宏观数据的高频化是一个趋势,比如用发电量、耗煤量、行业开工率等高频数据去观测工业部门;用地铁客运量、航班执行率等数据去观测居民部门;用航运运价等数据去观测出口表现。
GDP是一个更具综合性的衡量经济绩效的指标,涵盖了工业部门、服务业部门、对外部门,比任何单一指标都更靠近真实经济表现,GDP指标如果能进行高频化模拟,无疑具有重要意义。第二
GDP如何高频化?一个最简单便捷的做法是用月度工业增加值同比去粗略估算月度GDP。工业增加值有“小GDP”之称,占GDP的比重超过30%,可以视为GDP的一个大样本;且经济中所有终端需求的变化,如出口、消费、资本开支,最终都会映射到工业生产上。从历史经验看,季度工业增加值与实际GDP之间具有同步性,1992年以来与GDP相关系数达0.93,变动方向一致率达84%。但一则在有些时段二者会有方向背离,比如在建筑业、第三产业波动较大的时候;二则二者的变动幅度不同,工增序列标准差为5.5,而实际GDP序列标准差仅为3.3。
季度工业增加值与实际GDP的同步性体现在两个方面,一是两者自1992年至今的相关系数高达0.93。二是单纯看两者同比每月变动方向,一致率达到84%。
两者单季方向背离的20个季度大致分布在六个时间段,其中15个季度集中在2008年之前。近期方向背离的时段是在2014 Q4、2016Q2Q4,以及 2019Q1Q4。这些背离时段大部分同时是第三产业GDP、建筑业GDP与整体GDP变动方向相同的时间段,说明“背离”可能与第三产业GDP、建筑业GDP波动影响有关。
除了变动方向外,两者变动幅度也有所差异,从波动率看,季度实际GDP运行明显更为平稳,工增序列标准差为5.5,而实际GDP序列标准差仅为3.3。除了金融危机期间以及2020-21年基数干扰较大外,其余时间里,两者变化幅度上出现较大差异的时间段一是在2001年Q4至2003年Q1的上行周期中,工增提升较快且回升斜率较陡,而GDP同比虽同为增长,但回升缓慢,这背后可能是规模以下工业企业增加值增速平缓带来的。二是2014年至2016年,工增与GDP虽然趋势上均为回落,但工增回落幅度明显更大,并且单季出现过回升的时间点。这期间第三产业GDP同比表现持续增长,增长的幅度和工业GDP下降的幅度相当。
第三
所以我们需要进一步去对模拟方法进行细化。GDP的核算有生产法、支出法、收入法,我们选择以生产法作为估计月度GDP的主要框架,支出法在指标选择方面提供补充。主要考虑到生产法下数据可得性较高、映射关系较为直接,而支出法下需要两阶段建模,会隐含着两层误差。
第一,基于生产法框架估计的月度GDP可以直接和官方口径的季度GDP数据进行对比。而且支出法自身只有年度数据,对于建模的时效性和样本点来说都有所限制。
第二,我们估算月度GDP的核心逻辑是寻找月度层面的其他经济指标,这类经济指标与GDP存在映射关系。这种方式本质上就是生产法GDP中的“相关指标推算法”。从指标核算的方式本身来看,寻找替代指标进行建模的思路更接近于生产法框架下GDP核算方法。
第三,基于生产法框架的预测可以找到更准确的相关指标。从三次产业中各行业占GDP的比重可以看到,工业占GDP约32%,工业增加值本身与GDP一致,为增加值数据,用于建模的合理性较强。如果基于支出法估计月度GDP,建模时不能直接将社零、固投以及海关统计进出口差额对GDP建模。更好的方式是先分别对最终消费支出、资本形成总额以及货物服务净出口进行建模,得到转换系数,再进一步对GDP建模。这一过程中就会融入两层误差。
第四
方法一是用工业增加值、服务业生产指数建立两变量ARDL模型,其中“AR”部分表示GDP季同比过去值对当前GDP同比的影响,“DL”部分表示工业增加值、服务业生产指数当期同比,及两者的前期值(T-1期、T-2期……)对当前GDP同比(T期)的影响。这一方法拟合度较高,2017年以来误差平均0.01%;缺点是时效性有一定影响,需要等到每月15日经济数据公布。
从占比来看,工业占了第二产业的八成,我们用工业部门作为第二产业的代表;第三产业涉及行业繁杂,占比较大的是批发零售、金融、地产行业,但三者汇总后的占比也尚未超过第三产业的一半。我们直接利用统计局与2017年3月正式对外发布的服务业生产指数作为第三产业增加值的代理变量。
简单来说,工业增加值代表二产,服务业生产指数代表三产。模型选择ARDL(1,4,4),保留季度GDP滞后一阶,工增、服务业生产同比滞后4阶,解释力得到99.3%。这一模型优点在于两点,一则拟合度较高,2017年以来误差平均0.01%;二则指标最为简洁,逻辑清楚。缺点一是时效性欠佳,需要等到每月15日经济数据公布;二是服务业生产指数起始点为2017年3月,建模序列较短,难以用于进行长周期分析。
第五
方法二是用工业增加值、社零、地产投资建立三变量ARDL模型。由于服务业生产指数只有2017年以来的数据,对观测过往的经济周期可能样本不够。我们用第三产业中占比相对较高的批发零售业、房地产业两个行业来替代。相较于方法一,这一方法在拟合优度没有损失过多的前提下,可以进行更长序列的月度GDP分析。当然,缺点同样是需要等待每月15日的经济数据公布。
由于服务业生产指数自2017年开始公布,用该指标与工增同比进行月度GDP的估测只能获得自2017年3月起始的月度GDP指数序列,对于跟踪研究我国国内增长周期来说,样本点较少。第三产业中占比相对较高的批发零售业(占GDP约10%)与第三产业的GDP走势一致性也最高,相关系数达到0.78。其次是房地产业,统计上相关系数为0.77。
简单来说,工增代表第二产业GDP,社零代表第三产业中的批发零售项,地产投资代表第三产业中的房地产业项。建模具体方式与方法一类似,即季度序列建模定权重,月度自变量序列配权后合成月度GDP。模型选择ARDL(1,3,4,1),保留季度GDP滞后一阶和四阶,工增滞后3阶,社零滞后4阶,地产投资影响集中在当期,模型解释力96%。这一模型优点在于,由于自变量起始点较长,可以得到自1999年6月来的月度GDP同比,1999年以来预测平均误差在0.03%。拟合优度没有损失过多的前提下,我们可以进行更长序列的月度GDP分析。缺点同样是时效性欠佳,仍然需要等到每月15日经济数据公布;二是近期预测结果波动有所加大。
第六
方法三是高频的三变量模型。为了能进行月度GDP同比的提前预测,我们选择工业增加值的代理指标工增同比扩散指数,社零的代理指标社零同步扩散指数,地产投资的代理指标30城商品房销售同比进行ARDL模型回归。这一模型的缺点在于拟合优度有所下降,需要进行误差调整;而优点相当于以此为代价换取提前15天左右的预测,至少可以当作一个环比方向上的参考。
沿用方法二中思路建模,将能更高频获得的工增同比扩散指数、社零同步扩散指数、30城商品房销售同比与GDP同比进行ARDL回归,模型解释力92%。这一优点在于利用高频数据,可以在每个月月末得到当月月度GDP的估计值。缺点在于拟合优度有所下降,需要进行误差调整。本质上我们相当于牺牲了8%左右的拟合优度下降,以此来换取提前15天左右的预测。
第七
我们用方法一和方法二估算了2023年以来单月的GDP模拟同比增速,并对两种方法下的结果取平均值。这一测算方法下6-8月月度GDP同比分别为4.7%、4.1%、4.9%,8月经济较6-7月数据已初步回升,与我们报告中所说的“较为全面的边际好转”结论一致。今年二季度基数较低,为避免基数干扰导致二三季度不可比,我们进一步测算了这一方法下的两年复合增速,8月两年复合同比为4.2%左右的水平(4%的两年复合增速对应年度GDP增速5%左右),本轮经济的谷底在4-5月已经形成,7月是修复过程中的一个增速回撤点,但也高于4-5月。
风险提示:用于估测月度GDP的模型选择存在选择适用性问题;底层数据指标选择上,工增同步指数、社零同步指数所采用的高频数据或存在样本偏差、或存在遗漏变量问题;利用季度模型定权重中可能会高估或低估每月经济变量与每月GDP同比之间的关系。
目录
正文
PART1GDP高频化的意义金融市场越来越有效,所以宏观数据的高频化是一个趋势,GDP以外的其他高频指标虽然时效性强,但反映的经济活动范围窄于GDP。GDP数据是衡量经济运行最为重要的指标,它衡量的是一个时段所有商品和服务的“综合增加值”,无疑比任何单一领域的经济数据都靠近于经济真实表现,也是我们判断增长周期位置和边际变化方向的主要依据。
一个最简单便捷的“高频化”做法是用月度工业增加值同比去粗略估算月度GDP。工业增加值有“小GDP”之称,占GDP的比重超过30%,可以视为GDP的一个大样本;且经济中所有终端需求的变化,如出口、消费、资本开支,最终都会映射到工业生产上。
从历史经验看,季度工业增加值与实际GDP之间具有同步性。一是两者自1992年至今的相关系数高达0.93。
从核算方式看,GDP有生产法、收入法和支出法三种,但我们在分析中只采用生产、支出两种框架。这是因为在我国公布的GDP数据中,一类是通过生产法和收入法融合计算得到,按照季频和年频公布;另一类是通过支出法核算得到,按照年频公布。
PART4生产法框架为基底,支出法框架为辅助
我们选择以生产法作为估计月度GDP的主要框架,支出法在指标选择方面提供补充。主要考虑了生产法框架的三点优势:
(一)双变量生产法:利用工增、服务业生产指数
在生产法框架下估测月度GDP需要从我国产业结构入手寻找相应指标。从22年底的数据看,二三产合计占GDP比重达到了92.3%。从历史变化来看,第三产业的比重在逐年上升,第一和第二产业则占比逐年收缩,近年来基本保持稳定。从对GDP的拉动来看,第一产业拉动贡献小,并且自1994年以来较为稳定,平均拉动在0.08个百分点。而相对应的二产和三产,平均拉动在4.78%、3.54%。
第三产业涉及行业繁杂,占比较大的是批发零售、金融、地产行业,但三者汇总后的占比也尚未超过第三产业的一半。我们直接利用统计局与2017年3月正式对外发布的服务业生产指数作为第三产业增加值的代理变量。按照统计局定义,服务业生产指数涵盖了从批发零售到文娱的13个行业门类。从服务业生产指数当月同比与第三产业GDP同比的走势看,两者走势贴合度较高。而简单的线性回归也显示,服务业生产指数单一指标对第三产业GDP同比的解释力就能达到0.86。因此,服务业生产指数可以作为衡量第三产业GDP的代理指标。
这里需要注意是,在季度模型中的滞后一阶代表上一季度的变量,运用到月度自变量时,我们需要和三个月前的工业增加值月同比、服务业生产指数月同比交乘。同样地,季度模型中的滞后两阶代表上两个季度的变量。在和月度数据进行交乘时,交乘的对象是六个月前的工业增加值月同比、服务业生产指数月同比。
至此,我们可以得到GDP的月度指数。从走势看,相较于季度拟合,月度GDP指数与实际GDP同比整体趋势一致,季内呈现波动,比季度模型的颗粒度更细。
由这一模型预测的7-8月GDP同比为4.7%、5.3%,7月较6月回落1.4个百分点,8月较7月回升0.6个百分点。
从驱动因子看,自变量工增和服务业生产指数7月读数均较6月回落,工增同比回落0.7个百分点、服务业生产指数同比回落0.9个百分点。而8月两者又同时改善,前者回升0.8个百分点,后者提升1.1个百分点。
(二)三变量混合法:利用工增、社零、地产投资由于服务业生产指数自2017年开始公布,用该指标与工增同比进行月度GDP的估测只能获得自2017年3月起始的月度GDP指数序列,对于跟踪研究我国国内增长周期来说,样本点较少。那么是否有方式可以估测出跨度时间较长的月度GDP同比呢?第三产业中占比相对较高的批发零售业(占GDP约10%)与第三产业的GDP走势一致性也最高,相关系数达到0.78。其次是房地产业,统计上相关系数为0.77。第三产业中其他行业的GDP同比波动与第三产业整体GDP同比波动的相关性程度都明显低于这两个行业。
(三)三变量混合法:利用工增、社零、地产投资
(四)三种方法平均表现
风险提示:一是用于估测月度GDP的模型选择有待商榷,仍有待进行稳健性检验;二是底层数据指标选择上,工增同步指数、社零同步指数所采用的高频数据或存在样本偏差、或存在遗漏变量问题;三是利用季度模型定权重中可能会高估或低估每月经济变量与每月GDP同比之间的关系。
郭磊篇
【广发宏观郭磊】如何看7月出口
【广发宏观郭磊】宏观视角下的三个可能机会【广发宏观郭磊】对2023年的通胀数据来说只需确认两件事情【广发宏观郭磊】怎么评价前两个月的出口【广发宏观郭磊】对政府工作报告经济发展主要目标的理解【广发宏观郭磊】PMI和BCI均指向经济景气度高开【广发宏观郭磊、贺骁束】“PPI定买卖”:2006-2022年复盘
【广发宏观郭磊】1月通胀数据的中观细节【广发宏观郭磊】年初的以来的五大宏观定价线索【广发宏观郭磊】年初的PMI、BCI与同期资产反应逻辑
【广发宏观郭磊】万得全A疫情以来复合增速仍低于名义GDP
【广发宏观郭磊】本轮出口下行和历史上几轮周期的区别【广发宏观郭磊】待确认的PPI底【广发宏观郭磊】制造业投资的三因素框架【广发宏观郭磊】12月PMI的四个特征
吴棋滢篇
贺骁束篇
【广发宏观郭磊、贺骁束】“PPI定买卖”:2006-2022年复盘
钟林楠篇
【广发宏观钟林楠】如何看降准【广发宏观钟林楠】8月金融数据对资产定价环境的两个意义【广发宏观钟林楠】如何看近期流动性的变化
【广发宏观钟林楠】5年期LPR利率为何没有调整
【广发宏观钟林楠】如何看待6月LPR报价的变化
【广发宏观钟林楠、吴棋滢】地方政府债务九问【广发宏观钟林楠】信贷强势开局【广发宏观钟林楠】年初以来流动性环境的三个变化
王丹篇
【广发宏观王丹】原材料行业、计算机电子行业引领PMI边际改善
陈嘉荔篇
【广发宏观】美国非农、PMI数据及其对宏观面的影响
【广发宏观】美国核心通胀继续小幅回落
文永恒篇
陈礼清篇
本微信号推送内容仅供广发证券股份有限公司(下称“广发证券”)客户参考,其他的任何读者在订阅本微信号前,请自行评估接收相关推送内容的适当性,广发证券不会因订阅本微信号的行为或者收到、阅读本微信号推送内容而视相关人员为客户。
完整的投资观点应以广发证券研究所发布的完整报告为准。完整报告所载资料的来源及观点的出处皆被广发证券认为可靠,但广发证券不对其准确性或完整性做出任何保证,报告内容亦仅供参考。
在任何情况下,本微信号所推送信息或所表述的意见并不构成对任何人的投资建议。除非法律法规有明确规定,在任何情况下广发证券不对因使用本微信号的内容而引致的任何损失承担任何责任。读者不应以本微信号推送内容取代其独立判断或仅根据本微信号推送内容做出决策。
本微信号推送内容仅反映广发证券研究人员于发出完整报告当日的判断,可随时更改且不予通告。
本微信号及其推送内容的版权归广发证券所有,广发证券对本微信号及其推送内容保留一切法律权利。未经广发证券事先书面许可,任何机构或个人不得以任何形式翻版、复制、刊登、转载和引用,否则由此造成的一切不良后果及法律责任由私自翻版、复制、刊登、转载和引用者承担。