花开股市,相似几何:量化复盘全攻略
导读
1、本文尝试使用量化方法帮助投资者找出与当前时刻相似的历史时段,根据变量之间的欧式距离来刻画当前与任意历史时刻的相似度。我们选择了宏观经济、物价水平、利率环境、企业盈利与估值和市场情绪等大类因子来刻画市场环境,最终构建了一个24维度的因子库。
2、为了更加形象地刻画当前市场各维度与历史相似程度,我们构建了当前与历史的相似性热图,以便于直观展示不同时间段与关注时段在各大类维度的相似程度,这种展示方式具有普适性,不仅仅适用于本文所列举的因子和维度。
3、本文对2021年6月的多维度数据进行分析,发现当前与2010年和2017年均有一定的相似性,比较而言与2010年的相似维度更多,且当前的市场风格与2010年的重合度较高。参考2010年的资产走势,我们认为接下来一段时间A股将在盘整回调后逐步反弹,大宗商品仍保持向上形态;根据2010年的市场风格启示,未来小盘有望持续跑赢大盘,周期和成长有望成为全年表现最好的风格。
4、为了测试模型的稳健性,我们对状态识别模型在极端环境下(如经济大幅回落、恐慌情绪骤升时)是否有效进行了验证,从测试结果来看也非常有效。
风险提示:模型结果基于历史数据的测算,在市场环境转变时模型存在失效的风险。
报告正文
古人云“以史为镜,可以知兴替”,历史这面镜子不仅可以照射出国家兴亡的原因,还可以作为后世之人学习思辨的素材。无论是在生活还是投资中我们常常会对历史事件复盘,并将总结得到的规律作为决策时的重要参考,因为将当前的关心的事物与历史经验进行比较是人们的习惯,也是一种实用性较强的做法,尤其在当在我们试图预测事物未来的发展时,历史信息或许可以提供一些有价值的视角。
在二级市场中,研究人员经常试图将不同时间段的市场环境划分为不同的“状态”,通过对各个维度进行比较和分析,从而了解当前市场的所处位置。我们将这种研究行为一般称之为“复盘”,尤其是极端行情的复盘颇具指导意义。但历史样本较多,视角亦较为繁杂,有没有一种比较好的量化的方式或者手段协助我们去完成“复盘”呢?这正是本文研究的出发点。
本篇报告尝试使用量化的方法构建系统化模型,并通过对当前的指标状态与历史状态进行比较,将状态识别问题转化成概率问题,从而找出与当前时刻相似的历史时间段;在此基础上结合基本面情况与背后的逻辑展开分析,从而构建“基本面+量化”的模型体系。在研究结论的呈现方式上,我们构建了当前与历史的相似性热图,以便于直观展示不同时间段与关注时段分别在各个维度的相似程度。
本篇报告的结构安排如下:
在报告的第一章,我们介绍了市场状态的主流观测方式,进一步对这些方法的优缺点展开分析。
从第二章开始,我们尝试用量化的手段对历史进行复盘,并构建了多维度状态识别模型;为了全方位描述市场环境,本文从逻辑层面构建了宏观经济、物价水平、利率环境、企业盈利与估值和市场情绪这五大类因子,并使用变量之间的距离来刻画当前与任意历史时刻的相似度。
在完成模型的介绍之后,我们在第三章中对当前时刻的市场环境进行了分析,根据模型的测试结果,当前与2010年和2017年的市场环境在多个维度均具有一定的相似性,并利用热图展示了当前时刻与全局的相似性程度。
进一步,为了探究状态识别模型在极端情形下(如经济大幅回落、恐慌情绪骤升时)是否有效,在本文的第五章中,我们以2020年2-3月作为分析窗口,发现当时的市场环境与2008年金融危机相似度极高,并且资产走势与市场风格也有一定的相似规律。
最后一部分是本篇报告的总结与展望。
1、市场状态的观测方式
目前对于市场状态的主流观测方式主要基于经济周期理论,通常而言经济周期描述了整体经济活动的周期性波动,即当前是处于扩张还是收缩的状态。具体而言,在描述经济状态的时候我们不仅仅观察总量结构,也会参考投资、消费和出口等分项指标。根据历史研究结论,每轮周期将周而复始地经历繁荣与萧条,但是每轮经济周期并不完全相同,可能体现在资产表现与波动幅度上,也可能归结于内在驱动因素的差异上。
按照周期波动的时间长短,主要的经济周期有基钦周期(短周期)、朱格拉周期(中周期)、库兹涅茨周期(中长周期)和康德拉季耶夫周期(长周期),不同周期的观察角度各有不同,如基钦周期主要从库存的角度去研究和观察经济波动,而库兹涅茨周期主要以建筑业周期性波动作为划分的主要依据。由于在实际投资中无法直接观测经济周期,我们只能使用宏观数据进行测量,常见的宏观处理方式是按照一定标准选择有效反映经济波动的指标,并根据数量化方法将各类指标合成为景气指数来描述当前的周期状态。美国经济研究局(NBER)对美国经济周期进行了研究,并在其官网上公布了对1854年以来经济状态的划分(参考http://wwwdev.nber.org/cycles/cyclesmain.html),国内暂时没有划分经济周期的权威参考。
近年来计量模型在经济状态转换相关方面的研究也在不断深入,其中一种常见的研究思路是使用隐马尔可夫模型(HMM)来推断金融市场当前的状态。作为一种黑箱模型,HMM的优点是能够探测到金融市场状态的突然转换,但是由于模型本身较为复杂,且无法提供直观的逻辑支撑,考虑到国内宏观数据的发布频率通常为月度,不足以提供大量的数据样本进行学习,加之模型失效的时候难以给出合理的解释,这类机器学习模型在实际投资中偶被诟病。
2、多维度状态识别模型的构建
2.1
如何将状态识别转化为概率问题
我们经常能听到一种话术—“当前的市场环境与XX时间段非常相似”,观点提出者通常从主观的角度出发,使用多个维度的指标对历史时段与当前进行比较或者复盘,结合指标的变化趋势并根据背后的逻辑得到相应的结论。我们觉得以上的分析方式是直观的,不仅考虑了指标的逻辑,而且相较于复杂的黑匣子模型也更易于理解和接受,我们希望能从这个简单逻辑出发,用定量的方法找出与当前相似的时间段。
在建模之前,我们需要重新定义“相似”的概念,“人不能两次踏进同一条河流”,宇宙万物在时空轮转中发生运动和变化,因此我们认为历史上的每个时期都是独一无二的,没有两个时期能100%相同,所以不妨将描述“相似度”的问题转化为类概率问题。如果有A时间段与现在时刻的相似度为50%,而B时间段与现在时刻的相似度为95%,那么我们认为B时间段与现在时刻更为相似。
2.2
大类因子选择
在上文中,我们使用数量化的模型重新定义了状态的相似性,并将“相似”这个概念从抽象感受转化为直观的欧式距离,在本部分中我们将目光聚焦于如何选择合适的代理指标,从而达到全方位刻画市场环境的目的。
因为状态的刻画是多维度的,我们可能很难从整体上找到一个与当前环境极为相似的时间,但是如果将状态进行分解,我们可能找到在某一个维度上与当前时刻非常相似的时间,所以在具体分析的时候我们将整体拆分成多个维度进行观察,最终我们观察的大类维度一共划分为五大类,分别是宏观经济、物价水平、利率环境、企业盈利与估值和市场情绪,在选择具体的代理指标时,我们会考虑指标的逻辑、市场的关注程度以及因子的相关性,同时我们不希望引入过多数量的代理指标,因为当因子数量过多时,可能会很难找到与当前相似度较高的时刻,而且可能会陷入“数据陷阱”。
宏观经济:主要反映的是实体经济的景气程度,包括了制造业、进出口、投资、零售等具体部分,这些维度从不同方面反映了经济的发展状况,当实体经济向好时,一般企业盈利也能产生较明显的改善,虽然从2014年以来宏观经济波动与大类资产表现的相关性趋弱(2020年经济快速复苏以来经济与股票的相关性显著走高),但是宏观经济仍然我们是观察市场状态时重点关注的角度。
物价水平:物价水平能反映市场的通胀情况,观察的指标包含CPI、PPI以及大宗商品价格指数等,通常认为温和的通胀表明经济发展较为平稳,当发生显著的通货膨胀和紧缩时,可能会影响到货币政策的松紧程度,2021年以来PPI持续走高,结构性通胀一度成为市场关注的焦点。
利率环境:利率环境与大类资产的走势有着密切的关系。以股票为例,当利率下行(环境宽松)的时候,一方面企业的融资成本下降,同时折现率降低,股票的内在价值从而会上升;另一方面,流动性宽松的时候,市场上的资金增加从而有更多的资金入市,成交更加活跃,使得股市出现“量价齐升”的繁荣局面;而且对市场进行复盘不难发现,历史上的多次大行情都是无风险利率下降从而形成牛市催化剂,而无风险利率快速上升时股市则面临调整风险,所以利率环境的重要性不言而喻。
企业盈利与估值:股票市场的投资最终要落实到个股层面,对于单只股票而言,盈利能力和估值水平是投资者极为关注的角度,具有低估值且高盈利能力的资产长期受到投资者的青睐。基于全局视角,我们也将关注全市场股票的整体盈利和估值水平,但由于个股财务数据的发布频率为季度,所以观察数据相对较少。
市场情绪:投资者情绪可以作为风险偏好的重要观察指标。风险偏好是喜欢收益的波动性胜于收益的稳定性的态度,短期的风险偏好很大程度决定了股市的走向,当市场的风险偏好增加时,投资者参与市场的意愿增强,入市资金增多,从而带动股市上行。对历史数据进行观察我们发现,在90%的时间中市场情绪都处于偏温和的水平,此时可能难以找出与当前时刻相似的时段(因为相差较小),因此当市场情绪指标出现了极端值的时候,提示风险或机会的参考意义更大。
在选择代理变量的时候,我们依循以下的原则进行:
(1)代理变量的逻辑被市场投资者所广泛认可,且受市场关注度较高(例如PMI、CPI、VIX等指标),因为这种类型的因子可能更容易解释或影响各类资产的历史表现,研究此类因子的相对价值较高。
(2)尽量选择历史数据较长的代理变量,同时我们希望长期来看代理变量的趋势呈现一定的历史周期规律。
(3)需要避免短期的锯齿状数据而引入噪音,比如我们使用FR007互换利率来代替短期波动较大的R007,以及使用日度数据的均值来代表每月的VIX水平。
(4)在同一大类的代理变量中,避免各因子相关性过高而带来的信息重复问题。
(5)代理变量的口径尽量保持不变或变动次数较少,因为口径反复变动的数据可能会影响历史的回测结果。
根据以上的标准,我们构建了多维度状态识别模型的因子表,观察时间从2005年开始,观察频率为月度。在宏观经济维度,我们选择PMI、工业增加值同比、工业企业利润同比、固定资产投资完成额累计同比和社会消费品零售总额同比等指标作为代理变量;在物价水平维度,使用CPI同比和PPI同比作为代理变量;在利率大类中,使用FR007的一年期互换利率和期限利差作为代理变量;在企业盈利与估值维度,则使用Wind全A的归母净利润同比增长率((∑(成份股当年当期净利润)/∑(成份股上年同期净利润)-1)*100%)和Wind全 A的股权风险溢价(1/PE-无风险利率)作为代理变量;在市场情绪维度,使用Wind全A的月均换手率和基于上证50ETF期权的VIX月度均值作为代理变量(由于上证50ETF期权上市时间为2015年,为了保证数据的完整性,在2005年到期权上市之前的VIX数据均由标的资产的历史波动率拟合得到)。
值得注意的是,我们在观察市场的时候不仅要关注这些指标的绝对水平,也要关注其边际变化,所以对于绝大部分代理指标我们同时使用了因子及其边际变化水平的历史所处分位点水平,只有部分明显具有趋势性的因子我们仅仅观察其边际变化,所以最终我们构建了一个5大类24维度的因子库。
3、当前市场环境与哪一段历史时间相似?
在介绍了模型的思路与测算方法之后,我们将从多个维度对当前市场环境进行分析,并试图回答当前与哪一段历史时间更加相似的这个问题。由于7月大部分的经济和金融数据还未公布,我们在此使用已公布的6月数据进行分析。
3.1
宏观经济
根据模型测算的相似性结果,在宏观经济维度当前时点与两时段的相似性较为显著:第一个时间段是从2010年下半年开始到2012年初经济从高增长的平台逐步回归的过程;第二个时间段是2017年。
首先,根据经济增长趋势的角度分析,无论是2010年还是2017年,均经历了不同程度的经历复苏,并处于复苏通道的拐点,按照我们的相似度测试结果,2020年3月以来持续的经济复苏或正处于拐点。
2010年全球经济整体呈现复苏形态,在刺激计划下中国从2009年开始以较快增速恢复增长,2010年的经济数据整体非常耀眼:其中GDP全年增速为10.6%,固定资产投资同比增速为24.5%,工业增加值和企业利润同比增速都保持着两位数的增长,外需回暖带动进出口数据也非常亮眼。但是从事后来看,2010年是经济增长的拐点,主要经济指标从此开始进入了漫长的下行通道,GDP同比的高点12.2%出现在2010年一季度,随后开始出现了回落。
2017年全球主要经济体复苏,摩根大通全球制造业PMI指数从2016年5月开始回升,2017年更是屡创新高,同时美日欧的GDP增速也出现了显著的回升。我国GDP增速数据虽然没有大幅提升,但是在供给侧改革驱动下,工业企业利润同比增速有明显提升,全年的累计同比增速为21%,而2016年同期数值仅为8.5%;而且从结构上来看,2017年的出口数据扭转了持续下降的局面,季调后的出口金额同比在2017年3月为16.9%。2017年12个月的PMI均大于51,且2017年的9月达到了52.4的高点,但是2018年开始大部分经济数据出现回落。
受益于内需和外需的回暖,从2020年3月以来我国经济快速爬坡,PMI持续位于荣枯线以上,2021年一季度GDP达到了18.3%的高点,二季度回落至7.9%,表明我国经济持续稳定恢复,但是动能已趋缓。截至2021年6月,PMI为50.9,工业增加值同比为8.3%,工业企业利润总额同比为20%,包括固定资产投资和社零数据之内的多项经济数据都较前期有一定的边际回落。
3.2
物价水平
根据模型的测算结果,当前的通胀水平与2017年上半年的相似度较高,其中与2017年3月的相似度超过了90%。2021年6月的CPI同比为1.1%,PPI同比为8.8%,分别处于2005年以来的13%和97%分位点;2017年3月CPI同比和PPI同比的数值分别为0.9%和7.6%,处于历史的10%和94%分位点。
回看2017年,在供给侧改革的背景下,国内去产能对供给形成了冲击,大宗商品价格上行,呈现出PPI走高、CPI相对稳定的结构性通胀特征。PPI同比数值在2017年2月达到了7.8%,达到了2012年以来的最高水平,随后开始震荡下行;CPI则一直处于低位运行,主要原因是食品价格涨幅较低。
从2020年3月以来,PPI的持续回升主要是由于大宗商品价格快速上涨,其背后的原因有两点,一方面是因为经济持续恢复,由于疫情等多方面的因素,需求的修复可能快于供给,加速了商品价格的上涨;另一方面是因为由于碳中和政策对高碳排放原材料限产,供需缺口走阔推动了大宗商品的快速上涨。2021年以来全球通胀预期升温,国内出现了明显的结构性通胀,表现为PPI高企但是并未传导至CPI,目前来看大宗商品价格仍然维持上涨趋势,PPI同比近期仍处于震荡或者小幅上涨走势,拉长时间来看将大概率下行。
3.3
企业盈利与估值
根据模型的测算结果,当前的企业盈利与市场整体估值与2010年下半年相似性较高,目前与2010年9月数据的相似度高达94%,无论是从所处周期位置还是未来的演绎方向,都可以捕捉到部分相似点。
下图表展示了归母净利润的同比增长率以及Wind全A的股权风险溢价(两黑色框线的时间段分别为2010年三季度与2021年6月左右)。从盈利角度分析,当前时刻与2010年三季度无论是在周期位置还是在节奏上都非常相似;在经历了金融危机的低谷之后,A股上市公司的归母净利润同比增速从2009年一季度降至-26%后逐步反弹,并在2010年一季度达到63%,从谷底到峰值的回暖历时大约为1年,2010年三季度Wind全A的归母净利润同比增速为35%,处于2005年以来的86%分位点;受到疫情的冲击,2020年一季度的归母净利润同比增速降至-25%,随后开始触底反弹,2021年一季度的归母净利润同比增速为53%(中报还未全部披露),处于近五年以来的最高水平,回暖的历时时间也约为1年左右,而且当前的数值处于历史的91%分位点。
从相对估值的角度分析,2010年9月Wind全A的股权风险溢价为1.82%,处于2005年以来的51%分位点;截至2021年6月底,Wind全A的股权风险溢价为1.71%,处于历史的48%分位点,目前的估值与2010年9月的水平也非常接近。
3.4
利率环境和市场情绪
从当前的利率环境和市场情绪来看,整体货币政策维持中性,且市场情绪并未处于明显的高涨或恐慌中,所以这两个指标测试得到的结果并不显著,在这里未展示利率环境和市场情绪维度与2021年6月相似度排名前10的时间列表。下图表展示了利率环境观察指标与市场情绪观察指标的历史情况。
截至2021年6月30日,FR007互换利率和期限利差处于历史观察窗口的30%和39%分位点,近期央行宣布降准后市场对宽松的预期升温,叠加经济基本面边际下滑趋势显现,流动性宽松程度大超预期,7月份的利率明显下行。
当市场情绪指标处于极端值时对投资的指导意义较强,截至2021年6月,Wind全A的月均换手率和VIX处于历史观察窗口的61%和24%分位点水平,表明当前市场整体较为活跃且并未出现恐慌。
3.5
构建当前与历史的相似性热图
分别对以上维度进行分析之后,我们就当前的市场环境与历史的相似度进行简单的总结:
(1)在经济增长维度,我们认为当前与两个时间点的相似度较高,分别是2010年和2017年。2010年和2017年均经历了经济复苏见顶后的缓慢回落,我们认为当前可能是经济的边际增长逐步变缓甚至回归到常态的拐点。从背后的逻辑来看,2009年-2010年的经济复苏是在金融风暴后,全球回暖与政府推出“四万亿”刺激后的强势复苏的结果;2017年由于全球制造业复苏,为国内的经济增长提供了较好的外部环境,同时国内推行的供给侧改革有助于结构改善,带来了一波经济的平稳复苏;而2020年3月以来,国内疫情率先得到了控制,受益全球流动性的宽松和于内外需的共振回暖,国内经济从2020年二季度开始快速恢复。
(2)在物价水平维度,当前的通胀水平与2017年上半年的相似度较高,均出现了PPI较高但CPI不高的结构性通胀,由于近期大宗商品价格还在持续上升,我们认为近期PPI同比或高位震荡,但是下半年有望趋势向下。从背后的原因分析,2017年出现结构性通胀的主要原因是在全球制造业复苏和供给侧改革的背景下,国内去产能对供给形成了冲击,上游原材料的价格持续攀升;而当前出现的结构性通胀是在全球经济复苏背景下,供给的恢复慢于需求,叠加碳中和政策供需缺口走阔,大宗商品持续上涨的结果。
(3)在企业盈利和估值维度,市场的利润增速和风险溢价与2010年下半年相似度较高,2021年一季度A股上市公司的净利润增速处于历史的偏高水平。2010年与2021年净利润增速的快速提升均是因为经济复苏带动的企业盈利好转,且这两轮的节奏和峰值所处位置都具有极强的相似性。
(4)在无法量化的政策维度,今年以来的行业调控政策与2010年也有一定的相似性。2010年国家政策对房地产市场开始收紧,分别在1月、4月和9月开展了三轮调控,遏制房价过快上涨势头;2021年以来,为了遏制大中城市的房价上涨,持续强调“房住不炒”的立场且调控政策不断升级。除此之外,近期提出的“双减政策”也对校外培训行业进行了规范。
为了更加形象地刻画当前市场各维度与历史相似程度,我们构建了当前与历史的相似性热图,以便于直观展示不同时间段与关注时段分别在宏观经济、物价水平、利率环境、企业盈利与估值以及市场情绪的相似度。横轴表示时间(默认当前为关注时刻),每个时间对应的颜色深浅表示与关注时刻的相似度高低,越红表示该历史时刻与所关注时刻的相似度越高,颜色越蓝则表示该历史时刻与所关注时刻的相似度越低。
下图展示了2021年6月与历史时刻在各维度的相似性,我们可以一目了然地看出当前时刻与历史哪个区间的相似度较高,与哪个区间的相似度较低。图中的五个子热图分别表示不同维度的情况,以宏观经济维度(最上面的子图)为例,时间轴的最右端表示2021年6月(当前时刻),可以看到2010-2012年与2016年底-2017年部分时间段的颜色与当前时刻最接近(偏红),证明这两个时间段与当前时刻的相似性非常高;而2008年底-2009年初与2020年初时间段的颜色与当前时刻的差异性非常明显(偏蓝),证明这两个时间段与当前时刻最不相似,这个结果也是符合我们的逻辑认知的,因为这两个时段宏观经济大幅下滑,与当前经济复苏的环境截然不同。同样的,从物价水平角度进行分析,根据下图可以看出当前时刻与2017年和2006年的相似性较高,与2019-2020年初的相似度较低。
综上,我们认为当前与历史的相似性热图是一种帮助我们全面快速了解各个维度与关注时刻相似性的观察途径,在确定了因子之后,对于任意关注的时间,只需要通过热图就可以展示出各个维度的情况,对于投资者认知市场有一定的帮助。所以通过相似度和热度图(一个模型+一个工具),我们很好的解决了我们开篇提到的问题:如何通过量化的手段协助我们进行历史的复盘?
3.6
历史对未来投资的借鉴
在上述分析的基础上,我们希望探究与当前相似时段的市场走势对后市投资是否具有启示作用。结合上文的分析,综合而言我们认为当前时刻与2010年的市场环境更为相似,下面我们首先从股票和大宗商品这两类资产表现的走势进行分析。
大类资产
分别以2010年4月和2021年1月作为时间起始点,并往后窥视未来一年(250个交易日)的资产表现。不难发现Wind全A在2010年和2021年至今的整体走势非常相似,2021年以来经历了震荡向上-快速回调-再次企稳回升的形态,由于近期的行业政策影响了短期风险偏好,权益资产在7月底剧烈回调,目前已经显著反弹,如果接下来权益资产的走势仍然与2010年仍然相似,将经历盘整回调-逐步反弹的走势。
CRB现货指数从今年年初以来持续上行,回看2010年的走势,除开在2010年5月有过短暂的回调,其他时间均保持上涨的趋势,因此我们预计大宗商品近期将保持向上形态。
市场风格
从市场风格来看,2010年的市场风格与当前也具有一定的相似性,体现为指数较为平淡,但是结构产生了明显的分化。从市值角度分析,小盘的表现要好于大盘,在2010年4月-2011年3月期间,Wind全A微跌-0.43%,沪深300下跌3.66%,同期中证1000上涨9.60%;截至2021年7月30日,Wind全A上涨2.19%,沪深300下跌7.68%,中证1000大涨9.27%。
周期和成长风格表现亮眼,超额收益非常显著。受益于复苏后大宗商品价格上涨,2010年前三季度流动性较为充裕以及科技产业周期的启动,2010年4月到2011年3月期间周期和成长风格的区间收益率分别为11.49%和12.07%,表现极其亮眼。今年以来市场风格也呈现了类似的规律,周期和成长风格的区间收益率分别为14.72%和13.97%,我们认为当前占优风格未来有望持续。
4、极端市场行情下模型的有效性探讨
在上部分中,我们根据模型的结果并结合基本面的情况对当前的市场环境进行了分析,下面我们将测试状态识别模型在极端环境下是否有效。我们将以2020年2-3月为例,对当时牵动人心的市场进行分析,也同时检验模型在极端情形下是否能准确回溯历史,进一步探究模型是否能对投资决策起到帮助。
4.1
案例分析:以2020年2-3月为例
2020年2-3月期间由于新冠肺炎在全球多地快速蔓延,经济进入危机模式,投资者情绪陷入恐慌,甚至有人认为全球将再次出现金融危机,主要股指也经历了大幅调整,在2020年2月3日上证综指单日暴跌7.7%。为了应对公共卫生事件对经济带来的负面影响,全球央行大量投放流动性,3月美联储宣布基准利率下调50个BP,这是2008年金融危机以来首次紧急降息;国内的流动性也出现了极度宽松的局面。时至一年多后的现在,新冠肺炎对整个市场环境的影响仍然是巨大的,下面我们将站在2020年2-3月,回顾当时的市场环境,尤其是在面临突变的宏观经济形势、快速转松的利率环境与陷入恐慌的市场情绪下,在各个维度找出与其相似的历史时间。
宏观经济
从宏观经济维度分析,下表列出了与2020年2月相似度较高的时间段,可以看到 2008年10月与11月与2020年2月的经济环境相似度极高,相似度分别为79.94%和86.89%。从触发原因来看,2008年金融危机爆发是由于美国杠杆率过高引发的恶性传导,而2020年全球经济衰退是由于新冠肺炎蔓延导致经济停摆,当时的杠杆率并不高,但是从结果来看这两段时间对经济表现出来的冲击有明显的相似性。
2020年2月份受到新冠肺炎的快速冲击,经济活动被迫全面停摆,部分经济数据也创下了历史的最低记录。2020年一季度我国的GDP为-6.8%,这是历史以来首次出现了GDP的负增长,2020年1月的PMI为50,2月底PMI数值跌落至35.7,1-2月的工业增加值同比为-13.5%,受到疫情和春节假期延长的影响,2020年2月的出口同比增速下滑至-40.61%。
2008年9月份开始全球经济出现了断崖式的下滑。从国际环境来看,美国和欧元区等主要经济体的GDP出现负增长;国内同样受到全球金融危机的冲击,PMI从9月的51.2直线滑落至11月的38.8,工业增加值同比数据在2009年1-2月下行至3.8%,跌至当时五年内的最低水平;出口增速也在四季度快速跳水,从2008年10月的19.29%下跌至2008年11月的-2.22%,随后在2009年一季度维持负增长。
除开相似度最高的2018年10-11月,根据下表中列出的相似月份可以看到各经济指标的边际变化大部分为负值,如宏观经济重新回归平淡的2019年(2019年4月)和2014年(2014年8月),但是变化幅度显著低于2020年和2008年。
企业盈利与估值
由于财务报表每季度披露一次,因此我们以2020年3月作为比较时点回溯历史的企业盈利与估值情况。根据模型的测算结果,2020年一季度末的企业盈利状况与2008年底的情况相似度较高,这两个时段的企业增速均出现了快速下挫,随后触底回升;从市场估值角度分析,由于市场显著调整,叠加利率快速向下,所以股权风险溢价均达到了历史的小高峰,当时股票市场的投资性价比较高,后期市场表现也证实了这一结论,股市从2009年1月和2020年4月开始持续回暖。
市场情绪
全球疫情冲击叠加股市下跌对投资者情绪影响最显著的时间为2020年3月,我们对此期间的国内市场的情绪进行了分析,根据模型的测算结果,2020年3月的市场情绪与2008年10月及其之后一段时间以及2016年1月的相似度较高。当时的市场情绪与2016年1月有一定相似性,是因为当时股市表现较差,叠加熔断机制加剧了投资者的恐慌情绪。
当市场遭遇黑天鹅事件时,投资者的恐慌情绪会快速蔓延,最直接的表现就是波动率指数的快速上升,下图展示了2020年2月和2008年9月之后40个交易日的表现,可以看到两段时间内波动率指数的走势基本一致,达到峰值的时分别为2020年的3月16日和2008年的10月22日。
整体而言,在对2020年2-3月的市场环境进行分析之后,我们认为当时的市场的宏观经济、企业盈利与估值以及市场情绪与2008年10-12月时间段的环境极为相似,下图展示了2020年2-3月的历史相似性热图,其中黑色框线分别为2008年10-12月和2020年2-3月。
4.2
结论对于投资的指导意义
大类资产
事后来看,在经过基本面和量化分析后得到的结论对2020年2-3月的投资具有一定的指导意义。首先从大类资产价格走势的角度分析,下图表展示了股票(Wind全A),利率债(中债国债总净价指数)、黄金(伦敦金现)和石油(WTI原油现货)分别在2008年9月和2020年2月开始后50个交易日内的表现,可以看到各大类资产的在两个时间段的整体走势非常相似,证明在极端情形下的市场仍然有重演历史的可能性,理解当前市场并准确地找到相似的历史阶段对投资意义重大。
市场风格
在金融危机爆发(2008年9-10月)和疫情扩散期间(2020年2-3月),各大类风格指数显著下行,所以在此我们比较危机和疫情尖峰过后一段时间的市场风格表现。
从市值角度观察,两次冲击过后的股市均出现了显著的反弹,但是在2009年小盘股的反弹显著强于大盘,2020年这一轮小盘仅略强于大盘,并未表现出明显的超额收益。从2008年11月开始的三个月内,Wind全A上涨29.31%,沪深300指数上涨22.18%,中证1000大涨50.87%;从2020年4月开始的三个月内,各大宽基指数的反弹程度要低于2008年,其中Wind全A上涨14.74%,沪深300指数上涨12.96%,中证1000上涨16.44%。
对中信五大风格指数进行分析,不难发现在两轮冲击后的三个月内,周期、消费和成长的相对表现较强。在2008年11月-2009年1月期间,周期、消费和成长涨幅排名前三,分别为32.19%、29.95%和48.91%;在2020年4月-2020年6月,它们的涨幅分别为7.69%、23.70%和19.53%,其中消费风格在2020年这一轮的涨幅排名第一。
5、总结
花开股市,相似几何?作为金融从业者,窥探未来是一种奢望,我们只能读史以观未来。
本文构建了宏观经济、物价水平、利率环境、企业盈利与估值和市场情绪五大观察维度,通过定义因子距离的远近来刻画市场环境的相似程度,并将状态识别问题转化成概率问题,从而找出与当前相似度较高的历史时刻,最终我们绘制了当前与历史的相似性热图,帮助投资者对历史全景进行扫描,以协助更好的进行历史“复盘”。
展望未来,我们认为本文提出的方法仍有提升和拓展的空间。在因子选择维度,本报告中我们是根据逻辑的合理性选出观察因子,而且目前仍为静态的因子库,未来我们可以搭建量化模型来选择观察因子,并考虑构建动态因子库;在策略构建维度,未来也可以考虑根据相似时刻的历史表现为学习样本,构建相应的市场择时模型。
风险提示:模型结果基于历史数据的测算,在市场环境转变时模型存在失效的风险。
注:文中报告节选自兴业证券经济与金融研究院已公开发布研究报告,具体报告内容及相关风险提示等详见完整版报告。
证券研究报告:《【兴证金工】花开股市,相似几何:量化复盘全攻略》
对外发布时间:2021年8月6日
报告发布机构:兴业证券股份有限公司(已获中国证监会许可的证券投资咨询业务资格)
--------------------------------------
分析师:郑兆磊
SAC执业证书编号:S0190520080006
E-mail: zhengzhaolei@xyzq.com.cn
分析师:刘海燕
SAC执业证书编号:S0190520080002
E-mail:liuhaiyan@xyzq.com.cn
--------------------------------------
更多量化最新资讯和研究成果,欢迎关注我们的微信公众平台(微信号:XYQuantResearch)!