查看原文
其他

利率择时模型的效力与边界

刘郁 金川 乐蒙 郁言债市 2022-09-30










郁言债市数据平台

https://www.yuyanzhaishi.com

区域、城投、地产数据一网打尽

欢迎关注使用!


摘 要   


我们在此前发布的报告《预测长端利率,8191个变量组合给出的方向》中,搭建了一套基于Logistic模型的利率滚动择时方法。从回测结果来看,模型在历史回测中取得了约2/3的正确率。不过尚有1/3的预测结果与真实的利率运行方向出现偏差,由此便引出一系列问题:我们应该如何理解模型的效力和边界?以及模型的预测效果是否会在经济周期的不同阶段中表现出不同的效力?


早在最初的模型构想阶段,我们便对这样一套方法体系定下了一个清晰的方向——我们不希望模型偏向单纯的技术层面分析,或是不可观测的黑箱预测;反之,我们希望这套方法能够尽可能契合债市参与者在实际投研工作中的决策行为和逻辑,在此基础上利用数量化手段的绝对理性及计算效率优势,在清晰的经济含义下提供能够有效辅助债券投资的预测结果。


在这一过程中,数量化策略的优势便能充分体现。本质上,基于经济数据观测的决策过程其实就是一次较为严密的统计推断,借助计算机提供的运算效率,我们可以在很大程度上规避人脑运算的经验偏差。


然而,模型提供的高效和理性在不同的市场阶段可能成为影响模型效果的双刃剑。量化模型优势在于对数据规律的准确捕捉,然而在数据规律并非主导的时段,模型可能量面临阶段性失效。


总体来看,我们将可能影响模型效果的因素总结为三类:第一,利率模型提供的指向性更侧重于胜率层面,而在赔率因素影响逐渐放大的阶段,除模型输出结果外,需要提高其他交易层面变量的参考权重;


第二,在事件性冲击和政策变动频发的阶段,利率择时模型提供的数据规律可能受到短期情绪冲击的影响,致使效果下降;


第三,为保证参数估计质量,单个组别常存在不同程度的变量精简,对于部分信息的捕捉可能存在不足。在参考预测结果时,综合考虑多个组别的输出结果,可以缓解该因素的影响。


诚然,在单个模型中一次性解决上述问题并不现实。因而,在利率择时模型之外,我们还同时推出久期测算、杠杆率测算等刻画债券市场交易行为的工具,作为以基本面分析为根基的利率预测模型的补充。在模型预测正确率较低时,这些度量债市交易情绪的指标,可能会给出相对更为有效的信息。


核心假设风险。定量分析过程存在偏差,本报告结果仅供参考。



我们在此前发布的报告预测长端利率,8191个变量组合给出的方向中,搭建了一套基于Logistic模型的利率滚动择时方法,可以对长端利率中枢的月度变动方向进行有效预判。在报告构建的模型框架下,我们从经济增长、通胀、流动性和市场微观结构等不同方向,选取了基本面分析中常用的13个指标作为模型的解释变量,探究其对利率变动的影响。


然而,13个变量的参数估计问题,在一个以月度数据样本为基础的模型中,参数估计工作会面临很大的压力,因此我们一方面需要对解释变量进行精简,另一方面也需要尽量避免使用主成分分析等会破坏解释变量经济意义的降维手段。两相权衡后,我们最终使用穷举的方法,尝试了这13个变量所有可能组成的8191种变量组合,分别进行回测,从模型历史正判率和对应交易策略的累计收益率两个维度,筛选出历史中表现最为优异的20个变量组,作为下一期预测的基础。


最终,从2010年9月(模型所需的样本数据首次拥有足够的观测值)至2022年2月,模型的占优组合总体取得了约2/3的判断正确率,明显超过50%的中性水平,同时基于模型判断方向构建的久期调整策略也能较被动策略取得显著的超额收益。总体来看,模型无论是在历史测试中,还是在构建后超过半年的实际预判效果来看,都取得了较强的指向性。


对于一个择时模型而言,2/3的预测胜率已经较为可观,但尚有1/3的预测结果与真实的利率运行方向出现偏差,由此引出一系列问题:我们应该如何理解模型的效力和边界?以及模型的预测效果是否会在经济周期的不同阶段中表现出不同的效力?



1

连续正确预判后首现偏差,原因为何?


自2021年7月我们的基础模型构建完毕后,至2022年1月的7次预测中,有6次给出了正确预判,正判率达到85.7%,仅9月模型预测结果与长端利率实际方向不符,并且偏离幅度不大。其中,2021年10月长端利率中枢曾在持续下行趋势中出现过一个月的反转,而模型也成功对这一突变进行了正确预判。可以说,在模型构建伊始的超过半年时间内,模型取得了显著超越历史胜率的预测结果。


然而到了2022年2月,模型的预测结果却与现实利率变动出现了明显偏差。根据回测和预判结果,模型在本期筛选出的20个历史最优组合全部给出了长端利率倾向于下行的判断。然而,从实际情况来看,10Y国开收益率却从2022年1月30日的2.934%上行至2月28日的3.036%,对应上行幅度约10bp。在连续多次的准确预判后,这样的偏差不免令人疑惑,这一次究竟出现了什么变化,使得模型预测效果与真实情况出现了背离?为了回答这个问题,我们还需要从模型试图还原的现实情境说起。



早在最初的模型构想阶段,我们便对这样一套方法体系定下了一个清晰的方向——我们不希望模型偏向单纯的技术层面分析,或是不可观测的黑箱预测;反之,我们希望这套方法能够尽可能契合债市投资参与者在实际投研工作中的决策行为和逻辑,在此基础上利用数量化手段的绝对理性及计算效率优势,在清晰的经济含义下提供能够有效辅助债券投资的预测结果。


如前文所述,我们在模型中挑选了13个常用的经济和市场数据,作为基础解释变量。从表2陈列的变量列表可见,这些指标均为反映国内外经济和债券市场运行的客观数据,在传统的利率债基本面研究中被大量运用。在我们的模型中,每一次预测的决策点设定在当月的月末,试图还原的情境为:投资经理站在月末时点,观测到了当月披露的上一月度经济数据,以及日度公布的高频市场数据,需要在此基础上对接下来一个月的利率变动方向进行思考和判断。


这样的情境和实际的投资决策非常相似,此时,投研人员通常需要思考如下两个问题:第一,这些变量在历史中对利率的影响方向如何?尤其是在变量间存在相互影响和方向相悖的时候;第二,众多观测数据中,哪些变量才是效果相对稳定的核心变量,如何在众多变量中进行取舍。


在经典的基本面研究框架下,上述过程往往通过投研人员的经验与基础统计数据分析完成,并得出新一期的预测方向。而此时,数量化策略的优势便能充分体现。本质上,上述的决策过程其实就是一次较为严密的统计推断,借助计算机提供的运算效率,我们可以在很大程度上规避人脑运算的经验偏差。因此,在经济周期运行相对稳定,经济、市场数据与利率之前联动相对紧密的阶段,数量化模型在绝对的理性和高效下将体现出强大的效率优势,这也是为什么在此前超过半年中,模型几乎都能给出非常准确的预判结果。



然而,高效和理性在不同的市场阶段,可能成为影响模型效果的双刃剑。基于基本面数据的量化模型优势在于对数据规律的准确捕捉,然而,若在特定阶段,经济数据变化并非影响债市的主要矛盾,比如在政策预期主导的阶段,或者出现明显事件性冲击的阶段,若利用经济数据变化影响的历史规律对利率走势进行推演,则可能会出现阶段性偏差。那么,类似偏差的出现是否存在规律性?我们应该如何在经济周期的不同阶段调整对模型参考价值的重视程度呢?



2

从市场主导因素,理解模型的效力与边界


我们以2022年3月预测模型中筛选出的胜率最高变量组合为例,对模型的历史表现进行回溯。如图1所示,柱状图现实了每一次模型预判的结果——一个分布在0-1之间的概率,代表模型预测当月利率出现上行的可能性。根据Logistic模型预判结果的常用解读方式,若当次预测结果大于0.5,我们便认为模型做出了一次倾向于“1”情形的判断,即模型预测利率将会上行;反之,当预测结果小于0.5时,则可认为模型做出了倾向于0情形的判断,即利率下行。对于历史中的预测结果,如果模型给出的是正确判断,那么我们便在图1中将其标注为蓝色,例如2021年12月,模型输出结果为0.23,倾向于下行,而当月利率确实也出现下行,那么对应的柱形为蓝色,反之则为黄色(例如2022年2月)。


从模型的预测结果来看,大多数时间内模型都对利率变化方向做出了正确判断,而误判出现的分布也较为均匀,并未出现超过半年等持续时间较长的连续误判。但总体来看,我们仍然观测到两段时间相对比较集中的误判发生时期,分别出现在2016年2月至年末,以及2019年末至2020年初。其中,2016年模型曾出现过连续4个月的判断错误,同时这也是模型回测区间内最长的连续错误周期。而在其余时间内,模型均能取得较为平稳的预测效果。


那么,这两段时期内,债市有哪些特点?哪些变化是对应时期引发市场波动的主导因素?我们能否从中总结出模型有效性的阶段性特点,以及历史中的制约因素呢?


首先,观察两段模型表现相对较弱的时间,我们可以发现两个明显特点:


第一,两次集中误判都发生在利率行情的牛熊切换时期,彼时长短利率中枢均处于阶段性下行的末期阶段,绝对水平位于历史低位;


第二,两个阶段均出现了较为重大的政策变化或事件性冲击——正如近期的市场环境一样。


接下来,我们将以这两段历史周期为例,分析模型表现可能持续出于弱势的市场环境和外部变化。



2016年:低赔率和政策变化的双重作用


回溯2016年的误判高发期的模型判断及输入变量情况,表3中标注为蓝色列的系误判月份。2016年2-4月,在持续2年的债牛之后,10Y国开利率中枢已下降至3.1%附近,处于历史绝对低位。在这样的市场环境下,量化择时模型的弱项之一开始显现:从胜率-赔率框架的角度出发,模型基于市场数据预测利率变动方向的思路属典型的胜率预判,但如果利率中枢本身已经处在历史低位,那么投资者在决策时对于赔率因素的权重将会大大提升。


在2016年2-12月的11个月度中,基于观测数据,模型共给出了10次继续看多的预测结果,这也在很大程度上解释了这一阶段频繁误判的原因——利率终究由交易行为决定,赔率因素影响较强的环境下,虽然经济数据仍然具有支撑利率下行的动力,但投资者继续选择做多的力量会比债牛中前期明显受到更多阻碍。最终,长端利率的实际表现为低位下的区间震荡。


第二个对于模型效果形成干扰的因素可能是这一阶段的政策变化,以及政策反映到经济数据中的滞后性。例如,2016Q2开始经济复苏迹象已经初现,而已经体现出过热迹象的地产市场也开始了新一轮政策收紧。2016年3月下旬开始,在政策空前宽松的背景下,深圳、深海、南京等房价快速上涨的地区密集出台收紧政策,而随着10月后大面积的限购限贷政策出台,本轮地产宽松周期正式结束,同时也预示着经济增速已经企稳,长端利率中枢承压。而这些政策主导的因素变化反应到模型输入变量时则存在一定时滞,真正引发模型持续做出利率上行判断时,已是2017年。


最后,模型对于变量组合的精简可能导致部分信息遗漏。例如,在本轮误判高发周期,货币政策自2016年8月开始出现收紧的信号,重启14天逆回购,提高债市加杠杆的资金成本。然而,反映货币市场价格的R007变量则没有出现在这一组合当中,毕竟在有限样本下,变量的完整性和参数估计的难度往往难以两全。不过,相比起前两个问题,变量精简后的信息损失我们已经在模型构建时,通过综合参考20组占优组合输出结果的方式进行化解。



2019-2020年:同样的低赔率,叠加意外的疫情冲击


回溯2019-2020年的误判高发期,有一个特点与2016年极为相似——利率中枢均处在牛熊切换阶段的低位期。2019年5月,10Y国开利率已由前期超过5%的高点回落至3.5%左右的水平,伴随行情而至的则是日益让人在意的赔率因素。在2019年9-12月,模型4次给出了下行判断,而其中3个月都处于震荡上行状态。其实,从模型输入变量的变化来看,经济企稳的趋势已经在2020年初显现。


而到了2020年,突如其来的疫情使得市场整体受到了近年来较为严重的一次事件性冲击。这一阶段,市场环境与模型的预测结果可能经由两个途径出现错位:第一相较于观测期经济数据的边际变化,市场对突发疫情的担忧和由此引发的非理性情绪将在更大程度上影响市场的投资行为,致使实际的利率变动方向与统计规律出现错位;第二在模型输入数据开始体现疫情的剧烈冲击后,许多关键变量的输入值出现了大幅突变,例如2020年3月观测到的经济增速、地产销售等数据都出现了脱离前期统计规律的变化,而在将这些观测样本带入经由前期历史数据估计的参数组合后,输出的结果在稳定性方面也会有明显下降。




3

客观认识模型的效力,注重模型的边界


综上,我们前期构建的利率预测模型,依靠统计规律归纳能力,在历史回测中取得了整体不俗的表现,但同样会在经济周期的不同阶段出现预判正确率较高和预判正确率较低的时期。


总体来看,我们将可能削弱模型预测效果的因素总结为三类:


第一,利率模型提供的指向性更侧重于胜率层面,而在赔率因素影响逐渐放大的阶段,除模型输出结果外,需要提高其他交易层面变量的参考权重;


第二,在事件性冲击和政策变动频发的阶段,利率择时模型提供的数据规律可能受到短期情绪冲击的影响,致使效果下降;


第三,为保证参数估计质量,单个组别常存在不同程度的变量精简,对于部分信息的捕捉可能存在不足。在参考预测结果时,综合考虑多个组别的输出结果,可以缓解该因素的影响。


回到我们所处的阶段,2022年1月,我们面临2021年债牛之后的降息,10Y国债利率一度下行至2.7%以下,接近历史低点(不考虑2020疫情特殊因素导致的利率低位)。在这种环境下,投资者愈发重视赔率因素,对利率能否继续下行持谨慎态度。进入2-3月,俄乌冲突导致大宗品涨价,菏泽、广州和郑州等地的地产放松,所带来的事件性冲击,使得非基本面因素带来的扰动明显增加。可以说,模型预测效果正处于连续正判后的效力趋弱阶段。


我们也曾尝试在模型中直接引入赔率相关指标,例如在利率出于历史极端分位数下约束看多或看空倾向,但结果不甚理想。这背后可能是由于我们构建模型的核心思想,是捕捉经济数据与长端利率运行之间的全局有效规律,而赔率思维往往仅在利率处于低位的局部发挥作用,对利率的影响机制也不尽相同,很难纳入统一体系。


因而,在利率择时模型之外,我们还同时推出久期测算、杠杆率测算等刻画债券市场交易行为的工具,作为以基本面分析为根基的利率预测模型的补充。在模型预测正确率较低时,这些度量债市交易情绪的指标,可能会给出相对更为有效的信息,从而对利率预测起到辅助作用,便于对利率中枢的方向做出综合判断。


风险提示:

定量分析过程存在偏差,本报告结果仅供参考。


固收量化策略系列

之一:“揭秘”中长期纯债基金久期

之二:当固收+遇上钢铁ETF

之三:利率预测,历史致敬未来

之四:债基久期变化,揭示利率拐点

之五:债市杠杆率,如何高频跟踪

之六:从量化视角看,重要的利率驱动因素

之七:预测长端利率,8191个变量组合给出的方向



   

已外发报告标题《固收量化策略之八——利率择时模型的效力与边界》

对外发布时间:2022年3月10日报告作者:

刘   郁,SAC 执证号:S0260520010001,SFC CE No.BPM217,邮箱:shliuyu@gf.com.cn

肖金川,SAC 执证号:S0260520030002,邮箱:xiaojinchuan@gf.com.cn

田乐蒙,SAC 执证号:S0260520090001,邮箱:tianlemeng@gf.com.cn


法律声明


请向下滑动参见广发证券股份有限公司有关微信公众平台推送内容的完整法律声明:本微信号推送内容仅供广发证券股份有限公司(下称“广发证券”)客户参考,相关客户须经过广发证券投资者适当性评估程序。其他的任何读者在订阅本微信号前,请自行评估接收相关推送内容的适当性,若使用本微信号推送内容,须寻求专业投资顾问的解读及指导,广发证券不会因订阅本微信号的行为或者收到、阅读本微信号推送内容而视相关人员为客户。
完整的投资观点应以广发证券研究所发布的完整报告为准。完整报告所载资料的来源及观点的出处皆被广发证券认为可靠,但广发证券不对其准确性或完整性做出任何保证,报告内容亦仅供参考。
在任何情况下,本微信号所推送信息或所表述的意见并不构成对任何人的投资建议。除非法律法规有明确规定,在任何情况下广发证券不对因使用本微信号的内容而引致的任何损失承担任何责任。读者不应以本微信号推送内容取代其独立判断或仅根据本微信号推送内容做出决策。
本微信号推送内容仅反映广发证券研究人员于发出完整报告当日的判断,可随时更改且不予通告。
本微信号及其推送内容的版权归广发证券所有,广发证券对本微信号及其推送内容保留一切法律权利。未经广发证券事先书面许可,任何机构或个人不得以任何形式翻版、复制、刊登、转载和引用,否则由此造成的一切不良后果及法律责任由私自翻版、复制、刊登、转载和引用者承担。


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存