查看原文
其他

预测长端利率,8191个变量组合给出的方向

刘郁 金川 乐蒙 郁言债市 2022-09-30










郁言债市数据平台

https://www.yuyanzhaishi.com

区域、城投、地产数据一网打尽

欢迎关注使用!


摘 要   


经济基本面、市场交易结构等指标作为债市的重要影响因素,是利率未来研判的主要支撑。


站在以往利率研究积累之上,在本篇报告中,我们将更多以经济基本面和市场交易特征作为支撑,运用计量工具为基于基本面数据的利率方向预测赋能,以期构建稳健科学的利率预测模型。


利用传统框架预测长端利率,往往面临一些技术性难题,对此,我们将利率判断问题转化为利率上行vs下行的二元判断问题,引入多变量,并利用不同组合滚动回测的方式搜寻最优组合。


我们选用了Logistic模型来判断长端利率的变动方向。Logistic模型原理通俗易懂、运行高效,常被用来预测事件发生的概率。出于判定未来长端利率变动方向的目的,我们主要关注二分类的Logistic回归模型。


基于Logistic滚动回归估计,我们构建了月度利率变动方向的预测模型,进而构建基于预测方向的月度久期调整策略。


我们在研究中挑选了13个经济基本面和利率市场结构的代表性变量,但过多的解释变量会带来过度拟合、估计结果不收敛等实际问题,导致回归参数与预测结果存在很大偏差,因此我们可以通过优选变量的方式进行变量精简。


穿越历史,寻找预测胜率占优与久期策略占优变量组合。在预测胜率筛选标准下,最高预测胜率为65.65%,最优变量组合的久期调整策略收益率最高达48.32%,远超比较基准37.93%。在久期调整策略累计收益率筛选标准下,最优变量组合的久期调整策略收益率最高达51.12%,超额收益率进一步提升。预测胜率与基于预测方向的月度久期调整策略收益率两套筛选标准下的实证结果均表明,社融数据在对未来长端利率走势的预测,具有重要作用。


利用2021年8月观测到的最新数据,模型预测9月长端利率下行概率较大。通过将8月经济数据代入到基于Logistic滚动回归的利率预测模型中,预测胜率占优与久期策略累计收益率占优两组优选变量组合均对九月长端利率变动方向给出了一致的判断:下行概率较大。


核心假设风险。定量分析过程存在偏差,本报告结果仅供参考。



经济基本面、市场交易结构等指标作为债市的重要影响因素,是利率未来研判的主要支撑。从量化视角看,重要的利率驱动因素一文中,我们运用数量化手段筛选出了对利率中枢影响较为稳定的经济指标。


利率预测,历史致敬未来利用CKLS方法框架中经典的CIR模型,完全运用量化机器学习框架对利率未来的走势进行模拟与前瞻。但CIR模型的随机过程本质也引出了几个问题:第一,由于我们得到的是具有不确定性的随机过程,模拟结果和实际情况始终会存在出入。第二,直接利用模拟结果外推预测,会使得预测结果存在较大的偶然性。


站在以往利率研究积累之上,在本篇报告中,我们将更多以经济基本面和市场交易特征作为支撑,运用计量工具为基于基本面数据的利率方向预测赋能,以期构建稳健科学的利率预测模型。



1


直面传统框架难以解决的问题

混改


利用传统框架预测长端利率,往往面临一些技术性难题:


经济系统自身较为复杂。基于经济指标预测长端利率,接近于在一个复杂系统中寻找长端利率的相关变量,隐含假设历史数据所反映出的规律在未来重现。一个直接思路,对长端利率的相关指标进行穷举,基于历史相关性,统计这些指标给出的长端利率走势,看向上、向下哪个方向更多,从而得出结论。一个进阶思路,从系统中搜寻长端利率相关的系统重要变量,基于一个或数个关键变量的变化对长端利率走势作判断。但这两者传统思路,往往难以获得理想的胜率。


经济系统呈现出的规律具有不稳定性。经济周期与物理周期等自然问题不同,一轮新的经济周期往往并非过去周期的简单重复。直接思路面临的问题,对变量进行穷举而不赋权重,本质是给与变量同样权重。而各变量或领先、或同步、或滞后于长端利率。在滞后变量与领先变量给出的长端利率方向相反时,等权重意味着,模型设定赋予领先变量的有效信息、滞后变量的无效信息同样权重,导致有效信息被无效信息所抵消。


进阶思路面临的问题,一方面是对单个变量而言,重要变量存在三重可变性:一是重要变量可能在未来成为非重要变量,反之非重要变量也可能成为重要变量,例如2004-2009年期间,CPI同比对长端利率有较好的预测作用,但在2012年之后,CPI同比走势与长端利率的相关性明显趋弱。二是重要变量与长端利率的领先滞后关系可能发生变化。例如PPI同比在2014年之前,往往滞后于长端利率,而2015-2019年,则往往与长端利率同步或略微领先。三是重要变量与长端利率的相关系数也可能发生变化。同样以PPI同比和长端利率的相关性为例,两者在不同周期中的相关系数并不稳定。传统方法利用相关系数或线性回归捕捉相关性,隐含的假设是相关系数稳定。三重可变性,意味着获取历史信息中的有效信息难度较大。


另一方面是,对不同重要变量,其给出的预测方向可能相反。例如利率预测中我们常关注PPI和社融,两者均是经济周期的重要变量,2021年上半年,PPI同比趋于上行,而社融同比则趋于下行,分别指向长端利率向上、向下,基于两者预测长端利率方向相反。这背后可能是单个或两个变量的三重可变性所致。在实践中,其他长端利率预测中的重要指标也经常出现类似情况。面对这种情况,该相信哪个指标,往往让人无所适从。给不同变量赋权,需要考虑系数可能随时间变化,是长端利率预测面临的一个挑战。


基于传统分析框架,经济指标与长端利率的相关性刻画方面,对单变量若以相关系数来衡量,往往波动较大;而用线性回归模型,如最小二乘法,以长端利率为因变量,以经济指标为自变量,得到的自变量系数是恒定不变的,并非随时间可变,显然也并不接近现实。这使得基于传统框架、利用经济指标预判利率,难以给出可置信的方向。




面临这些传统方法难以充分解决的复杂问题,我们试图利用量化工具,给出一个预测长端利率的可行方法。


我们在本次模型搭建的思路中,将主要从如下三个角度出发,改进传统预测思路和经济数据带来的限制:


首先,我们采用多变量组合的方式,对利率中枢的变动趋势进行预测,以尽可能对冲单变量预测的不稳定性,同时我们将尝试不同变量搭配的预测效果,搜寻预测效果最优的变量组合;


第二,我们将预测的目标进行模糊化处理,由直接挑战利率点位的预测转化为固定周期内利率中枢变化方向的预测,从而将一个具体数值的预测问题转化为利率上行或下行的二元判断问题,通过降低因变量信息维度的方式,将模型的判断结果从“精确的错误”向“模糊的正确”引导。


第三,考虑到经济周期与利率相关关系的不稳定性,我们在判断过程中将进行滚动预测,在每一个决策期都采用最新样本序列对利率变动方向进行判断,以求在每一次预测过程中都能及时体现市场环境的变化情况。


此外,由于模型不可避免地会涉及多变量间的相互关系,因此利用最小二乘法进行估计的多元线性回归模型将面临来自古典假定的严格限制。综上,我们在模型选择过程中也挑选可利用极大似然等更稳健方法进行估计的模型作为本文的判断工具。



2


Logistic模型与长端利率变动方向



(一)Logistic模型:稳定的二元选择问题预测工具


如前文所述,我们在本次研究中计划将因变量设置为利率的上行或下行,即一个0、1二元问题,因此在模型挑选过程中,我们需要的是一个可以体现经济基本面和市场数据变化,与利率运行状态之间相互关系的二元选择模型。


Logistic模型(Logistic Regression)是一种广义线性模型,是机器学习中较为常用的二分类算法模型。与多元线性回归的主要区别在于,Logistic模型的因变量服从多项分布,多元线性回归的因变量服从连续分布。其中二项分布因变量在Logistic模型中最为常用。出于判定未来长端利率变动方向的目的,我们主要关注二分类的Logistic回归模型。


Logistic模型的形式如下,其中y为定性变量,取值为0或1:当y=1时,事件发生;当y=0时,事件未发生。例如在本文研究的问题中,y=1即表示利率在预测期内出现上行,反之则为下行。P(y=1)为事件发生的概率。Xi(i=1,2,3,...,n)为用于解释事件发生概率的经济变量。

从模型的设置中可以看出,Logistic回归模型的核心在于利用自变量数据预测某一事件——例如利率上行,发生的概率,与本文的研究目标相契合,同时模型原理简单易懂、运行高效,在各类实际问题中运用也十分广泛。


(二)Logistic模型在长端利率影响因素分析中的运用


具体到本文的利率预测问题中,我们以当期名义经济增速(由于预测窗口期为月度,我们用工业增加值同比+PPI同比来近似)等经济基本面和市场变量作为解释变量,以下一期长端利率走势为被解释变量,探究当期经济基本面等因素对未来长端利率变动的影响,构建了如下的Logistic回归模型:

其中ΔBondt+1为定性变量,若长端利率(10年期国开债到期收益率)上升,为1;若长端利率(10Y国开债到期收益率)下降,则为0。因此P(ΔBondt+1=1)为t+1期长端利率上涨的概率。X1,X2,X3...,Xn为n个囊括经济增长、价格水平、流动性、汇率、市场交易结构的经济解释变量。



3


基于Logistic滚动回归的利率预测模型



接下来,我们利用上一章搭建的Logistic模型,进行实际的变量选择与滚动回测框架的搭建工作。


(一)基础模型构建


1. 被解释变量


我们将10年期国开债到期收益率作为长端利率的代表指标,将其月度变化作为Logistic模型的被解释变量,也是我们预测模型的核心。


2. 解释变量


全面考虑影响长端利率变动的因素,综合《从量化视角看,重要的利率驱动因素》一文中对利率中枢影响因素稳定性的探究,我们从经济增长、价格水平、流动性、汇率、市场交易结构等多个维度出发,筛选了13个月频经济变量作为Logistic模型的解释变量。变量的具体选择和代码见表1:



3.  滚动回归窗口期的选择


经济周期时长一般为5年,因此我们选择60个月作为滚动回归窗口期。


4.  模型框架


在每一轮样本周期的参数估计过程中,站在T+60时间点上,我们以T至T+59窗口期内的经济数据为解释变量、以T+1至T+60窗口期内的长端利率(10年期国开债到期收益率)为被解释变量,在窗口期内进行如下Logistic回归,得到回归系数:


其中ΔBondt+1为定性变量,若长端利率在t+1期末相对于t期末上升,为1;若长端利率在t+1期末相对于t期末下降,则为0。因此P(ΔBondt+1=1)为t+1期长端利率上涨的概率。F1-F13为第二部分中阐述的13个囊括经济增长、价格水平、流动性、汇率、市场交易结构的经济解释变量。


完成参数估计后,我们便可站在T+60期——即本轮周期的决策时点,对T+61期的利率变动方向进行预测。以60个月滚动窗口期内Logistic回归结果为基础,将以T+60期的宏观基本面数据代入回归方程,计算T+61期的长端利率(10年期国开债到期收益率)上涨的概率:若上涨概率P(ΔBondt+1=1)大于50%,则判定为上涨;反之判定为回落。整个基础模型的框架整理如下图所示。



(二)变量组合的优选


1. 优选思路:穷举搜寻最优组合


我们在研究中挑选了13个经济基本面和利率市场结构的代表性变量,但过多的解释变量会带来过度拟合、估计结果不收敛等实际问题,导致回归参数与预测结果会存在很大的偏差,因此我们可以通过优选变量的方式进行变量精简。


不过,单纯从逻辑判断角度出发很难对当前变量组合进行取舍,因此我们采用了一个较为极端,但是有效的方法进行变量组合优化——穷举所有可能的变量组合,从中挑选最优组合来呈现最终结果。以表1中的13个解释变量为基础构建解释变量池,通过排列组合的方式枚举所有可能的变量组合,共可得8191个解释变量组合。对于每一个解释变量组合,我们依次运行基于Logistic滚动回归的利率预测模型,得到滚动的样本外预测结果。基于不同的筛选标准,我们可以得到几组优选变量组合。


2. 优选变量组合筛选标准


(1)筛选标准1:预测胜率


对于每一个变量组合,我们将滚动样本外预测结果与实际长端利率变动方向进行比较,得到每一个变量组合的预测准确率,即预测胜率。通过挑选预测胜率高的变量组合,达到优选的目的。


(2)筛选标准2:基于预测方向的月度久期调整策略


假设我们持有一个国开债投资组合,基于Logistic滚动回归利率预测模型的样本外预测结果,我们月度调整投资组合的久期:当预测下一期长端利率上行时,我们调低久期;当预测下一期长端利率下行时,我们抬升久期。具体的调整策略如下表所示,维持的久期水平为4。



我们采用一个简化的收益计算方式,将持有债券的组合收益拆分成了两个部分:第一是利率变动和久期决定的资本利得部分,第二则是期间的票息收益部分。公平起见,我们假设策略中涉及的票息均为4%/年,并采用中债10Y国开利率的实际单日变动作为资本利得部分的变动数据,对两种策略的收益进行计价。


需要特别注意的是,我们采用的理论计价方式由于设置了不变票息,且没有考虑再投资收益等因素,因此后文中呈现的累计收益率与现实世界中对应久期的债券财富指数收益率并不可比。但只要基于Logistic回归的久期调整策略在可比口径下取得了超过不变久期策略的相对收益,即可说明我们的模型可以对利率方向的预判提供有效支持。


综上,基于月度久期调整结果,我们可以计算久期策略组合的日度收益率,通过复利计算月度久期调整策略的累计收益率,挑选收益长期领跑的变量组合,达到优选的目的。



4


穿越历史,预测胜率占优与久期策略占优



基于预测胜率与月度久期策略组合收益率两套标准,我们可以分别筛选出占优变量组合,进而预测未来长端利率的变化趋势。


(一)预测胜率占优变量组合


1. 变量组合排名情况


根据预测胜率对8191个解释变量组合进行排名,我们发现最高预测胜率为65.65%,预测胜率排名靠前的变量组合的久期调整策略累计收益率高达48.32%。从预测胜率靠前与靠后的变量组合对比来看,代码为F4的变量社融同比在预测胜率排名靠前的变量组合中均有出现,而在预测胜率排名靠后的变量组合中未出现社融同比变量,这表明社融数据在对未来长端利率走势的预测中具有重要作用。



2. 最优变量组合情况


在预测胜率排名靠前的变量组合中,由制造业PMI、OECD中国领先指数、社融同比、地产销售面积同比、PPI同比、美元指数、国债占利率债成交比重7个经济变量构成的变量组合的久期策略组合累计收益率高达48.32%,是在预测胜率维度下最优变量组合。


从近十年的预测结果来看,该变量组合能够捕捉历史上大部分时间段的长端利率的变动方向,对市场利率的波动具有比较敏锐的预判。



从基于久期调整策略2011年以来累计收益率来看,最优胜率变量组合的收益率高达48.32%,显著超过一直维持久期为4的比较基准37.93%,这表明基于模型判断结果的久期调整策略可以为组合贡献正向收益。



(二)久期调整策略累计收益率占优变量组合


1. 变量组合排名情况


根据久期调整策略的累计收益率对8191个解释变量组合进行排名,我们发现排名前十的变量组合,2011年以来累计收益率均超过50%,最高可达51.12%。从久期调整策略累计收益率靠前与靠后的变量组合对比来看,代码为F4的变量社融同比在累计收益率排名靠前的变量组合中均有出现,而在累计收益率排名靠后的变量组合中未出现社融同比变量,这也表明社融数据在现实久期策略调整中占据重要地位。



2. 最优变量组合情况


在预测胜率排名靠前的变量组合中,由制造业PMI、OECD中国领先指数、社融同比、PPI同比、R007、美元指数、国债占利率债成交比重、30Y国债换手率、M1增速9个经济变量构成的变量组合的久期策略组合,2011年以来累计收益率高达51.12%,虽然预测胜率仅为58.78%,但累计收益率超过了预测胜率为65.65%的最优胜率组合。该变量组合收益率远超一直维持久期为4的比较基准37.93%,这表明该变量组合对于当下的久期交易策略有一定的指引意义。




5


探索未来:长端利率预测



通过实证回溯分析,我们得到预测胜率占优的11个变量组合、久期调整策略累计收益率占优的10个变量组合,通过将八月经济数据代入到基于Logistic滚动回归的利率预测模型中,可以得到模型对于九月长端利率变动方向的判断。


(一)预测胜率占优变量组合九月预测结果


预测胜率占优变量组合对九月份长端利率的预测十分一致,均判断九月长端利率上行概率较小,预测长端利率上行概率均值为21.47%。基于这个结果,长端利率下行概率更大,看多9月长端利率。



(二)久期策略收益率占优变量组合九月预测结果


与预测胜率占优变量组合对未来的判断相同,10个久期策略收益率占优变量组合对九月份长端利率的预测十分一致,均判断九月长端利率上行概率较小,预测长端利率上行概率均值为13.35%。因而,维持看多9月长端利率。



风险提示:

定量分析过程存在偏差,本报告结果仅供参考。


固收量化策略系列

之一:“揭秘”中长期纯债基金久期

之二:当固收+遇上钢铁ETF

之三:利率预测,历史致敬未来

之四:债基久期变化,揭示利率拐点

之五:债市杠杆率,如何高频跟踪

之六:从量化视角看,重要的利率驱动因素



   

已外发报告标题《固收量化策略之七——预测长端利率,8191个变量组合给出的方向》

对外发布时间:2021年8月25日报告作者:

刘   郁,SAC 执证号:S0260520010001,SFC CE No.BPM217,邮箱:shliuyu@gf.com.cn

肖金川,SAC 执证号:S0260520030002,邮箱:xiaojinchuan@gf.com.cn

田乐蒙,SAC 执证号:S0260520090001,邮箱:tianlemeng@gf.com.cn


法律声明


请向下滑动参见广发证券股份有限公司有关微信公众平台推送内容的完整法律声明:本微信号推送内容仅供广发证券股份有限公司(下称“广发证券”)客户参考,相关客户须经过广发证券投资者适当性评估程序。其他的任何读者在订阅本微信号前,请自行评估接收相关推送内容的适当性,若使用本微信号推送内容,须寻求专业投资顾问的解读及指导,广发证券不会因订阅本微信号的行为或者收到、阅读本微信号推送内容而视相关人员为客户。
完整的投资观点应以广发证券研究所发布的完整报告为准。完整报告所载资料的来源及观点的出处皆被广发证券认为可靠,但广发证券不对其准确性或完整性做出任何保证,报告内容亦仅供参考。
在任何情况下,本微信号所推送信息或所表述的意见并不构成对任何人的投资建议。除非法律法规有明确规定,在任何情况下广发证券不对因使用本微信号的内容而引致的任何损失承担任何责任。读者不应以本微信号推送内容取代其独立判断或仅根据本微信号推送内容做出决策。
本微信号推送内容仅反映广发证券研究人员于发出完整报告当日的判断,可随时更改且不予通告。
本微信号及其推送内容的版权归广发证券所有,广发证券对本微信号及其推送内容保留一切法律权利。未经广发证券事先书面许可,任何机构或个人不得以任何形式翻版、复制、刊登、转载和引用,否则由此造成的一切不良后果及法律责任由私自翻版、复制、刊登、转载和引用者承担。



您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存