何为三要素
α的三要素
主动投资管理的先驱之一Richard Grinold写过一篇著名的文章,题为《α = Volatility × IC × Score》。这篇文章标题直白醒目,简明扼要的说明了在主动管理中寻求股票α收益率的三要素。
Grinold对α的定义为个股收益率中无法被与市场收益率相关的β部分解释的残余部分。假设r为个股相对无风险收益率的超额收益,rm为市场相对无风险收益率的超额收益,那么我们有
r = α + β × rm
如果个股的α都是零(就像CAPM假设的那样),那么我们买个指数就万事大吉,所有主动型基金经理都会失业。但现实并不是这样,一些股票的确存在正的α,而另一些存在负的α。主动投资管理就是从所有的股票中选出拥有超额α收益的那些优秀股票。
让我们假设为了挖掘有真正α的优秀股票,某主动型基金经理有一个模型(咱们先甭管这个模型是怎么得到的,也许是靠着手底下众多研究员的深度研究,也许是靠着科学的量化分析,也许是靠打听内部消息,也许是靠猴子扔飞镖,whatever,you name it)。每当这个基金经理要预测个股下一期的α收益时,这个模型便给出一个预测,记为f。
这样α的三要素为IC、Volatility以及Score:
IC:它是对α的预测(即f)和实际α的相关系数,在这里被称为信息系数Information Coefficient。显然,这个相关度越高越好,它最直接的反映基金经理在主动管理中的预测能力。
Volatility:代表的是个股α本身的波动。α本身的波动越大,说明越有机会可图。举个极端的例子,如果α = 0或者一个恒定的常数,那么这支个股对所有人来说都是一样的,根本没有α可以挖掘。
Score:这是一个把当期对α的预测值f按照过去的预测进行标准化后的一个标准化分数。它代表了在此时此刻,该基金经理对这支股票的看好的程度。这么说也许不够直白。举个例子来说,假设这个基金经理有一个非常厉害的模型,每次都能预测个八九不离十,这次的预测值f为-1%,假设它标准化后的分数为-2。因此score就等于-2,说明该模型在当期对这支股票相当不看好。
数学含义
在这篇文章中,Grinold虽然使用了大量的例子来阐述这三要素在解释α时发挥的作用,但它并没有具体给出公式α = Volatility×IC×Score的推导。下面我们就来从数学上说明这个公式的美妙之处,它可以通过对α收益率以及它的预测值f的历史时间序列进行线性回归来得到。
用时间序列f对时间序列α做线性回归模型有:
其中,a和b是回归系数,ε是回归误差,一般假设ε的期望为0。通过历史数据,利用最小二乘法对上述模型求解可以得到参数a和b的最优值:
将得到的a和b的最优参数带回到上面的回归模型中,并舍去回归误差项,可得:
由于E[α]是α的历史均值,对任何一期的α都是一样的,因此真正影响α的是后面这三项的乘积,即α = IC×Volatility×Score。
如果用一句话来说清楚这个α公式的含义就是:如果股票本身有α可以挖掘(α的Volatility波动率大)、我有一个准确的预测方法(在历史上预测值f和α之间的IC高),并且当期我的预测值f非常好(我对这个股票非常有信心),那么我就可以预期这支股票在未来有不错的超额收益α。
在这三要素中,α自身的波动由股票所处的行业和公司的性质所决定。更能反映基金经理本事的是长期的预测能力(IC)以及在当前的判断(Score)。在我看来,高IC是最重要的条件,否则不管Score多高,如果模型压根就不能有效的预测α(低IC),那么一切都是枉然。当然,如果有了高的IC,那么我们只需要找到在当前时刻的预测中Score高的那些股票买入即可。所以,所有靠选股为生的主动型基金经理大概都在较劲脑汁的想找到一个可以提高IC的α预测模型或者方法。
α公式的变种
Grinold最初提出的α三因素公式就如同前面小节所说明的那样,我们预测的是α本身,回归时是在时间维度对预测值f的时间序列和实际α的时间序列进行回归。然而预测α本身终究是困难的,更常见的做法是寻找能够挖掘α收益率的因子,使用因子本身的值对α建模,并通过截面回归来分析这类模型是否具有挖掘α的能力,这就是α三因素公式的变种。
截面回归是在给定的时间节点,使用所有股票在该时点在某一因子上的取值对下一时刻股票的α收益进行回归分析。令向量d为所有股票在时刻t的因子暴露,α为所有股票在t+1时刻的α收益率向量,利用线性回归便可以得到与本文第二节中相似的结果:
虽然公式看起来很相似,但这里的解释略有不同:E[α]是所有股票在t+1时刻的期望α收益,它应该近似的等于0。IC是该因子和α的截面相关系数,它衡量在t时刻,该因子是否具备优秀的选股能力。Volatility是所有股票α收益的截面波动率,它描述的是个股α收益率的差异性。Score衡量个股在因子上取值的强弱。
总结来说,因子和α收益率的相关性越高,个股α的差异性越大,我们的选股基础就越好。在这个基础上,只需要按照该因子选出分数高的股票就可以预期得到超额的α收益。如果所有股票的α都一样(Volatility = 0)或者所有股票的因子取值都一样(Score = 0),那么上式就相当于α = 0,也就是说根本无法通过该因子选出含有超额α收益的股票;只有因子和α收益率的相关性越高,股票的差异性越大(α和因子的差异性都是越大越好),才越有可能找出α。
截面回归方法往往是一种事后验证。即我们在已知t+1时刻所有股票的α的前提下,用t时刻的因子取值对α进行回归,以此来衡量该因子在t时刻的选股能力。然而,由于不同因子之间有相关性,这种衡量方法其实也是有一定缺陷的。此外,t时刻的选股能力更不能保证在t+1时刻该因子仍然有同样的选股能力。要正确判断一个因子的选股能力仍然需要从时间维度上的考察通过该因子构造的纯因子投资组合(即排除其他因子对目标因子的干扰)是否可以持续的获得超额收益。这就不在本文的讨论范围之内了。