解释股票截面预期收益差异的独立因子
作者:石川,量信投资创始合伙人,清华大学学士、硕士,麻省理工学院博士;精通各种概率模型和统计方法,擅长不确定性随机系统的建模及优化。知乎专栏:
https://zhuanlan.zhihu.com/mitcshi。
未经授权,严禁转载。
摘
要
Green, Hand and Zhang (2017) 通过 Fama-MacBeth 回归同时检验了 94 个因子,发现其中 12 个是显著的。他们的研究方法对于 A 股的因子投资实践有很大的价值。
1
引言
在发表偏差(publication bias)的驱使下,多重检验(multiple testing)已经成为学术界在进行 asset pricing 时的普遍做法。然而,很多发表于顶级期刊的所谓能够解释股票截面预期收益差异的因子都是虚假发现(见《出色不如走运(II)?》)。针对这个问题,2011 年,前美国金融协会主席 John Cochrane 教授在主席演讲中向学术界提出挑战 —— 到底哪些因子能独立解释股票预期收益截面差异?
2017 年,一篇发表于顶刊 Review of Financial Studies 上的文章通过使用 Fama-MacBeth Regression (Fama and MacBeth 1973)同时检验 94 个学术界发表的异象回答了这个问题(Green, Hand and Zhang 2017,下文记为 GHZ)。
事实上,这并不是学术界就此问题的唯一尝试。比如,Harvey and Liu (2018) 提出了一个基于回归的框架来排除运气的成分以便检验真正有效的因子。不过 Harvey and Liu (2018) 这篇文章的核心内容是介绍他们提出的方法而非实证结果。而 GHZ 的研究指出了美股上真正有效的因子,具有更高的实证价值。无论是这些因子还是 GHZ 使用的方法对 A 股都有不小的借鉴意义。
本文就来介绍 GHZ 这篇论文。
2
数据和因子
在研究中,GHZ 利用了 CRSP,Compustat 以及 I/B/E/S 数据库的数据首先挑选出了 102 个因子,回测时间是 1980 年 1 月到 2014 年 12 月,频率为月频。回测期之所以从 1980 年开始是由上市公司基本面数据的可得性决定的;同时包含 NYSE、AMEX 以及 NASDAQ 的上市公司。
除此之外,GHZ 的特别之处是考虑了微小市值公司对评价因子有效性时的影响。为此,他们将所有股票根据市值分成三挡:
1. 市值超过中位数的股票为大市值组;
2. 市值在中位数和 20% 分位数之间的为小市值组;
3. 市值在 20% 分位数之下的为微小市值(microcap)组。
微小市值的这些股票的市值之和仅占所有股票总市值的 3%。为了避免回归分析时对它们过度加权,GHZ 采取了两种回归方法:
1. 对所有股票采用市值加权最小二乘法(VWLS);
2. 对前两组的股票(即所有股票中排除微小市值组)采取普通最小二乘法(OLS)。
作者认为上述两种方法能够更合理的找到有效因子,并通过合并这两种回归的结果确定最终的显著因子。作为比较 —— 同时也是为了说明过度加权微小市值股票的危害 —— GHZ 也同样对所有的股票进行了 OLS 回归。不出意外,由于微小市值股票存在造成的偏误,这种方法能够发现更多的“有效”因子,但很多因子在非微小市值股票上并不显著。
在进行多因子同时回归时,因子间的共线性是必须考虑的问题。共线性会造成因子收益率标准误(standard error)的巨大误差,从而无法有效的评价因子是否显著(见《为什么要进行因子正交化处理?》)。GHZ 使用 variance inflation factors(VIF)对因子进行了初步筛选,并剔除了 8 个 VIF 高于 7 的因子(下图),最终从 102 个因子中选出了 94 个待评价的因子。这 94 个因子的平均相关系数为 0.07。
同时检验 94 个因子属于 multiple testing 的问题。为避免过拟合,GHZ 对回归分析得到的单个因子 p-value 进行了以控制 false discovery rate为目标的调整,具体使用的方法为 BHY 修正(Benjamini and Yekutieli 2001,见《出色不如走运(II)?》)。GHZ 以调整后的 p-value 小于 0.05 作为因子显著的准则。
除了调整后的 p-value 之外,GHZ 也同时计算了每个因子的 t-statistic。Harvey et al. (2016) 指出由于 multiple testing 的问题,单个因子的 t-statistic(的绝对值)至少要大于 3 才可能显著。GHZ 也以此为显著性准则汇报了显著性因子的个数。该准则比调整后 p-value 小于 0.05 要弱一些,因此找到了更多的因子。
下面就来看看实证结果。
3
单个因子检验
在同时对 94 个因子进行检验之前,GHZ 首先对每个因子进行了单独检验。作者这么做的目的是希望通过单独检验和共同检验分别找出显著性的因子,以此比较这两种方法找到的因子是否一致,这可能会对未来的 asset pricing 研究带来一些启发和灵感。
在单个因子检验中,截面回归方程的左侧是个股的收益率,右侧是目标因子和其他控制变量。根据有无控制变量,单个因子的检验一共有以下四个版本:
1. 仅有单个目标因子,无其他控制变量;
2. 除了单个目标因子外,还包括四因子模型(Fama and French 1993 的三因子 + Carhart 1997 的动量因子);
3. 除了单个目标因子外,还包括 Fama-French 五因子模型(Fama and French 2015);
4. 除了单个目标因子外,还包括 Hou et al. (2015) 的因子模型。
对每一个版本,通过在每期用因子暴露和下一期的个股收益率截面回归得到因子收益率,然后使用因子收益率的时序对因子显著性进行分析,计算得到调整后的 p-value 以及 t-statistic,使用 p-value 是否小于 0.05 或 t-statistic 绝对值是否大于 3.0 为基准决定真正显著的独立因子。在回归时,考虑了本文前一节提到的三种方法 —— 对所有股票进行 VWLS,对非微小市值股票进行 OLS,以及(作为“反面教材”的)对所有股票进行 OLS。为了方便在下文中介绍结果,将前两种回归称为 GHZ 回归。
单个因子检验的结果如下(由于 94 个因子太多,故节选部分):
上图中最重要的部分是红色标记的地方 —— 即使用调整后 p-value 小于 0.05 为基准确定的显著因子个数。在没有控制变量的模型中(column A),GHZ 回归一共找到了 12 个显著因子;作为对比,由于微小市值股票的影响,对所有股票的 OLS 回归发现了 30 个显著因子。这说明 18 个因子在非微小市值股票上是无效的。其他带控制变量的回归(columns B to D)也有类似的结果。
在没有控制变量的模型中,通过单个因子回归分析发现的显著因子包括:
1. 总资产增长率(asset growth);
2. 经行业调整的销售收入增长率(growth in industry-adjusted sales);
3. 流通股本变动百分比(growth in shares outstanding);
4. 存货变动(growth in inventory);
5. 盈余公告宣告收益(earnings announcement return);
6. 账面价值增长率(growth in book value of equity);
7. 资本支出增长率(growth in CAPEX);
8. 长期净营运资产增长率(growth in long-term net operating assets);
9. 机器设备厂房存货增长率(growth in PP&E plus inventory);
10. 盈利同比增长的季度数(number of consecutive quarters with earnings higher than the same quarter a year ago);
11. 销售收入与存货差的增长率(growth in sales less growth in inventory);
12. 标准化的未预期盈余(standardized unexpected quarterly earnings)。
以上通过单个检验从 94 个发表于学术期刊的显著因子中选出了 12 个,这些因子是经过 multiple testing 调整后仍然有效的。下面就来看看对这 94 个因子同时回归会得到怎样的结果。
4
多个因子共同检验
在共同检验时,GHZ 将所有 94 个因子同时放入回归方程的右侧,进行 Fama-MacBeth regression。和上一节一样,仍然使用三种回归方法。结果(节选)如下:
根据 p-value 基准,在对所有股票进行 VWLS 时,一共发现了 6 个显著因子;在对非微小市值股票进行 OLS 回归时,一共发现了 9 个显著因子。将这两个回归的结果合并一共得到 12 个显著因子。与之相对应的是,在对所有股票进行 OLS 回归时,由于微小市值的影响,一共发现了 23 个显著因子。
把 94 个因子共同检验也发现了 12 个显著因子,它们是:
1. 账面市值比(book-to-market);
2. 现金(cash);
3. 分析师数量的变化(change in the number of analysts);
4. 盈余公告宣告收益(earnings announcement return);
5. 一个月的动量(1-month momentum);
6. 六个月动量的变化(change in 6-month momentum);
7. 盈利同比增长的季度数量(number of consecutive quarters with earnings higher than the same quarter in a year ago);
8. 年度研发支出占市值的比重(annual R&D to market cap);
9. 收益波动性(return volatility);
10. 股票换手率(share turnover);
11. 股票换手率的波动性(volatility of share turnover);
12. 零交易的天数(zero trading days)。
虽然上一节的单一因子检验和本节的共同检验碰巧都发现了 12 个因子,但是仔细比较不难看出两种方法找到的显著因子中大部分并不相同。根据 McLean and Pontiff (2016) 对因子分类的定义,在单一因子检验中,10 个显著的因子都是基本面因子;而在共同检验时,仅有盈利同比增长的季度数量属于基本面因子,剩余更多的是交易行为因子。
上述两种检验结果为今后的 asset pricing 传递出两个重要信息:
1. 在排除了微小市值对回归造成的偏误以及修正了多重检验的数据挖掘之后,真正显著的因子个数很少;
2. 在 asset pricing 的研究中,在分析一个潜在异象时,应该选择共同检验发现的这些显著因子作为控制变量来进行研究。
5
样本外投资组合收益分析
在前两节的研究中,这些显著的因子是在整个回测期(1980 到 2014)期间发现的。它们也许对 asset pricing 有帮助,但是上述结果无法说明它们在实战中是否有交易的价值 —— 我们不能回到过去交易这些在事后被证明有效的因子。
为了研究它们在交易中是否能够带来超额收益,GHZ 采用了滚动窗口使用因子选股并在样本外构建投资组合的方法。样本外滚动测试使用过去 10 年(120 个月)的数据来回归,因此从 1990 年开始。在选股时,由于同时考虑了多个因子,因此使用因子收益率来预测个股在下一期的收益率,并使用预期收益率的高低构建多空对冲的投资组合(做多预期收益率最高的 10%、做空预期收益率最低的 10%)。实证中一共考察了三种不同的投资组合(三个组合的区别是对小市值股票的权重依次提升)。
当使用全部 94 个因子进行滚动回归时,不同投资组合的收益率如下图所示。随着小市值比重的增加,投资组合的收益率逐渐增大。
如果不使用全部 94 个因子,而仅仅使用 GHZ 通过共同检验找出的 12 个独立因子会怎样呢?下图给出了答案。
可以很明显的看到,仅仅使用 12 个独立因子显著降低了投资组合的收益率。这意味着我们好不容易辛辛苦苦找出了 12 个对解释 asset pricing 有效的独立因子,但是从实战选股的角度来说,这却不如使用全部 94 个因子 —— 不管它们是不是过拟合。
如何解释这种现象呢?GHZ 这篇文章并没有对此进行过多的讨论。就我的理解,上述结果说明了两点:
1. 这 12 个因子在整个回测期内显著;当使用滚动窗口时,不同的因子可能在不同历史时期显著,因此使用 94 个因子能够更好的捕捉因子风格的轮动。
2. 实盘交易的目标是为了获得超额收益,而不是理解 asset pricing 的机制。对于选股模型来说,最核心的是对未来收益率的预测是否准确,而非因子的收益率估计是否无偏。上面的结果说明使用更多的因子提高了样本外收益率预测的准确性。
有必要指出的是,上面的实证结果并没有考虑实际交易中的手续费等问题,且同时使用 94 个因子一定存在过拟合的问题。因此,虽然数据显示 94 个因子比 12 个因子的效果更好,这也不意味着我们在实际交易中一定能取得显著的优势。
6
2003 年前后的差异
GHZ 这篇文章研究的最后一个部分发现因子在 2003 年前后截然不同的表现 —— 因子对截面收益率差异的解释力度骤然下降。上一节提到的三个样本外投资组合的收益率在 2003 年前后的表现如下图所示,前后出现了明显的差异。这些投资组合的净值曲线在 2003 年之后变得更加平坦。
在 2003 年之后,仅仅有 2 个因子仍然显著,它们分别为盈利同比增长的季度数量以及经行业调整后的员工数。究其原因,GHZ 认为在 2003 年之后,美股上的套利成本大幅降低造成了这种现象。
2002 年 7 月,美国股市通过了 Sarbanes-Oxley 法案;同年 10 月,SEC 加速了对上市公司披露 10-Q 和 10-K 文件的要求。与此同时,在 2003 年初(1 月到 5 月),纽交所引入自动报价系统,减少了交易的摩擦成本。这一系列变化极大降低了交易股票市场异象的量化对冲策略的成本和技术难度。无疑,2003 年前后的差异对于今后研究提出了挑战。GHZ 也呼吁今后 asset pricing 的研究应该给予 2003 年之后的数据更多的权重。
7
结语
研究因子时最艰难的部分往往是数据的准备。一旦有了高质量的数据,各种用于检验的回归及其他统计手段是非常丰富的。作为一篇同时研究 94 个因子的文章,GHZ 的一个巨大贡献在于因子数据的计算,以及为了计算因子而对公司基本面和交易数据的收集、整理。此外,GHZ 在截面回归中用个股的收益率和这 94 个因子进行回归,可以想见计算量之巨大。这和 Harvey and Liu (2018) 中给出的简单例子完全不同。
简单总结一下这篇文章给多因子投资实务的启发:
1. 分析时应排除过度加权微小市值股票造成的偏差;
2. 真正显著的因子很少,绝大部分其他因子都是数据挖掘的产物、或者能够被这一小部分独立因子解释;
3. 共同检验和单一检验发现的显著因子往往不同,前者的发现更有效;
4. 因子投资和资产定价的目标不同;前者是为了提高样本外预测的准确性,后者是为了确保因子收益率的无偏估计;在投资实务中,更应该注重前者,但也要考虑实际的交易限制和成本。
GHZ 通过同时回归找到的 12 个因子虽然是针对美股,但很多在 A 股上也是有效的。此外,GHZ 使用多个因子同时进行 Fama-MacBeth regression 的做法和 Barra 如出一辙。今后的研究会使用 Barra 中国股票模型中的风格因子进行类似的实证,检验不同因子在 A 股上的显著性,希望以此更好的指导我们在 A 股上实践因子投资。
参考文献
Benjamini, Y. and D. Yekutieli (2001). The Control of the False Discovery Rate in Multiple Testing under Dependency. Annals of Statistics, Vol. 29, 1165 – 1188.
Carhart, M. M. (1997). On Persistence in Mutual Fund Performance. Journal of Finance, Vol. 52(1), 57 – 82.
Cochrane, J. H. (2011). Presidential address: Discount rates. Journal of Finance, Vol. 66(4), 1047 – 1108.
Fama, E. F. and K. R. French (1993). Common risk factors in the returns on stocks and bonds. Journal of Financial Economics, Vol. 33(1), 3 – 56.
Fama, E. F. and K. R. French (2015). A five-factor asset pricing model. Journal of Financial Economics, Vol. 116(1), 1 – 22.
Fama, E. F. and J. D. MacBeth (1973). Risk, return, and equilibrium: empirical tests. Journal of Political Economy, Vol. 81(3), 607 – 636.
Harvey, C. R., Y. Liu, and H. Zhu (2016). … and the cross-section of expected returns. Review of Financial Studies, Vol. 29(1), 5 – 68.
Harvey, C. R. and Y. Liu (2018). Lucky Factors. Working paper, available at SSRN: https://ssrn.com/abstract=2528780.
Hou, K., C. Xue, and L. Zhang (2015). Digesting anomalies: an investment approach. Review of Financial Studies, Vol. 28(3), 650 – 705.
Green, J., J. R. M. Hand, and X. F. Zhang (2017). The characteristics that provide independent information about average U.S. monthly stock returns. Review of Financial Studies, Vol. 30(12), 4389 – 4436.
McLean, R.D., J. Pontiff. (2016). Does academic research destroy stock return predictability? Journal of Finance 71(1), 5–32.