查看原文
其他

美股上一个跨越时间尺度的趋势因子

石川 川总写量化 2019-07-12


作者:石川,量信投资创始合伙人,清华大学学士、硕士,麻省理工学院博士;精通各种概率模型和统计方法,擅长不确定性随机系统的建模及优化。知乎专栏:

https://zhuanlan.zhihu.com/mitcshi。


未经授权,严禁转载。


Han et al. (2016) 通过截面回归将美股上的短期反转、中期动量和长期反转合并成一个新的趋势因子。该因子能获得显著的超额收益,为美股的 asset pricing 提供了新的思路。


1

引言


熟悉美股 asset pricing 或 factor investing 的小伙伴都知道,美股在不同的时间尺度上表现出了动量或者反转效应。比如,在研究动量因子时,常见的做法是按照月频使用 t – 12 到 t – 1 之间的收益率作为动量因子,这说明在一年这个时间尺度上存在动量,而之所以刨去最近一个月是因为未来收益率往往和最近一个月呈现反转。此外,DeBondt and Thaler (1985) 指出美股在 3 ~ 5 年的时间尺度上存在反转。


鉴于上述现象,一个自然的想法是针对不同的周期构建三个因子 —— 短周期的反转因子、中周期的动量因子、以及超长周期的反转因子,然后把投资组合适当的暴露在这些不同的因子中。如果这三个级别的不同现象都能带来 risk premium,则长期来看暴露在它们之上会有好的投资回报。


然而,除此之外,是否有更好的办法把不同级别的动量或者反转因子综合到一起,构建一个跨越不同时间尺度的趋势因子呢?2016 年,一篇发表于顶刊 Journal of Financial Economics 的文章(Han et al. 2016)给出了肯定的答案。这篇文章的三位作者是 UNC Charlotte 的 Yufeng Han、Washington Univ. in St. Louis 的周国富以及清华大学的朱英姿教授。


老实说,我对于这篇文章的看法有些复杂。原因有二。


第一个原因是,当我最初看完该文的摘要和 Introduction 的时候,“不负责任”的主观想法是既然这三个级别的趋势、反转各自有效,那么按照一定的方法把它们动态的组合在一起一定能(在 in-sample)取得更好的效果,但是这肯定有过拟合之嫌。不过随着继续深入研读,三位作者从不同的角度、通过大量的 empirical results 大大打消了读者对于过拟合的疑虑。


第二个原因是在大 A 股上动量因子 —— 无论在什么尺度上 —— 似乎都不太好用,常见的都是各种反转。因此,在未经过系统实证的情况下,我无法确定该方法移植到 A 股后是否也有很好效果。但是,这篇文章中采用的通过截面回归来构建趋势因子的思路,以及为了检验该因子而使用的很多统计手段都非常值得在进行 asset pricing 时借鉴。


出于这些考虑,我决定花笔墨把这篇文章认真介绍一下,希望给各位一些启发。


2

趋势因子


为了构建趋势因子,首先要选择具体的方法来计算不同时间尺度下的动量、反转。为此,Han et al. (2016) 采用的是 Moving Average(MA,移动平均)。移动平均是一个被技术分析广泛采用的简单指标,许多实盘交易结果指出 MA 对于未来的收益率有一定的预测性。


在理论方面,Han et al. (2016) 受到 Wang (1993) 的启发,使用一个简单的随机过程模型对于 MA 在收益率上面的预测性进行了分析。此外,Zhu and Zhou (2009) 从资产配置的角度研究了移动平均的价值。理论分析和实证数据均显示移动平均在交易中的作用。


在 Han et al. (2016) 研究的实证中,计算趋势因子的频率是月频,回测期为 1926 年 1 月至 2014 年 12 月(数据来自 CRSP 并采用了学术界常见的数据处理方法)。为了计算趋势因子,首先在每个月 t 的最后一个交易日计算每支股票(用 j 表示)在不同时间尺度 L 的移动平均:



其中 P_{j, t-L+i} 为股票 j 在第 t-L+i 个月最后一个交易日的价格(上述表达式和 Han et al. 2016 中的有些差异;我在不影响理解的前提下简化了表达式)。考虑到不同股票价格的量级存在巨大的差别,计算的下一步是使用最新的价格 P_{j, t} 对上述移动平均进行标准化:



在有了不同时间尺度(lag L)的移动平均之后,Han et al. (2016) 将它们视作不同级别的趋势(可能是动量、也可能是反转)信号,在每期使用股票最新的 MA 指标和下一期的收益率进行截面回归,得到这些移动均线因子的收益率



其中,r_{j,t} 为个股 j 在 t 期的收益率,L_i 为第 i 个计算移动平均的时间尺度。通过截面回归就可以得到这些移动平均因子的收益率 β_{i,t}。再具体计算时,计算均线的时间尺度 L_i 的取值为 3、5、10、20、50、100、200、400、600、800 以及 1000 个交易日,它们分别对应的时间尺度为日频、周频、月频、季度、一年、两年、三年以及四年。


一旦在不同 t 上使用截面回归得到了 β_{i,t},就可以在时序上取均值来预测下一个选股窗口内(月频)各均线因子的预期收益率。为此,作者采用了使用过去 12 个月的 β_{i,t} 来计算下个月的预期收益率:



最终,使用对 t + 1 的均线预期收益率 E_t[β_{i,t+1}] 和个股 j 在 t 期的最新均线指标取值就可以计算出每支股票在 t + 1 的收益率预测,并以此对股票排序构建趋势因子(在该计算中并不需要用到截面回归的截距项,因为该项对所有个股都一样,不改变因子的单调性):



简单梳理一下。上述计算趋势因子的过程首先找出了每支股票在不同时间尺度下的移动平均;将这些移动平均视为因子并通过截面回归得到每期因子收益率;通过滚动窗口计算出每个移动平均因子在这段时间内的收益率均值,从而动态的捕捉了在不同的历史时期,哪种级别的移动均线对于预测下一期的股票收益率最有效(β 的方向决定了方向 —— 动量或者反转,β 的大小决定了预测的强弱);最终使用移动均线因子收益率和最新的因子取值计算出个股下一期收益率的预测,以此对个股排序。


具体的,在每个月末将股票按照预期收益率从大到小排序,将排名前 1/5 的股票等权构建多头组合,将排名后 1/5 的股票等权构建空头组合。多空组合的收益率之差就是该趋势因子。和我们熟悉的 HML、SMB 一样,趋势因子本身也是一个多空投资组合的收益率。


下图展示了回测期内趋势因子(Trend)和短期反转(SREV)、中期动量(MOM)以及长期反转(LREV)以及 Fama-French 三因子(Fama and French 1993)的收益。从均值(以及对应的 t-statistic)来看,趋势因子无疑优势明显。



接下来就来比较一下这个新的趋势因子和传统的动量、反转因子。


3

趋势因子 vs 传统动量、反转因子


尽管动量因子在美股上占有举足轻重的地位,但它经常被人诟病的是该因子在市场从熊市反弹时的不良表现。在这些时期,动量因子的空头一方总会出现报复性反弹,收益率远超其多头一方,造成动量因子巨大的损失。这个现象被称为 momentum crashes(Daniel and Moskowitz 2016)。


Han et al. (2016) 的经验结果显示,新的趋势因子在 momentum crashes 时期往往能取得非常优异的收益:



分析其原因,是因为新的趋势因子和传统的动量因子的相关性很低。由于该方法通过滚动回归动态的暴露在不同级别的移动均线指标上,因此可以想见在回测期内,它更多暴露在长、短期反转因子上,而非中期动量因子上。下图(Panel B)展示了趋势因子和传统因子的相关性,说明了这一点。



然而,在上面的结果中,最令我惊讶的是趋势因子非常小的最大回撤(max drawdown,MDD)—— 其最大回撤只有 20%(too good to be true),远远优于其他三个动量、反转因子。这说明在市场下行的时候,趋势因子中空头一方非常给力。当然,在实际投资中,考虑到交易的成本和各种做空的限制,上述结果会打一定的折扣。Han et al. (2016) 也客观的指出,为了科学评价该趋势因子在实际投资中的价值仍需要更多的研究工作。


为了定量比较新的趋势因子和传统的动量、反转因子,Han et al. (2016) 采用了学术界常用的 mean-variance spanning tests(Huberman and Kandel 1987)。直观的说,该方法考察 K 个已知资产构建的 mean-variance 有效前沿能否包含某个新资产(或者投资组合)。在数学上,考虑新的趋势因子和 SREV、MOM 以及 LREV 三因子的回归模型如下:



该检验的 null hypothesis 是:



Kan and Zhou (2012) 指出 mean-variance spanning tests 有六个不同的版本。下表考虑了全部六个版本,并考虑了不同的回测期 —— 全部回测期、衰退期以及金融危机。所有版本均显著的拒绝原假设,说明新的趋势因子存在传统动量、反转因子无法解释的股票截面预期收益差异。这意味着,仅仅通过将投资组合暴露于传统的 SREV、MOM 以及 LREV 三因子无法取得该趋势因子带来的超额收益。



最后来看看趋势因子能否被 CAPM 模型以及 Fama-French 三因子模型解释 —— 即考察它是否有 CAPM-α 和三因子-α。除了考察趋势因子自身之外,Han et al. (2016) 还考虑了根据预期收益率高低将股票分成五档构建的投资组合,结果如下表所示。



从结果来看,对于趋势因子,它存在无法被传统 CAPM 或 Fama-French 三因子解释的超额收益。从因子暴露来看,当使用三因子模型时,它在 SMB 和 HML 上的暴露在统计上非常不显著。


面对如此超额收益,Han et al. (2016) 却指出,他们并不认为该趋势因子一定是一个异象(anomaly)。作者认为趋势背后也许存在对应的风险,而趋势获得的超额收益和风险补偿有关。有效市场假说(EMH)之父 Eugene Fama 指出,market efficiency 已经成为一个 joint hypothesis 问题 —— 即为了检验市场有效性,首先要有一个合理的 asset pricing 模型;如果模型未知或者错误,就不能正确的评判任何异象是否真的是异象。这意味着,检验 EMH 的同时必须也要检验 asset pricing 模型。依照这个思路,如果趋势因子(或者更传统意义上的动量)是真实(但未知)asset pricing 模型的一部分,那么它获取的超额收益就是某种风险的补偿,而非市场异象。


4

趋势因子是否来自数据挖掘?


正如引言中所说的,我最初对趋势因子持怀疑态度,认为它不可避免的存在数据挖掘的问题。与传统的动量或反转因子相比,该因子无论从模型复杂度或者参数复杂度都更高,因此数据挖掘的可能性也更大。针对这方面,Han et al. (2016) 从四个角度进行了阐述。


首先,三位作者指出,构建趋势因子所使用的移动平均窗口长度并非优化的结果,这些参数背后都有一定的业务逻辑。第二,如果把回测期按照每十年分成一个区间并观测趋势因子在这些区间内的表现(下图)会发现该因子获得的收益非常稳健。作者指出稳健的表现说明该因子不太可能是数据挖掘的产物



第三,Harvey et al. (2016) 针对“因子挖掘”界普遍存在的 multiple testing 问题,提出单一因子的 t-statistic 至少要超过 3 才有可能是一个真的异象。而趋势因子的 t-statistic 高达 13.6(传统动量因子的 t-statistic 为 6.04),远超这一阈值。不过 Harvey et al. (2016) 自己也指出即便是这个阈值也非常保守。为此,Harvey and Liu (2018) 针对 multiple testing 的问题,提出了一个基于回归的分析因子有效性的框架(见《出色不如走运(II)?》),在该框架下,传统的动量因子已经不再有效。因此,使用该框架来进一步检验趋势因子是否有效可以作为一个未来的研究课题。


最后的第四个角度是 out of sample test,它无疑比前三个角度更具说服力。Han et al. (2016) 在其他 G7 国家(法国、英国、德国、意大利、加拿大、日本)的股市中检验了趋势因子的有效性。在所有这些国家中均观察到了来自趋势因子的超额收益;除德国外,在其他国家中的月频 CAPM-α 均高于 1%。虽然趋势因子在这些国家中的表现没有在美股上明显,但无疑作为样本外的数据集,这样的结果支持了“趋势因子并非数据挖掘的产物”这一观点。


5

Fama-MacBeth Regression


除了上述四个角度的论述外,Han et al. (2016) 还进行了很多 robustness check 并通过考虑交易成本来检查趋势因子的有效性。本小节挑选这其中的 Fama-MacBeth regression(Fama and MacBeth 1973)进行介绍。Fama-MacBeth regression 的优势在于可以控制很多变量,从而考察目标变量在解释股票预期收益率截面差异的显著性。


在 Fama-MacBeth regression 中,回归方程左侧的是个股的收益率,在右侧的解释变量中,除了常见的因子(如 log(size)、log(B/M)、E/P)外,还加入了 ER_{trd}^{12}、ER_{trd}^{6} 及 ER_{trd}^{60} 等使用不同尺度 MA 计算出来的预期收益率。



结果(上图)显示,当考虑了常见的因子后,被加入回归的 ER_{trd}^{12}、ER_{trd}^{6} 或 ER_{trd}^{60} 依然对个股的截面预期收益率差异有非常显著的解释作用。


6

趋势因子和信息不确定性


长久以来,技术分析和基本面分析是股票投资中的两大派系,而移动平均是技术分析中的优秀手段。因此,本文介绍的基于移动平均的趋势因子也源自技术分析,是使用技术分析进行 asset pricing 的一种努力。当股票的(基本面)信息存在较高的不确定性时,投资者和交易者往往更倾向使用技术分析手段来选股。由此,Han et al. (2016) 提出了一个假设:在信息不确定性高的股票中(比在信息不确定性低的股票中)使用趋势因子可获得更高的收益。


为了验证这一点,该文选择了市值、特异性波动率、换手率、分析师覆盖、公司年龄作为信息不确定的代理指标。具体来说,高的信息不确定性意味着公司市值小、特异性波动率大、换手率低、分析师覆盖少、以及公司年龄短。


Han et al. (2016) 将股票逐一使用这些代理指标以及趋势因子进行 double sorting,然后考察趋势因子的效果,结果如下图所示(省略了 market size 这个指标)。以 IVol(特异性波动率)为例,对于 IVol 低的股票(信息不确定性低),趋势因子的月频收益率均值为 0.87% ,而对于 IVol 高的股票(信息不确定性高),趋势因子的月频收益率高达 2.25%。



对于其他的信息不确定性代理指标,也都可以观察到类似的结果,从而证实了“趋势因子在信息不确定性高的股票中能获得更高的收益”这一猜想。


7

结语


Han et al. (2016) 通过截面回归将美股上的短期反转、中期动量和长期反转合并成一个新的趋势因子。该因子能获得显著的超额收益,为美股的 asset pricing 提供了新的思路。除了本文介绍的内容外,Han et al. (2016) 还包括更多的统计检验,给出了关于这个新的趋势因子的大量实证结果。


如果让我来总结一下,这篇文中最重要的一点在于使用传统 SREV、MOM 以及 LREV 三个因子进行的 mean-variance spanning 无法解释新的趋势因子。这意味着,围绕上述三因子暴露构建的投资组合无法获得基于这个单一趋势因子所能获得的超额收益。


为什么会出现这种现象了?下图 —— MA(20) 和 MA(100) 的回归系数随时间的变化 —— 给出了答案。这些回归系数随时间的变化意味着在构建趋势因子时,通过使用截面回归,该趋势因子动态的捕捉了不同时间尺度上的动量、反转信号在预测股票收益率时的作用。



虽然无法完全排除数据挖掘的可能性,但不可否认该因子在不同历史时期捕捉到了不同级别的动量、反转信号。Han et al. (2016) 这篇文章的实证结果到 2014 年 12 月,在未来可以采用 2015 年开始的样本外数据对其检验,考察其是否依然有效。


趋势追踪策略面临的最大难题通常是在哪种时间尺度上计算趋势。趋势往往很难稳健的存在于固定的频率。这个趋势因子从一定程度上解决了这个问题。然而,它背后一个较强的经验数据依据是美股在历史长河中确实存在显著的短期反转、中期动量和长期反转。如果在未来,用于计算该因子的一个或者多个级别的移动均线不再有预测收益率的能力,那么该趋势因子将会面临新的挑战。



参考文献

Daniel, K. and T. J. Moskowitz (2016). Momentum Crashes. Journal of Financial Economics, Vol. 122(2), 221 – 247.


DeBondt, W. F. M. and R. Thaler. (1985). Does the stock market overreact? Journal of Finance, Vol. 40(3), 793 – 805.


Fama, E. F. and J. D. MacBeth (1973). Risk, return, and equilibrium: empirical tests. Journal of Political Economy, Vol. 81(3), 607 – 636.


Fama, E. F. and K. R. French (1993). Common risk factors in the returns on stocks and bonds. Journal of Financial Economics, Vol. 33(1), 3 – 56.


Han, Y., Zhou, G., Y. Zhu (2016). A trend factor: any economic gains from using information over investment horizons? Journal of Financial Economics, Vol. 122(2), 352 – 375.


Harvey, C. R., Y. Liu, and H. Zhu (2016). … and the cross-section of expected returns. Review of Financial Studies, Vol. 29(1), 5 – 68.


Harvey, C. R. and Y. Liu (2018). Lucky Factors. Working paper, available at SSRN: https://ssrn.com/abstract=2528780.


Huberman G. and S. Kandel (1987). Mean-variance spanning. Journal of Finance, Vol. 42(4), 873 – 888.


Kan, R. and G. Zhou (2012). Tests of mean-variance spanning. Annals of Economics and Finance, Vol. 13(1), 139 – 187.


Wang, J. (1993). A model of intertemporal asset prices under asymmetric information. Review of Economic Studies, Vol. 60, 249 – 282.


Zhu, Y. and G. Zhou (2009). Technical analysis: an asset allocation perspective on the use of moving averages. Journal of Financial Economics, Vol. 92(3), 519 – 544.



    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存