收益率到底能不能预测（实证篇）？

Original 石川川总写量化 2022-05-14

收录于合集 #时间序列分析 8个

作者：石川，量信投资创始合伙人，清华大学学士、硕士，麻省理工学院博士；精通各种概率模型和统计方法，擅长不确定性随机系统的建模及优化。

引言

我们都习惯了早上 8 点半准时等候在站台的列车；习惯了中午食堂的师傅给我们预留一份当日的工作套餐；习惯了每周的 happy hour 里公司供应的咖啡的味道 —— 半勺糖、不加奶……这些一成不变的体验让我们感到非常舒服，因为所有的这些结果都是符合预期的、是可预测的。

人们都喜欢可预测性，在生活中如此，在市场中更是如此。这也就是为什么学术界和业界都在研究资产的收益率是否有预测性。本系列的前篇（《模型篇》）从描述资产对数价格的随机游走出发，介绍了两种检验对数价格（对数收益率）的随机性的模型：“顺序/反转检验”和“游程检验”。

作为系列的后篇也是实证篇，我们就来用这两个检验测试对 A 股做一些实证。我绝不否认市场中存在很多个股层面的错误定价，这些错误定价是由于价格偏离价值造成的。它们使得个股层面的收益率存在一定的预测性。但这些可预测性不是我们的关注点。我们的目标是考察时间序列层面的可预测性，进而回答诸如“复杂的机器学习或者时间序列分析这些手段在量化投资中到底有没有用”这样的问题。此外，错误定价造成的收益率可预测性一般都是在一个长时间的尺度上来看的，而我们更关心的是短期收益率是否能预测 —— 比如收益率序列中是否有足够的非随机性让我们能大概率的猜出下一个交易日或者下一周的涨跌。

基于这些考虑，本文的实证考察市场收益率是否具有可预测性，因此我们选择 A 股上的代表指数 —— 沪深 300 指数 —— 作为研究对象（鉴于 A 股几大指数的时序相关性非常高，因此本文的结果也可以扩展到其他几大股指），检验它的收益率是否有预测性。

日频检验

一般来说，计算收益率的频率越高，它的噪声越高、确定性越低。我们正好用沪深 300 指数的收益率来验证一下。为此，首先以日频对数收益率为研究对象，用“顺序/反转检验”和“游程检验”检验其随机性。

假设回测期是 2011 年 1 月 5 日到 2018 年 2 月 7 日。如果让我们判断指数日频对数收益率在整个时间区间内的随机性，那即便不计算也会猜它是随机的。不出意外，检验的结果证实了这个猜想：

顺序和反转检验：CJ 统计量 = 1.022，p-value = 0.646，结论为对数收益率在整个区间满足随机性。

游程检验：Z 统计量 = -0.406，p-value = 0.684，结论同样为对数收益率在整个区间满足随机性。

接下来使用滚动时间窗口看看在股市发展的不同时期，沪深 300 指数的局部是否表现出非随机性。选择滚动时间窗口为 26 周（即半年），在每个交易日滚动计算过去半年内的日频对数收益率是否具有非随机性。

下图为“顺序/反转检验”的结果，其中绿色曲线为沪深 300 指数，蓝色曲线为检验的 p-value（红色水平线为 5% 显著性阈值，当蓝线在红色以下就说明在 5% 的显著性水平下显著）。特别需要强调的是，滚动检验非随机性时，结果都是滞后的（就像计算移动平均一样，因为只有发生了之后才能计算）；但是为了更好使用检验结果表明同期沪深 300 指数的非随机性，我们把蓝线整体向前平移了 26 周 —— 即滚动时间窗口的长度；这在视觉呈现上更容易说明问题，即图中蓝线低的部分就说明同期沪深 300 指数具有非随机性。只不过不要忘记在现实中，该指标的计算有滞后性。

从上面的结果可以观察到，日频对数收益率在回测期内的绝大多数时间没有统计意义上的显著非随机性（表现为蓝线在 5% 显著性水平这根红色阈值之上）。一些例外是，在 2013 年的上半年，以及在 2015 年大牛市和大熊市的部分阶段，日频收益率显示出了一定的非随机性。

最有意思的是股灾 3.0 之后（2016 年 3 月开始），以沪深 300 指数为代表的蓝筹股开始了一段为期两年的大涨。但从日频收益率上来看却几乎看不出非随机性。这样的特征和美股的大指数（比如 SP 500）十分接近，说明市场的收益率在长期来看由一个正的漂移率项主宰，抛开了这个之后的残差部分几乎没有可预测性、就是个波动不小的随机运动，赚钱效应则是真正奖励给那些从基本面出发坚定买入并持有的人，而任何主动的择时都会由于这种扰动带来的负 Vega（即策略净值对标的波动率的偏导数）而造成亏损。使用“游程检验”也会得到类似的结果（下图），这里不再赘述。

事实上，如果比较这两个检验的 p-value，会发现它们非常接近（下图）。从两个检验的定义来看（见《模型篇》）二者也十分类似，在实际使用中选择哪个都可以（我个人在实证中见到使用“游程检验”更多一些）。

周频检验

接下来，让我们把目光转向周频。同样的，首先考察在整段回测期内周频对数收益率的非随机性：

顺序和反转检验：CJ 统计量 = 1.105，p-value = 0.358，结论为对数收益率在整个区间满足随机性。

游程检验：Z 统计量 = -0.760，p-value = 0.447，结论同样为对数收益率在整个区间满足随机性。

周频对数收益率在整段回测期内来看仍满足随机性；其比日频更低的 p-value 值似乎说明周频上的非随机性更高一些（尽管在统计意义上仍不显著）。下面使用 26 周的滚动窗口考察局部非随机性。

下图为“顺序/反转检验”的结果。与日频收益率的结果相比，它显示在 2011 年的下半年周频收益率有一段明显的非随机过程；以及在 2016 年底、2017 年初周频上也存在一定的非随机性。此外，在 2015 年的牛、熊周期中，周频表现出了比日频更显著的非随机性，这个结果并不令人意外。

对周频对数收益率使用“游程检验”，也会得到类似的结果（下图）。

比较本节和上一节的结果，我们可以观察到如下结论：

1. 无论是在日频还是周频，在排除了低频漂移率后，对数收益率在市场处于震荡时均没有显著的随机性。

2. 在大牛市和大熊市，排除低频漂移率之后，对数收益率仍然能够表现出一定的随机性。但不要忘了，上面所有这些图中，表示随机性强弱的 p-value 都被向前平移了，这意味着在现实中我们观测到这些非随机性都会有一定的滞后。

下面就来看看收益率上的局部非随机性对于构建策略到底有没有帮助。

简单均值 vs 复杂模型

我们在之前的专题中介绍过时间序列分析、Hurst 指数和分数布朗运动、以及一些常见的机器学习算法。相比于技术分析中最常见的均线（移动平均），这些无疑都是更高阶的算法。但是它们和均线又有本质的不同。均线就是为了计算收益率的低频分量 —— 漂移率项；而这些复杂的算法则是为了分析收益率的残差项（即排除了收益率中的漂移率、周期性等之后所剩余的部分）是否存在预测性。如果残差满足非随机性，这些复杂算法则有用武之地。

前面的实证分析结果显示，当市场处于大牛、大熊市的时候，收益率确实存在统计意义上显著的非随机性。但不要忘了，在些时期，收益率的漂移率项也显著的不为零。在一个很强的非零漂移率项面前，残差中的非随机性是“锦上添花”还是“画蛇添足”？这是在建模篇的最后抛出的问题。

为了回答这个问题，我们对沪深 300 指数采用简单移动平均和时间序列的 ARMA 模型构建两个简单的基于日频收益率预测的择时策略。策略的大致思路是预测每个交易日的收益率，如果大于零则持仓、否则空仓。具体的，这两个策略分别为：

移动平均模型策略：

对于每一个交易日，计算过去 40 个历史交易日收益率的均值，如果均值大于零则在该交易日持有沪深 300；反之空仓。不考虑交易成本。

ARMA 模型策略：

对于每一个交易日，使用之前的 40 个历史交易日收益率构建带常数项的 ARMA 模型，对该日的收益率预测。模型参数方面，ARMA 的阶数 p 和 q 的取值范围均为 1 到 4，并根据 AIC 准则确定最优参数。如果收益率预测为正则持仓；反之空仓。不考虑交易成本。

由于在 ARMA 模型中考虑了常数项（即低频漂移率项），因此它实际上是在简单移动均线的基础上额外考虑了残差中可能存在的非随机性。这两个策略和沪深 300 指数本身的净值如下图所示。其中绿线为简单均值模型、蓝色为 ARMA 模型。

令人失望的是，更复杂的 ARMA 模型不但大幅跑输简单均线模型，它就连指数本身都没有超过。颇具讽刺意味的是，这两个策略的净值的差距主要在三波牛、熊市中被拉开，而牛、熊市恰恰是残差中的非随机性最强的阶段。这意味着哪怕是当市场表现出了非随机性的时候，这种可预测性和低频分量相比也十分微弱。在预测收益率时，残差的非随机性对于低频漂移率来说仍然是“噪声”。

对构建策略的启发

“

不要把时间序列中的长期漂移率项当成可预测性。

”

上面这句话是这个系列两篇文章的主题。实证结果说明，在构建策略时，真正有用的不是收益率残差中那一抹可有可无的预测性，而是收益率的低频漂移率分量。当这个分量为正我们就应该坚定地持有；而当这个分量为负就应该坚决的离场。

然而，低频漂移率项的改变是很难预测的。市场状态的变化（market regime change）—— 比如牛、熊市的转换；或者是影响重大的全球性事件（比如美国加息、特朗普签署针对中美贸易议题的总统备忘录等），这些是能够改变市场收益率低频分量的。

对于这些事件何时发生、以及发生了又会在多大程度上影响市场，这类判断是非常困难的。很多时候，即便发生了能够改变市场低频分量的事件，但由于信息在投资者中传播的速度不同，以及不同人的该事件的反应也不同，它最终能被价格充分反映到位也是需要时间的（可参考《写在当越来越多的人谈论价值投资时》中阪神大地震对日本乃至全球股市影响的例子）。

由于这些因素，提前对市场的动向做出正确的判断（即做一名左侧交易者）是非常困难的。人们都喜欢事情按自己期望的发展：买入了希望价格接着涨、卖出了希望价格继续跌。一旦发展不符合预期就会恐慌。这并非市场的错误，而是预期的错误。

A 股代表性指数的走势和上面这个简单均线择时策略的结果告诉我们：

1. 市场的低频分量是会发生变化的，但是何时发生、幅度如何，非常难预测。

2. 做一名右侧交易者挺好的，即根据市场已经出现的变化做出正确的应对，比如市场涨了跟着买入；市场扭头了果断卖出。

任何时候，正确的应对都是最为关键的。市场的走势扑朔迷离，没有什么固定的模式，也总会出乎人们的预料；但是在交易中，我们总能根据合理的假设做出一致性的应对。比如在上面的例子中，我们假设每当市场收益率的低频分量改变后，它会持续一段时间，因此当低频分量为正时，进入市场、当低频分量为负时，离开市场。这种一致性的应对是任何一个成功策略的必要条件。

在 2018 年 2 月份发生“黑色一星期”的时候，有朋友问我怎么看。我说既然已经跌下来了，与其瞎猜会不会再暴力反弹，不如老老实实的按策略减仓（正确的应对）。我也比较认可“基本面选股、技术面择时”这个思路。任何策略都是针对市场的某部分特征、赚它该赚的钱；任何策略也都有它无能为力的地方。既然市场是难以预测的，就把策略表现的不确定性交给市场、努力排除一切人为干预带来的额外扰动。持之以恒地执行这样一个量化策略，得到一致性的交易结果；只要这个策略的期望收益是正的，时间最终会变成我们的朋友。

高三女生醉酒后被强奸致死？检方回应

常德悲剧：让谴责无差别杀戮之声更加响亮一点

2024【公共营养师】培训报名通道已开启，不限学历，23岁及以上可报！还能领2000补贴

【惊】"以为要写遗书"! 飞温哥华航班遇炸弹气旋华人崩溃大哭连空姐都吐了; 客机颠簸盘旋3小时

女人最偏爱的十种男人

收益率到底能不能预测（实证篇）？

您可能也对以下帖子感兴趣

高三女生醉酒后被强奸致死？检方回应

常德悲剧：让谴责无差别杀戮之声更加响亮一点

2024【公共营养师】培训报名通道已开启，不限学历，23岁及以上可报！还能领2000补贴

【惊】"以为要写遗书"! 飞温哥华航班遇炸弹气旋 华人崩溃大哭 连空姐都吐了; 客机颠簸盘旋3小时

女人最偏爱的十种男人

生成图片，分享到微信朋友圈

收益率到底能不能预测（实证篇）？

您可能也对以下帖子感兴趣

【惊】"以为要写遗书"! 飞温哥华航班遇炸弹气旋华人崩溃大哭连空姐都吐了; 客机颠簸盘旋3小时