隔夜不低开,就是好时景
1 问题
我一直以来想研究的一个问题是“指数的日内走势有没有什么特征可以鉴别出好的买点”。在我的构思中,走势特征的定义为:
在一个给定的时间区间指数的涨幅到达或者超过(即不小于)一个给定的阈值。
下面就是两个符合该定义的走势特征:
1 从开盘到上午10:00,指数至少上涨0.25%(时间区间是9:30到10:00;10点的股价较昨天收盘价的涨幅阈值是0.25%);
2 下午1:15到1:50,指数至少上涨0.3%(时间区间是1:15到1:50;1:50的股价较1:15的股价上涨阈值为0.3%)
因此,我想研究的是:指数 *是否* 存在这样的走势特征,每当这种特征发生时,我就马上以当时的价格买入,持有到下一个交易日并在下一个交易日以开盘价卖出,通过长期严格遵守这个策略便能够取得不错的收益。
本期的数据解码投资就是想通过实验对上面这个问题找到一个“是”或者“否”的答案。之所以考虑指数而非个股是出于两个原因:第一,指数流动性远远超过个股,不存在因为涨跌停或者停牌而无法交易的情况;第二个原因是个股受各路资金的影响太大,因此个股的日内走势的特征可能相当分散,而在任何给定的时间区间内无法形成在业务上可以重复利用且在统计上又非常显著的走势特征。
下面说明具体的研究方法。
2 研究方法
研究上述问题需要用到日内的高频数据(5分钟数据)。我们的研究对象是上证指数,回测区间是2006年1月5日到2016年6月30日。由于某些原因,我们缺少以下8个交易日的日内高频数据(07/3/23,08/4/2,08/4/3,08/4/11,08/4/25,08/9/10,08/9/18和08/9/25),因此我们假设这些日子无法交易,如果我们在之前持有仓位则在下一个可交易的开盘卖出。此外,在实验中,我们尽可能的确保所有5分钟历史交易数据的数据质量,但可能仍然存在一定的疏漏,会对实验结果造成一定的影响。
需要声明的是,本实验结果(无论好坏)都不构成任何投资策略推荐。我们仅仅希望以一个相对科学的框架来分析指数日内交易数据和收益率之间是否存在某种关联,并考察是否可以通过重复利用这种关联在长期取得不错的投资收益。
在实验中,为了测试不同的“走势特征”,我们考虑多组时间区间以及多种涨幅阈值的组合。具体的,时间区间的起点和终点都是在交易日内以15分钟为间隔取值(比如9:30、9:45、10:00等),且区间的终点必须在起点之后至少15分钟。因此,我们共有以下120种时间区间组合:
在涨幅阈值方面,我们的取值为以下8组:0.25%,0.5%,0.75%,1.0%,1.25%,1.5%,1.75%以及2.0%。
因此,我们一共有120×8=960种潜在的“走势特征”组合。涨幅阈值的范围比较宽泛(最大到2.0%)是为了使实验的范围尽量广泛。但符合大涨“走势特征”的交易日可能非常少。由于我们想寻找的是“走势特征”和收益率之间可被重复使用的关联,因此如果满足某种走势特征的交易日样本非常少,那么它就不满足我们的要求。基于这个原因,以及我们使用10年的交易日进行回测这个事实,我们规定最终考察的走势特征样本必须超过100个交易日。由此,我们排除了一些不满足上述规定的走势特征,最终得到624个组合。
对于一个给定的“走势特征”,我们构建投资策略如下:在每一个交易日,一旦指数当日的走势满足该走势特征,我们便在该时间区间的终点以当时的价格满仓买入并持有到下一个交易日开盘,并以下一个交易日以开盘价卖出;如果在这个交易日走势特征没有满足,那么则在当日空仓。所有买卖都假设没有冲击成本,单边交易费率为万2.5。
3 结果及分析
如上所述,实验考察了624个“走势特征”。以回测区间的累计净值高低为依据排序,得到的最优“走势特征”为:早盘9:45的价格较前一日收盘上涨超过0.25%。基于这个特征的策略在回测区间内的净值走势和同期上证指数走势的比较如下图所示:
该策略取得了非常不错的投资收益(年化收益率23.17%)。该策略在10年间一共交易794次,胜率高达60.2%。这里的胜率定义为,扣除手续费后,持仓期间可以录得正收益。
这个策略看起来固然可喜,但是我们必须思考的问题是:它取得这样的收益真是源于市场的某种特征?还仅仅是由于“运气”(因为是从624种参数之间选择,总能选出有一组好的,道理参见我之前的文章《出色不如走运?》)?
为了回答这个问题,不妨来看看这624组参数对应的策略的累计净值的分布情况(下图)。该分部呈现明显的右偏(偏度2.68),绝大部分特征组合的累计收益远远低于同期的上证指数。然而确实有一小部分参数对应的策略的净值远超过指数。这些参数有没有什么共性呢?如果确实存在共性,那也许暗示走势和收益率之间的某种关联。
我们比较累计净值最高的5个策略的参数,结果如下。令人欣慰的是,累计净值最高的这5组策略参数非常接近,它们的时间区间均在开盘到上午11点之间这段时间,收益率阈值为0.25%或者0.5%,它们所呈现出来的市场趋势为早盘指数的温和上涨。这5组优秀策略的参数接近说明策略在这个区间对参数不敏感,即这些好的结果不太可能来自随机性(运气),而是源于市场的某种特性。
如何解释这些参数下的优秀收益率呢?它们又传达了市场的什么特性呢?这些问题必须从以下两个角度综合考虑来回答。
第一个角度是:在一组优秀的参数——即市场“走势特征”——发生时,当日上证指数取得正收益的条件概率应该远超过其取得负收益的条件概率。换句话说,这个“走势特征”应该可以大概率的区分上涨和下跌的交易日。
以最优参数的“走势特征”为例,定义事件A为当天上涨,Ac为当天下跌;事件B为9:45的价格满足最优参数的“走势特征”;Bc为9:45的价格不满足该走势特征。根据回测区间所有的交易日数据样本,我们有如下的概率:
根据它们不难算出我们关心的条件概率Prob(A|B)和Prob(Ac|B),即在发生最优走势特征的条件下,当日上涨和下跌的概率。这两个条件概率可以通过贝叶斯原理很容易的得到。以Prob(A|B)为例:
这意味着,一旦9:45的价格较上一交易日收盘价格的涨幅超过0.25%,那么当天上涨的概率超过80%!这不能不说是一个非常高的概率。可见这个走势特征可以很好的区分出上涨和下跌的交易日。
然而,仅仅这样是不够的,因为这仅仅是考察了我们买入当天的收益率,但是因为无法T+0操作,我们必须等到下一个交易日才可以卖出。因此,即便在我们建仓的当日获得了浮盈,也无法知道在下一个交易日卖出时是否还能够赚到钱。这就引出了第二个角度,即隔夜收益率,它定义为下一个交易日开盘价相对于当日收盘价的涨跌幅。
为此,我们先来看看上证指数的一个“异象”。下图对比了上证指数日收益率和隔夜收益率的直方图。隔夜收益率的均值为负数,分布上呈现出一定的左偏。与此同时,上证指数的日收益率均值为正。两者对比便构成了“异象”:上证指数一般都会隔夜低开。
我们猜想这种现象和游资的存在以及无法T+0操作有关。在进一步解释之前,我们先来看看净值最高的5个“走势特征”和净值最低的5个“走势特征”的隔夜收益率分布情况(参见下面两图:第一张图为最优的5个策略的隔夜收益率分布;第二张图为最差的5个策略的隔夜收益率分布)。
最优的5个策略的隔夜收益率分布均值非常接近0或者为正。最差的5个策略的隔夜收益率则均值为负,且直观上分布也呈现明显的左偏(即负收益率的样本多余正收益率的样本)。这说明隔夜异象对最优策略的收益率影响要远远小于其对最差策略的收益率的影响。
在上证指数隔夜低开的背景下,优秀的走势特征可以在很大程度上区分出下一交易日隔夜收益率的正负两种情况。这一点也是在这些参数下策略可以取得优异累计收益的必要条件。
下图展示了最差的5个参数对应的策略的累计净值。可喜的是,它们的参数也非常集中。下面我们就来根据最好和最差参数的特征来尝试解释上证指数的内在特征。
我们看到,最差的5个策略的参数集中在上午10点15到11点间的某个区间上涨。我们对此的猜想是这疑似游资在炒作。显然,游资的成本比策略触发时我们建仓的成本低。由于不能T+0操作,游资在下一个交易日开盘跑路,造成低开,导致我们的策略亏损。
而反观最好的五个参数,它们均意味着上证指数从开盘就温和普涨。由于隔夜负收益率这个异象,早盘11点以前能温和上涨大概率说明游资没有出逃或者即使出逃市场也没有受到冲击,从一定程度上反映出市场趋势是好的。结合净值曲线看这些最优策略基本上是靠正确地抓住了市场上涨的趋势,说明上午温和普涨的驱动力不是游资炒作,而是好的行情,因此在这种情况下第二天低开的概率低,第二天再卖就也能仍然能够取得正收益。
4 结语
本文利用日内高频交易数据对上证指数日内走势特征和日收益率之间的关联做了一定的分析。在考察的600多种走势特征中,我们发现最好的和最差的那些走势特征各自呈现出一定的共同点。这让我们愿意相信好的策略不是来自运气。为此,我们从无法T+0、游资炒作、隔夜低开、趋势性行情等角度结合对两者进行了猜想,旨在揭示上证指数一些内在的特征。
当然,即便这个走势特征确实成立,我们也只能说该特征在回测的10年内有效。未来它是否依然有效?只有时间能给我们答案。
写完此文,恰逢收盘。看看今天上证指数的走势,满足10:45点到11:00涨幅不少于0.25%这个特征(涨幅为0.26%)。基于这个特征的策略年化收益率为-5.57%,最大回撤为56.04%,这似乎被今日的收跌所验证……