查看原文
其他

券商如果会择时,那他们怎么不上天呢?

石川 川总写量化 2022-05-14


前言

大部分券商的量化投资团队都会对下周大盘的涨跌进行预测(又称择时)。预测这事本身没有任何问题,我自己也喜欢基于概率统计的计算进行科学预测。从哲学的角度来看,股市的涨跌理由有无穷多维,而人只能看到有限的部分。因此这种周频日频的涨跌预测是非常难的。对我自己而言,如果预测对了,那是1%模型的正确 + 99%上帝的眷顾(打个比方而已,说明这个事儿非常难);如果预测错了,也会欣然接受,因为这是生活的常态。这就好比守门员扑点球,不管站在门前的是布冯,诺伊尔,还是拿着纸条的莱曼,都要在对方出脚前就做出往哪边扑的判断。如果扑出点球,那是运气+经验的胜利,如果扑不出去也没什么可遗憾的。


(图片来自网络)

然而这些券商们在预测这件事儿上表现得很不地道。首先他们说话非常模棱两可,比如“市场持续震荡,逢低就是加仓机会”。这么说的原因无非是无论后市涨跌,他们说的都是对的、证明他们的“先知”。但是这种观点对投资者来说然并卵,听了半天也不知道到底是要涨还是要跌,以及何为低位。第二,在他们刚好蒙对了涨跌的时候(他们总有猜对的时候),便摆出一副唯我独尊、舍我其谁、不可一世、目空四海、旁若无人的嘴脸。但仔细看看他们惨淡的收益率或者令人瞠目结舌的最大回撤,就不得不佩服他们哪来的自信。

今天,我们就解释一下如何正确评价预测的准确性(正确率和召回率同样重要)。

如何评价预测的正确性

预测的正确性必须从准确率和召回率两方面同时评价。假设我们一共猜了X次涨以及Y次跌。在我们猜涨的X次中,有A次猜对了、B次猜错了;在我们猜跌的Y次中C次猜错了D次猜对了(如下表所示)。则这两个指标的定义为:

用白话来说,准确率衡量的是在所有你猜测的某一类(涨或跌)样本中,有多少是正确的;而召回率是用来衡量所有某一类的(或跌)样本中,有多少被你猜出来了如果白话定义依然晦涩,考虑下面的例子。假如我们做100次周收益率的预测,其中我们有60次猜涨,40次猜跌;事后来看,在我们猜涨的60周里,有35周确实是上涨了,而有25周是下跌的;在我们猜跌的40次里,有20周确实下跌了,而另外20周上涨。这样,基于如上定义,我们的预测正确性为:

  • 猜涨准确率 = 35 / (35 + 25) = 35 / 60 = 58.3%

  • 猜跌准确率 = 20 / (20 + 20) = 20 / 40 = 50%

  • 猜涨召回率 = 35 / (35 + 20) = 35 / 55 = 63.6%

  • 猜跌召回率 = 20 / (20 + 25) = 20 / 45 = 44.4%

准确率和召回率是一对矛盾的统一体,它们在评价预测正确性时同样重要,缺一不可。接着上面的例子说两个极端的情况:假如这100次我全部猜涨,那么我猜涨的召回率会是100%(即所有的上涨我都猜出来的),但我的猜涨准确率却只有60%;又或者假如我只是猜其中的某一期上涨而不猜其它99期而且我猜对了,那么我的猜涨准确率便是100%,但我的召回率仅有可怜的1.67%。可见,准确率和召回率有那么点“鱼和熊掌不可兼得”。一般来说,想提高其中一个指标必然要以牺牲另一个指标为代价。一个真正牛逼预测的上述四个涨跌指标一定都是很高的

券商量化择时忽悠还是真有货

如前所述,一个牛逼的预测必须既有较高的准确率又有良好的召回率。然而,一般券商在周频择时量化报告中,提到的猜涨准确率一般是55%左右、猜跌准确率一般是50%左右(因为中国股市的特点,猜涨比猜跌稍微容易些)。然而券商报告中一般是不提召回率的。这样的准确率到底高不高呢?他们的方法会比完全随机猜或者其他更简单的启发性方法好吗?下面我们用最近10年的上证指数周收益率做一些简单地分析。


(图片来自网络)

首先假设我们完全随机地猜每周的涨跌。具体的,每周我们扔一个无偏的硬币。我们各有50%的概率得到正面和反面,如果得到正面,我们猜下周涨,反之则猜跌。因为扔硬币有随机性,因此我们做20000次这样的实验。每个实验中,我们通过扔硬币预测上证指数在过去10年间每周收益率的涨跌。之后我们取这20000次实验的均值作为正确率的判断。这20000次实验得到的结果如下(用小数而非百分数表示,结果精确到小数点后6位):

  • 猜涨准确率0.524752

  • 猜跌准确率0.475433

  • 猜涨召回率0.500125

  • 猜跌召回率0.500058

其实,按照这种纯随机的猜法,这些数字完全在意料之中。这是因为在过去10年里,上证指数上涨周的个数占了0.524664(是不是非常接近猜涨准确率?),而下跌周的个数占了0.475336(是不是非常接近猜跌准确率?)。另一方面,猜涨猜跌的召回率都非常接近0.5,即硬币正反两面各自的概率。

事实上,对于任何一周(无论它是上涨还是下跌),这种纯随机猜中的概率就是50%,这就解释了为什么召回率非常接近50%(即有一半时间会猜对)。而对于准确率来说,因为实际上涨概率为p而我每次有50%的概率猜涨,因此我每次猜涨且猜对的概率为p/2(因为是扔硬币,所以我猜的涨跌与实际的涨跌这两件事是独立的),又因为我一共要猜n期,所以我猜上涨且猜对的次数的平均值为np/2(同理,我每次猜跌且猜对的次数平均为n(1-p)/2)。在n期中,因为我每次都以50%的概率猜张或跌,因此我猜涨跌的平均次数均为n/2。最终,随着实验个数的增加,这种随机方法的猜涨准确率向(np/2)/(n/2)=p逼近,同理猜跌准确率向1-p逼近。这就不难解释上面的实验结果。可见,我只要找到个硬币,就能得到涨跌准确率平均下来52.5%和47.5%的效果,并不比券商使用的复杂择时模型差多少。当然考虑到运气的成分(其实是随机误差),这种方法实际的准确率会在一定程度上偏离这两个均值,可能会稍好或稍差。这是券商模型比这个随机方法强一些的地方。我其实想说券商拿了那么多钱做出个复杂的模型,但从实际效果来看就是消除了一点纯随机猜法引入的随机性而已,并没有提高均值。


(上指指数过去10年周频蜡烛线)

除了纯随机的猜法,有没有更好地利用股市特点的启发式方法呢?考虑到上证指数明显的牛熊特性,不妨用下面这个猜趋势的规则预测,即如果过去八周的平均周收益率为正,则猜下周上涨,反之猜跌。按照这种方法得到的结果如下:

  • 猜涨准确率0.582960

  • 猜跌准确率0.534884

  • 猜涨召回率0.555556

  • 猜跌召回率0.542453

可以看到,基于抓趋势的猜法,涨跌准确率和召回率较随机猜法都有明显提升,且均高于券商报告中的一般水平。因此,这种猜法在过去10年可以被视作一个很好的评价基准。如果券商的量化算法不能超过它,那我就实在想不出他们有什么脸赚投资人的钱了。

结语

股市投资研究的是上市公司未来的盈利能力、升值空间等。如果能有效并科学地预测股价的涨跌,那回报自然是非常可观的。然而,本文想说明的是在日频或周频这种高频上,对收益率进行预测是非常困难的。因此,大部分券商在分析报告中只能含含糊糊、模棱两可,根本不敢提供明确的观点。更令人反感的是,事后无论涨跌他们还都跳出来评论一番,说自己之前猜的如何之正确。

如果他们真猜的很准又爱嘚瑟,那他们为什么要在报告中放那么长的免责声明呢?

如果他们真猜的很准又爱嘚瑟,那他们怎么不上天呢?

(图片来自网络)

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存