查看原文
其他

【天天阿尔法】因子降维1:底层因子降维方法对比

2017-12-14 量化投资大家学

导读:

随着投资者对于选股因子挖掘的深入,构建选股模型时可供选择的因子越来越多。随之而来的问题也逐渐增多,其中有两个问题值得关注:1)因子在数量较多的情况下,无法高效地进行因子正交化处理;2)对于某一类高相关因子,正交的手段无法较好地提炼这一类因子中的信息。对于上述问题,投资者可通过因子降维进行处理。由于因子降维方法多种多样,故而本报告为投资者提供了几种基本降维方法的效果回测对比。


1  选股因子的降维


随着因子库中因子数量的增多,因子之间的相关性不可避免,逻辑类似的因子往往具有较高的相关性。故而需要通过因子的降维来提炼高相关因子集合中的信息。



降维权重是因子降维的关键,不同的降维方法会给出不同的降维权重,从而影响降维后因子的表现以及模型最终的表现。报告主要从以下三种思路出发,构建了相关降维方法:


1) 选取类别内选股效果最强的因子。由于IC是一个较好的衡量因子选股能力的指标,可在同一类选股因子中选取IC均值绝对值最高的因子。


2) 按照类别内各因子选股能力加权。由于IC是一个较好的衡量因子选股能力的指标,对于同一类因子,可基于各因子的IC进行加权处理。


3) 最大化解释类别内各因子选股能力波动。可基于各因子的IC序列进行主成分分析,并选取第一主成分的权重作为该类因子的降维权重。


2  选股模型降维前后对比


基于“选取类别内最强”这一思路,可使用IC衡量因子选股效果的强弱。故而可对类别内IC最高的因子给予100%的降维权重。若投资者考虑到IC的可比性,则可使用正交因子的IC作为衡量指标。下表展示模型降维前后的表现。



降维后的复合因子相比于未降维的复合因子有更好的选股能力。复合因子IC、Rank IC、ICIR以及Rank ICIR都出现了上升,且因子TOP BOTTOM 10%多空收益、多头收益以及空头收益也在降维后有所上升。在使用了正交因子IC后,降维后复合因子的选股能力得到了进一步的增强。


基于“类别内因子选股效果加权”这一思路,同样可使用IC衡量因子选股效果的强弱。故而可基于因子IC的大小,对于类别内各因子分配降维权重。若投资者考虑到IC的可比性,则可使用正交因子的IC作为衡量指标。下表展示了该种方法下,模型降维前后的表现。



模型在进行了因子降维后,选股能力得到了提升。复合因子IC、Rank IC、Rank ICIR都出现了上升,且因子TOP BOTTOM 10%多空收益、多头收益在降维后有所上升。值得注意的是,模型月度多空收益的改善更多来源于多头收益的提升,而非空头收益的改善。


通过使用正交因子,在类别内分配因子权重时能够剔除其他类别因子的影响,从而得到更好的分配结果。


从复合因子的角度看,降维后复合因子的IC、ICIR、胜率以及显著胜率都优于改进前的降维方法以及未降维的模型。


基于“最大化解释类别内因子选股效果波动”这一思路,可使用主成分分析进行因子降维。在实际操作中,可对于因子的历史IC序列进行PCA分析并取第一主成分权重作为降维权重。同样,投资者也可使用正交因子的IC序列进行PCA降维。



在PCA方法下,降维后的复合因子提升幅度有限,仅在因子的IC均值、多空收益率上有所提升,而因子ICIR相比于降维前出现了回落。使用正交因子后,降维后的复合因子选股效果反而出现降低,复合因子在IC、ICIR、月度胜率以及多空收益上都弱于类别内PCA降维下的复合因子。


剩余内容,请点击此处查看原文。该文章由微信公众号“海通量化团队”原创 ,ID:“ht_quant” 。本订阅转载目的在于传递更多信息,第三方转载请与原账号联系。



相关推荐:

1、【天天阿尔法】分位数回归在多因子选股中的应用

2、【天天阿尔法】因子分析(3)—— 主成分分析的操作过程

3、【天天阿尔法】因子分析(4)——因子分析案例介绍


注:点击阅读原文,进入量化掘金交流“源”地——量邦社区,带你一同开启量化世界的玄妙之门。若手机无法显示策略源代码, 用电脑打开可查看策略源代码,网址:bbs.quanttech.cn

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存