李自悟:超越885001,如何做一只稳定跑赢市场的躺赢基金?
会议主题:超越885001,如何做一只稳定跑赢市场的躺赢基金?特邀嘉宾:李自悟,历任 MNJ Capital Management 交易员、BlackRock 研究员、国家外汇管理局中央外汇业务中心基金经理、上海均直资产管理有限公司基金经理、野村东方国际证券量化投资主管。2022年8月加入海富通基金管理有限公司。现任海富通量化投资部基金经理。
苏俊豪:李总下午好,首先能介绍一下您的投资理念和投资框架吗?李自悟:我个人比较遵循纯正量化理论对市场的理解。在股票市场上,我们有主动投资和量化投资两种不同的流派。主动投资通常从市场的个体,如一家公司或某个行业出发进行研究。因此,主动投资经理会对行业以及行业内部的公司进行深入研究,因此从这个角度而言,股票的主动投资可能更多的是从微观视角看待市场。量化投资的出发点则与主动投资有所不同,其起源在于对市场异常定价的研究。无论是我们常说的CAPM模型,还是Fama-French三因子模型,都是研究市场普遍存在的规律,或者说从相对宏观的视角去解构市场,从中提炼出适用于不同时间和不同股票的规律及现象并加以利用。就我个人的投资理念而言,更推崇这种思路:即通过对市场广度的研究,尤其是在投资策略的广度上,让投资组合获得更多元化的超额收益来源。在实践量化投资理念时,我们主要从两个维度来扩展量化策略的广度。首先是数据,量化研究的核心是对各种各样数据的研究和运用,因此数据的丰富程度和信息维度对我们的研究结果有很大影响。我们会同时运用微观数据,如公司基本面和量价相关数据,以及中观数据,如行业和宏观经济相关数据,希望从这些不同的数据来源中获得不同的阿尔法来源和灵感。另一个维度是策略,数据可以通过不同的组合方式构建成策略,从而帮助我们从不同角度挖掘到一些相关性较低的因子和策略组合。桥水的Dalio说过:“成功的投资关键在于打造一个有多元化阿尔法来源的投资组合”,我们在投资实践中也是遵循着这个理念。苏俊豪:最近我们留意到,在传统的宽基指数之外,越来越多的人把目光投向了万得的偏股型基金混合指数,也就是885001这个指数,您是怎么看待这个指数的呢?李自悟:885001指数相较于传统的宽基指数,其特点在于:传统宽基指数是由一篮子的股票构成,而885001指数本质上是基金指数,全称是万得偏股混合型基金指数,其成分构成包括了全市场大约3400只偏股混合型基金。另外,它在成分选择上采用了与常见的份额或规模加权不同的等权形式。这样的加权方式实际上会放大规模较小的基金对整个指数收益的影响。在基金领域,规模在很多时候会有负面影响,而小基金则有“船小好调头”的优势。另一方面,A股市场一些制度化的超额收益来源,例如打新收益等,会通过等权的方式放大,这使得885001指数相对于一般份额加权的基金指数而言更难以战胜,我们从公募行情较好的2019年和2020年可见一斑。与传统的宽基指数相比,我认为885001指数仍具有一定的优势,主要体现在行业和仓位上的配置更为灵活。传统宽基指数成分股通常半年调整一次,调整幅度通常在20%左右。相比之下,公募基金的调仓频率显著高于宽基指数,一般每年换仓都在一倍以上甚至更高。因此,公募基金在仓位和行业的调整频率上相对于宽基指数具有一定的优势。从收益的角度来看,通过万得数据统计从2010年到2022年年末,885001的年均回报达到7.5%,相比之下其它宽基指数的年化回报大多在3%到4%之间。特别是从2015年开始,随着市场机构化的趋势加强,公募基金的平均收益水平也得到提升。从2015年到2022年年末,885001的年化收益已达10.2%,显著高于同期的宽基指数(如沪深300和中证1000)。这也符合我们的直观感受:即指数很多时候涨幅并不高,但很多公募基金却能持续创出新高。从风险的角度来看,我们经过统计发现885001指数的高收益并不意味着高风险。885001不论是从年化收益还是年化波动率还是最大回撤来看,它在大多数年份都好于中证500和中证1000,甚至在某些年份表现比相对最稳健的沪深300指数也更好一些。简言之,885001的收益相对于宽基指数更高,同时其风险更小,这也是市场现在越来越倾向于从宽基指数转向如885001这种有特点的基金指数的原因之一。苏俊豪:885001代表了基金收益的平均水平,但我们看到,能够持续战胜这个指数的基金是少之又少,您觉得其中的难点在哪里呢?李自悟:这是一个有趣的问题,因为885001本质上代表了市场的中位数水平,所以理论上每年至少有一半的基金能够跑赢市场中位数。但是如果拉长时间,从连续三年跑赢的角度来看的话,这个水平会大幅下降到大约是10%左右。我认为有两个主要原因导致基金难以长期跑赢885001:一方面从宏观角度来看,A股市场是一个风格和行业轮动极快的市场。例如,2017年至2019年是消费股的大牛市,而2020至2021年则转向新能源;在去年市场普跌情况下,煤炭等一些周期性上游品表现较好,但今年市场又快速切换到了TMT的行情上,这种轮动的演绎仍在如火如荼地进行。因此就基金经理的能力圈而言,能够在这些差异很大的行业或风格上都能显著获得超额收益的基金经理数量很少。另一方面从微观角度来看,目前国内市场上的公募产品越来越趋向工具化和赛道化,每个产品都有适合的市场环境和舒适区,要在不同市场环境中都获得显著的超额收益并不容易。但从市场需求的角度而言,不论是从个人还是机构投资者的角度出发,可能持续跑赢比某年大幅跑赢更加重要。对机构投资者而言,很多收益结算都以年度为单位,上一年的超额收益对今年的业绩不会有很大帮助,不会因为去年超额多,今年要超额的指标就可以减少,因此每年都需要有获取超额收益的途径。对于个人投资者而言,更需要稳定的超额收益,而不是看到某些基金有高超额收益后才购买,因为从统计的角度来说,高超额收益通常是不可持续的,所谓的“冠军魔咒”正是如此。因此,投资者更需要有这样一类能持续获得相对稳健的超额收益产品。苏俊豪:在对885001进行研究时,我们发现,即使只是想去稳定的跟踪这个指数,去“抄作业”也是比较难的,因为它是基于基金收益率等权编制的指数,没有像传统宽基指数一样的成分股,您是怎么做的?李自悟:尽管现在越来越多的机构开始使用885001作为业绩基准,但如果你真的想要找相关的产品会发现非常之少,可能目前只有一支FOF产品是以885001作为直接业绩基准的,相关的ETF更加罕见。我认为这主要原因在于一方面885001是一个基金指数,而不是一个普通的股票指数。因此,如果仅通过复制的方式来复制成分基金,你会面临高昂的换仓成本(申赎费用)。另一方面,885001也是一个非常广泛的基金指数,涵盖了市场上3400多个基金,因此复制整个样本实际上是非常困难的。如果你选择进行抽样复制,会发现基金与基金之间的共同点往往比股票与股票之间的共同点更难以把握。因此我们认为通过复制基金的方式是基本上不可行的。如果你想通过复制基金的持仓来复制它的收益,就会发现一个问题:基金持仓的公布有一个比较长的滞后期。一般基金的定期报告分为公布前十大持仓的季报(滞后15个交易日)和公布全部持仓的半年报和年报(滞后两到三个月不等)。所以当你拿到实际的持仓时,它可能已经是滞后很久的持仓数据了。万得有另一个指数叫做基金重仓指数,用到的就是基金公布的实际持仓数据。如果把基金重仓指数与885001进行对比,可以发现后者几乎稳定跑赢前者,这表明基金经理的持续调仓可以产生一个不可忽视的正向阿尔法,因此我们需要缩短基金公布实际持仓的滞后期,以便及时测算基金的持仓信息并跟踪其调仓频率,从而用一篮子股票尽可能精确地复制基金的收益。在实际操作过程中,我们会利用所有可获取的信息来尽可能跟上基金的实际调仓频率。我们使用定期报告的基金持仓数据和基金最新公布的净值数据,结合机器学习等量化方法,实时估算基金的实时仓位。我们每天对全市场的偏股混合型基金做同样的操作,以获得对每只基金目前最新仓位的最优估算,并将这些基金的持仓合成为一个能够相对准确复制基金持仓的股票组合。我们在这个模型上不断改进,将跟踪误差降低到年化4%以下,接近宽基指数ETF的水平。单纯复制基金持仓的话,大概可以做到每年超额收益的差异在1%-3%之间,每年大约跑输885001的1-2个点的左右。其中的原因我们认为主要在于基金申购费用、申赎费用以及打新收益对净值的影响。如果调整这部分费用,会发现两者的收益基本上能够实现较好的复制效果。但作为一款产品而言我们最后希望获得的是正向的超额收益。因此复制指数只是我们产品设计的第一步,我们称其为Smart-贝塔的基础赋值。在此基础上,我们还将叠加两层阿尔法:第一层是优选基金的阿尔法,即优选一部分基金来跟踪其仓位,以获得比全市场基金更好的收益;第二层则是在优选的基金股票池内使用选股模型,以获得所谓的选股阿尔法。通过这两层阿尔法的叠加,从而获得相对于885001指数更高的超额收益。这种思路,其实也和我们在一开始就分享了关于投资理念的想法是一致的,即通过拓展我们的超额收益来源从而使整体超额收益更加稳健。苏俊豪:宽基指增一直是公募量化的主战场,您觉得对宽基指数的增强和对偏股型基金指数的增强有什么共性和差异?李自悟:实际上从模型角度来看,两者之间的差异比较小。特别是在阿尔法选股上,我们都是采用多因子方法来构建对股票相对收益有预测力的模型。两种方法在因子的选择和模型预测参数方面可能有少许差别,但总体还是较为类似的。二者最大的区别是这两类产品可能适合不同的投资者。相对而言,宽基指数更适合那些有明确风险或风格偏好的机构投资者,比如险资。宽基指数并不是一个容易选择的策略,比如选择投资沪深300、中证500或中证1000,对大多数投资者而言并没有一个显而易见的答案。对大多数普通投资者而言,面临的问题是分配权益或固收的仓位,或是提高或降低整体组合的风险度。因此,对这些投资者而言,偏股混合或偏股增强可能是更合适的投资策略,因为它们能够给投资者带来一个相对合理的权益仓位的暴露和回报,而不需要考虑太多权益产品的细节。从选股方面来看,二者也存在一些不同。指数股票一般都有成分股的限制,比如公募产品要求超过80%的成分股,但对于偏股增强策略,可以进行全市场选股,这在某种意义上也是一种制度优势,可以带来比较明显的超额提升。在实际操作中,当跟踪公募重仓股票并控制风格和行业时,它的实际持仓与800表现比较接近,但同时比宽基指数的策略在风格和行业选择上更为灵活。最后,我认为相对于宽基指数,偏股增强策略在构成上也更加复杂,因为它实际上融合了多个策略,包括Smart Beta复制策略、Alpha选股策略和基金优选的选基策略。所以相比宽基指数,偏股增强具有更为多源化的阿尔法来源,但这同时也更考验基金管理人的综合量化投资能力。我们曾对指数复制工作进行过深入的研究,发现要将整体跟踪误差控制在较低水平,需要付出相当大的努力。但总体而言,这是一种可以提升整体超额收益来源广度的很好尝试。苏俊豪:今年以来,行业间的收益分化进一步拉大,前面三个多月,排名靠前的行业与靠后的行业收益差距最大可以达到40%以上,对于行业轮动可能带来的收益和风险,您是如何看待和应对的?李自悟:的确,像2007或者2015年那样整体市场的普涨现象越发难以见到,而行业中收益分化的现象则在近几年越来越普遍。这是由市场预期或者行业景气度的变化引起的,即使我们不喜欢或者不想参与行业轮动,我们也不得不面对和拥抱这个现实。量化策略对于行业轮动的把握相对个股选择而言要难不少,这是因为行业数量较少,同时数据量上也不太符合量化研究的需求。另外,回顾过去这几轮行业轮动,也都是由不同的触发因素所引起的,因此我认为量化策略并没有一个很好的方法去预判这种行业轮动到底会在什么时候发生。量化对于行业轮动的特长在于对热点追踪的先天优势,可以基于CTA策略进行一些行业轮动的尝试。相对而言,量化策略对行业的倾向性不如主动公募基金经理强,这也意味着其在行业切换上可以做得更为灵活。事实上,我们做偏股增强的初衷也是为了找出一个切入行业轮动的不同视角,希望站在公募主动基金经理的肩膀上获得行业配置的能力,然后在个股超额收益方面进行优化。在个股超额逐渐下行的市场大势上,追踪行业轮动还是一个可以考虑的方向。行业轮动的策略风险是事实存在的,所以我们也需要在整体策略配比上控制在行业的偏离,使得在行业上的超额和个股上的超额能够更好地叠加。苏俊豪:量化和主动的结合是量化圈现在主要的方向之一,您觉得两者有哪些有效的结合方式?李自悟:在量化圈里,原本偏主动或偏量化的机构都有尝试互相取长补短。例如一些偏主动的公募团队已经开始运用量化方法去帮助他们做组合构建,提升收益风险比。另一方面,头部的量化私募也在试图将主动的行业研究方法纳入到量化研究体系当中。理论上,两种策略有取长补短的可能性,但是由于它们的视角和切入点不同,要将它们比较好地融合在一起还是有难度的。海外一些机构也尝试将基本面相关的另类数据应用到量化方法中进行处理。我们的思路则略有不同。在策略设计时,我们假设主动策略擅长行业和风格轮动,量化则擅长在全市场范围内做股票选择和组合构建。因此,在偏股增强这个产品中我们将两种策略各自擅长的领域结合起来,希望通过这种方式将主动和量化的特长合二为一,从而提高产品的收益并降低风险。苏俊豪:今年ChatGPT行情的火爆让大家对机器学习的关注度再次提升, 事实上机器学习在量化里的应用已经有相当一段时间了,您觉得它能为我们战胜885001提供哪些方面的助力?李自悟:起初,GPT的火爆并没有引起量化圈特别大的轰动,主要原因是量化投资圈比较早就开始接触这类机器学习的概念,或者在实际投资中已经使用了这些人工智能工具。所以ChatGPT一开始并没有对量化圈带来太大的震动。具体到885001上,我们在指数复制时也使用了一些机器学习的模型,帮助我们更好地预测基金的实时仓位。但从长期而言,我认为这些新的机器学习方法,特别是大型语言模型的涌现,可以为量化研究打开一个全新的领域,特别是在处理非标准化数据方面。因为在量化投资中,我们通常使用的是标准化的数量数据,而不是文本数据。然而,从主动投资经理的角度来看,文本数据是其获取信息的主要来源,这些文本数据无论从质量和数量上都远高于数量型数据,这是一个量化策略接触很少的全新领域。在ChatGPT出现之前,我们并没有很好的工具去处理这类数据。但ChatGPT的出现帮助我们打开了处理文本类数据的大门,这些大型语言模型可能有助于量化策略补足在文本类信息处理上的短板,缩小与主动投资经理在处理更广泛的信息维度上的差距。因此,如果量化策略能够接收并处理这些文本信息,就可以弥补过去过多依赖数量型信息的缺陷,获得更多全新的信息和超额收益来源。风险提示:上述内容和意见仅作为客户服务信息,并非为投资者提供对市场走势、个股和基金进行投资决策的参考。本公司对这些信息的完整性和准确性不作任何保证,也不保证有关观点或分析判断不发生变化或更新,不代表本公司或者其他关联机构的正式观点。历史业绩不代表未来收益,基金投资需谨慎。
(全文结束)
(纪要整理:林希民、孙浩然)
做「开源」的量化研究
to be a quant,to be open-minded.
更多交流,欢迎联系:开源证券金融工程团队 | 魏建榕 张翔 傅开波 高鹏 苏俊豪 胡亮勇 王志豪 盛少成 苏良 何申昊
end
团队介绍
开源证券金融工程团队,致力于提供「原创、深度、讲逻辑、可验证」的量化研究。团队负责人:魏建榕,开源证券研究所所长助理、金融工程首席分析师、金融产品研究中心负责人,复旦大学理论物理学博士,浙江大学金融硕士校外导师、复旦大学金融专硕校外导师。专注量化投资研究10余年,在实证行为金融学、市场微观结构等研究领域取得了多项原创性成果,在国际学术期刊发表论文7篇。代表研报《蜘蛛网CTA策略》系列、《高频选股因子》系列、《因子切割论》系列,在业内有强烈反响。2016年获新财富最佳分析师第6名、金牛分析师第5名、水晶球分析师第6名、第一财经最佳分析师第5名。团队成员:魏建榕/张翔/傅开波/高鹏/苏俊豪/胡亮勇/王志豪/盛少成/苏良/何申昊。
开源证券股份有限公司是经中国证监会批准设立的证券经营机构,具备证券投资咨询业务资格。
本报告仅供开源证券股份有限公司(以下简称“本公司”)的客户使用。本公司不会因接收人收到本报告而视其为客户。本报告是发送给开源证券客户的,属于商业秘密材料,只有开源证券客户才能参考或使用,如接收人并非开源证券客户,请及时退回并删除。
本报告是基于本公司认为可靠的已公开信息,但本公司不保证该等信息的准确性或完整性。本报告所载的资料、工具、意见及推测只提供给客户作参考之用,并非作为或被视为出售或购买证券或其他金融工具的邀请或向人做出邀请。本报告所载的资料、意见及推测仅反映本公司于发布本报告当日的判断,本报告所指的证券或投资标的的价格、价值及投资收入可能会波动。在不同时期,本公司可发出与本报告所载资料、意见及推测不一致的报告。客户应当考虑到本公司可能存在可能影响本报告客观性的利益冲突,不应视本报告为做出投资决策的唯一因素。本报告中所指的投资及服务可能不适合个别客户,不构成客户私人咨询建议。本公司未确保本报告充分考虑到个别客户特殊的投资目标、财务状况或需要。本公司建议客户应考虑本报告的任何意见或建议是否符合其特定状况,以及(若有必要)咨询独立投资顾问。在任何情况下,本报告中的信息或所表述的意见并不构成对任何人的投资建议。在任何情况下,本公司不对任何人因使用本报告中的任何内容所引致的任何损失负任何责任。若本报告的接收人非本公司的客户,应在基于本报告做出任何投资决定或就本报告要求任何解释前咨询独立投资顾问。
本报告可能附带其它网站的地址或超级链接,对于可能涉及的开源证券网站以外的地址或超级链接,开源证券不对其内容负责。本报告提供这些地址或超级链接的目的纯粹是为了客户使用方便,链接网站的内容不构成本报告的任何部分,客户需自行承担浏览这些网站的费用或风险。
开源证券在法律允许的情况下可参与、投资或持有本报告涉及的证券或进行证券交易,或向本报告涉及的公司提供或争取提供包括投资银行业务在内的服务或业务支持。开源证券可能与本报告涉及的公司之间存在业务关系,并无需事先或在获得业务关系后通知客户。
本报告的版权归本公司所有。本公司对本报告保留一切权利。除非另有书面显示,否则本报告中的所有材料的版权均属本公司。未经本公司事先书面授权,本报告的任何部分均不得以任何方式制作任何形式的拷贝、复印件或复制品,或再次分发给任何其他人,或以任何侵犯本公司版权的其他方式使用。所有本报告中使用的商标、服务标记及标记均为本公司的商标、服务标记及标记。
开源证券股份有限公司
地址:西安市高新区锦业路1号都市之门B座5层
邮编:710065
电话:029-88365835
传真:029-88365835