查看原文
其他

白鹭女掌门张晨樱:打造反脆弱的量化多策略盈利武器

全网Quant都在看 量化投资与机器学习 2022-10-06


量化投资与机器学习微信公众号,是业内垂直于量化投资、对冲基金、Fintech、人工智能、大数据等领域的主流自媒体。公众号拥有来自公募、私募、券商、期货、银行、保险、高校等行业30W+关注者,连续2年被腾讯云+社区评选为“年度最佳作者”。


前言


伴随股票市场的风格切换以及商品市场的极端波动,量化产品会在一定程度出现部分回撤,这也再次提醒我们多资产、多策略配置的重要性。然而,对于管理人来说,想要真正做好多策略并非易事,也远不止将几个策略组合在一起这么简单,在策略研发、人才、IT方面都对管理人提出了更高的要求。

 

近日,量化投资与机器学习公众号独家采访了国内量化界为数不多的女掌门人之一白鹭资管投资总监张晨樱博士。


张晨樱博士


张晨樱博士本科就读于美国韦尔斯利学院(Wellesley College,美国最好的Liberal Arts College之一,也是希拉里、宋美龄的母校)并获得最高荣誉生,博士就读于美国宾夕法尼亚大学沃顿商学院,在毕业后毅然放弃了国内顶级学府的高薪教研职位,投身于热爱的量化投研事业。张晨樱博士曾任职某金牛奖百亿私募策略研发核心负责人,拥有8年以上的Alpha策略实盘经验。

 

多策略是白鹭非常鲜明的一个特色,也逐渐成为了当前行业内的一个趋势,公众号将从白鹭的内部视角,为大家呈现白鹭对于『多策略、多元化』的探索。




长期布局  多 策略方向

 

作为市场上最早一批发展多策略的量化私募,白鹭自2017年便开始进行股票、CTA多策略的探索,目前,在股票Alpha、CTA、期权方面都形成了比较成熟的策略体系。白鹭认为,策略多元化是公司得以长期生存的基础。把某一类策略做到极致很重要,然而任何类型的策略都是有周期性的,这是由市场环境的复杂多变性所决定的。市场生态并不是一个稳态过程,再先进的方法论也有它的局限性,不可能适应所有的市场环境。所以除了把单一思路做的更精细化,从战略和全局角度,去捕捉不同维度的收益来源,之后再进行不同信号的优化和融合,会有非常实质的意义。在产品层面,能有机地将这些差异化、低相关的策略结合在一起,叠加收益、降低波动,能够给投资人提供更有吸引力的性价比,同时也提高了投资人的资金使用效率。



策略研发的  多 元化

 

除了在产品层面进行Alpha、CTA和期权的多资产、多策略配置,在每个子策略上,多元化的思路也体现在信息、方法论、周期和标的的四个层面:

 

1、信息层面


信息主要来自于行情数据和非行情数据。前者包括量价数据、高频数据中的微观市场特征等,后者包括基本面数据、资金流向数据和其他的另类数据等。白鹭目前有专门的数据处理团队,日常也在不断挖掘、了解和引入市场上新兴的各类数据源。在这些不同信息的基础上制定出各类相关性较低的交易策略,达到互补效果。

 

2、方法论层面


无论是股票策略还是衍生品策略,白鹭都提倡不同的方法论并行。

 

举例来说,在CTA策略方面,传统的规则策略、线性预测方法和多因子等方法依然有效,我们就予以保留,但在细节处理上必须越来越讲究,比如自定义线性回归中的正则方法、设计精简而合理的执行规则和因子数据分布的转化等。而在将传统方法用得越来越精细的同时,白鹭发现机器学习和深度学习技术在因子自动挖掘和因子组合方面也有很好的效果,因此也会将其广泛使用。

 

方法论的多元化还体现在思维的创新上。比如在期货策略上,对于业内常用的商品期货基本面量化策略,除了传统的基差库存方法,在白鹭的团队中还会有精通基本面的研究员和交易员,与量化研究员配合,从产业链上的供需矛盾出发来建立量化模型,从而实现对标的走势更精准的预测。


白鹭的多元化CTA策略

 

在股票策略方面,现在量化Alpha领域对于机器学习的使用已经非常普遍了,现阶段一个重要的方向是在可获得的数据基础上,寻找不同角度,进一步挖掘数据之间的“新关系” —— 对它的研究主要集中在前沿算法的落地与另类数据的应用方面。


  • 在算法层面,白鹭会复现并优化深度学习领域中的创新算法,通过分布式集群提供的强大算力,来挖掘因子之间潜在的关联,并将不同的深度学习模型集成为少数个强有力的预测信号。


  • 在另类数据的应用方面,白鹭将图神经网络应用到知识图谱等结构类数据上,来深入学习个股之间的关联。在文本类数据中,也可以应用NLP上的模型来处理海量非标准数据,产生基本面相关的另类因子。


举例来说,现在大家对个股因子挖掘都比较充分了,都转而关注股票之间的关系,这方面最表面的比如说同行业间股票的对比,深层一点的比如说大小票之间的、交易活跃的票和不活跃的票之间的Lead_lag关系,或者说产业上下游之间的关系,本质上说都是希望利用某个股票自身信息以外的东西去预测该股票。


利用供应链的数据挖掘股票lead_lag是一个很典型的例子,整个过程中会用到刚才提到的很多种技术,首先供应链数据本身散布在财报,分析师研报,新闻等一系列文本数据中,需要借助NLP的模型去自动化的抓取与整合情感,语义,关联类的信息。整合完数据之后,需要挖掘股票之间的关系并构造对应的知识图谱,其中包括关系的指向方向(单向或者双向),强弱,动态变化等等,进一步去研究影响这些关系的因素,以及如何利用股票间关系预测个股收益,这时候图神经网络就是个很适合的工具。但图神经网络的效果会受限于知识图谱的有效性,同时在训练中也有着更多的参数要调整优化。


值得注意的是,金融问题特别是中低频收益相关的问题往往是数据受限的统计问题,并且信噪比极低,在有限有效数据长度的情况下,完全依靠机器暴力挖掘的效率和有效性往往不如专家经验,全自动化挖掘也不能进行足够迅速地自反馈和修正,所以通过人工经验寻找不同的切入点非常关键,这也是白鹭非常重视多样性人才招聘的原因之一。

 

3、周期层面


作为一家全频段交易的量化公司,从毫秒、微秒级的高频策略,到tick级和分钟级的日内策略,从小时级的短线策略,到日级以上的中长期策略,白鹭目前都有布局。

 

市场中的参与者众多,不同类型参与者的交易周期会有明显区别,相应策略特征、适合的市场环境也有所区别。各个周期交相辉映,市场中通常会有至少一个频段的策略赚钱效应较强,多周期为整个组合的绩效提供了更高的稳定性。

 

具体来说,期货和期权由于多空双向、T+0以及部分标的低廉的手续费和返佣,白鹭可以做日均几十到几百次的高频交易,一般持仓几秒到几分钟。小时级别到周级别持仓的策略类型比较丰富,期货方面包括趋势跟踪、跨品种套利和截面多空等,期权的各类中低频策略一般也集中在这个时间周期,例如波动率曲面套利、跨交易所套利和波动率方向预测等。商品量化基本面策略基于低频的大宗商品基本面数据而研发,相应的策略持仓周期可能会长达数周以上。


4、标的层面


白鹭的投资标的囊括了股票、期货、期权等各资产大类。以衍生品为例,基本能做到对交易品种的全覆盖,既有商品期货也有金融期货。商品期货的交易标的包含了流动性较好的约50个品种,金融期货包括股指期货和国债期货,此外,白鹭在部分投资范围允许的产品中加入期权,包括ETF期权、股指期权和商品期权等,进一步为我们带来低相关收益。

 

在期权层面,整体的框架和思路也是根据多策略多元化来组合。期权本身有多种的组合方式、套利模式,在不同的行情下会有不同的收益特征。以国内的ETF期权为例,过去三年每年都有不同的行情,不同的期权策略都会在特定的时间周期内具有很好的收益。为了能做到能够跨越很长的时间尺度下的优秀的收益特征,期权策略也组合了多种子策略,包括机器学习类的标的预测,波动率预测,不同组合的灵活运用和稳定的波动率曲面套利等等。同时,白鹭的期权组也引进了主观交易的部分,从而带来与量化交易不同的收益来源。



人员布局的  多 元化


在投研人员的配置上,白鹭秉持超前投入、人才多元化、最高人才密度的理念进行布局,对于拥有三个大类子策略的白鹭来说,需要有三倍以上的人才密度去进行覆盖。

 

白鹭在招聘过程中会十分注重差异性和互补性。大家侧重的方法论,使用的数据类型,看市场的角度,都会很不一样。比如不管是股票还是衍生品,虽然都有非常倚重各种自动化算法的策略类型,从因子到最后的交易全是通过纯算法模型产出的,但也有非常偏向人工经验的策略类型。投研人员的背景方面,既有各类理工科或金融经济背景的新毕业生,也有在学术界钻研多年的相关领域教授,既有在量化深耕多年的业内精英,也有从互联网大厂过来的的资深工程师。在顶尖策略和技术的基础上,白鹭倾向于搭建没有明显短板的投研团队。

 

在此基础上,同事间、小组间的相互激发和合作同样至关重要。业内也有种做法是刻意限制内部员工之间的交流,目的是为了保持互相的独立和低相关性,在白鹭看来,当内部多元化达到一定程度后,会激发和孕育更为丰富的多元化,这个问题则迎刃而解,正所谓“道生一,一生二,二生三,三生万物”。在白鹭非常倡导利他、共享的文化,除了经常性的一些分享会之外,内部也有大家自发的知识共享库,包括系统平台部也为大家准备了一个“因子商店”,允许大家共享、交换研究成果,一方面使用起来快捷高效,另一方面也能从机制上给分享者予以认可和激励,让大家充满干劲、发自内心的进行研究和分享,彼此不断碰撞出新的思维火花,达到一加一大于二的效果。



IT架构的 多 元化


在量化行业,IT技术的应用渗透于从策略研发到实盘交易的每一个细微的环节上,涉及的技术种类也是纷繁复杂,一个有竞争力的量化团队, 需要在每个技术环节都精心打磨,而对于多策略团队来说,对IT的多样化需求更上一层:

 

一方面,多样性的策略意味着白鹭的研发人员会产生数量庞大的因子和信号,而且不同因子信号背后所对应的基础统计量,筛选标准,迭代速度,都可能不同。这就需要白鹭有一套全面强大的IT系统能支持不同因子信号的维护,共享,交互和使用。


另一方面,不同的交易标的和所处市场的特征,也对IT系统提出了多样化的要求。例如,A股市场的策略通常会运用到深度学习等相对复杂的模型,并且数据量级很大,这就要求IT团队为策略团队提供强有力的硬件算力支持及针对机器学习任务优化的大数据处理平台,不断降低模型研发及测试的迭代周期,更加敏捷地适应市场环境。而对于期货交易来说最大的考验则是要在融合支持不同策略类型的同时,迅速应对交易所多变的交易规则。白鹭的期货交易系统除了支持标准的CTA策略之外,还同时支持Alpha对冲端的股指期货自动下单和套利策略,能够和股票交易系统融合成为统一的整体。

 

在这种情况下,白鹭对多样性的重视也衍生到了IT人员的架构上:


以交易系统为例,白鹭进行软件开发组、网络组、硬件小组和操作系统小组、前端组专业分工,各组发挥自身优势,合力打造一个稳定、低延迟的交易系统,保证系统在稳定运行的前提下,尽可能快速地对市场行情做出响应,并把每一笔订单准确快速地发到券商及交易所。


白鹭系统平台部架构



结语


对于一个优秀的量化多策略团队,在策略研发、人才、IT等各方面,都需要有全面的、多元化的储备,这种多元化的储备,一方面在团队内部为所有投研人员的跨领域创新提供了基础,促使大家协同作战,开拓新的另类Alpha空间;另一方面,当我们面临突变的市场环境时,策略间的低相关性使我们依然能够在更大程度上,有与之相适应的一些武器。


毕竟,在量化领域我们都在使用历史数据去预测未来,追求低相关,多元化的策略配置本质上就是在市场允许的范围内最大程度地分散风险,打造能够让我们无惧波动和不确定性的铠甲!

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存