查看原文
其他

手把手教你搭建量化交易模型,以PTA-MEG量化对冲策略为例

产融人士的加油站 扑克投资家 2020-09-08


福利:联系扑克小公举(id:puoke002)申请成为扑克财经App智咖;关注公众号引一汪活水(id:puokebaijia)获得大宗商品/投资交易领域更多干货。


文 | 陈荣璞,扑克财经App智咖,陈荣璞基本面量化交易圈圈主

近几年,量化投资逐步进入商品期货投资领域。量化投资策略在商品期货CTA、商品期货套利和对冲领域取得了不错的成绩。但是量化投资并不是交易的“圣杯”,也不能完全取代基本面和主观分析。基本面分析和量化投资各有优劣,并非完全对立,可以相互融合,优势互补,共同打造一套稳定的逻辑体系。


1
量化投资优势和劣势
 

量化投资就是借助现代统计学、数学的方法,从海量历史大数据中寻找能够带来投资组合稳定收益的多种“大概率”策略和规律,并在此基础上,综合归纳成因子和模型程序。最终纪律严明地按照这些数量化模型组合来进行独立投资,力求取得稳定的、可持续的、高于平均的超额回报。
 
量化投资相较于传统投资的优势主要体现再五个方面:
 
第一,纪律性。量化投资严格执行投资策略,不会受到投资者情绪的干扰;
第二,系统性。包括多层次、多角度以及海量数据三个层次的含义;
第三,及时性。电脑用量化的分析方法可以对市场做出迅速地反应;
第四,准确性。量化投资可以规避因人的情绪、疏忽、懒惰而产生的一些偏差;
第五,分散化。即“概率取胜”。量化投资通过大量数据的学习,更能达到数据统计的准确性。
 
比如某个投资者有一套简单基于均线的交易系统:上穿均线做多,下穿均线做空。但是即使如此简单的策略交易系统也存在问题:
 
第一、均线使用几日均线合适?不同的品种不同的线周期下肯定不能用同样的参数;
第二、即便在当下在某个品种上该策略系统是盈利的,但是从历史长期来看其表现又是如何?策略在什么样的行情下有效,什么样的行情下失效?等等这些结论仅靠人脑复盘是不现实的,而计算机可以通过迭代算法进行快速大量的计算和回测,生成可量化的数值指标,帮助投资者进行分析和决策。
 
以一个简单的基于均线的量化趋势跟踪系统为例:
 
首先,通过将策略逻辑转化为编程代码,然后将策略逻辑代入历史行情中,执行一遍。


然后,再通过给出的历史回测报告,对上述问题进行分析判断。

 
尽管量化投资能够为投资交易提供强大的支持和辅助,但是量化投资并不是交易的“圣杯”,其本身也具有相当大的局限性和不足。经验不足的量化工程师往往只把关注的重心放在策略模型和源码上,而忽略了模型背后的基本面逻辑。这样的做法会导致量化模型出现过度优化和拟合等问题。历史回测结果看似很好,实则是“水中花,镜中月”,结果导致量化模型难以适应市场的变动,常常以失效而告终。
 
单纯的量化投资模型主要有一下几点局限性:
 
1. 过份依赖技术分析历史回测结果
 
有一些投资人认为技术分析方法应该是准确无误的分析工具,所以迷信某一种分析方法得出的预测结论。
 
2.把某种分析方法作为市场预测的万用工具
 
有一些投资者认为,每一种技术分析方法都可以应用到任何市场环境中。例如他们不管市场是有趋势或无趋势,都要看移动平均线,或者不管波浪形态清楚与否。
 
3.过度拟合
 
量化开发者往往只把关注的重心放在策略模型和源码上,而忽略了模型背后的基本面逻辑。这样的做法会导致量化模型出现过度优化和拟合等问题,结果导致量化模型难以适应市场的变动,常常以失效而告终。
 
以下图为例:这是一个基于通道突破的纯量化模型,左图是没有优化过参数的回测结果,右图是优化后的回测结果。通过参数优化确实可以提高策略在历史中的表现,但是对于未来的实盘运行的适应性极差。


 
 
 2
 基本面和量化相结合
 
 
基本面和主观分析的优势在于对大的方向的判断和对多种数据的统筹分析,其特点是胜率高、逻辑性强。但是分析的结论往往是一种模糊的,大概率方向性的分析,难以直接用来落地交易。即使方向判断100%正确,最后未必能够实现盈利,甚至亏损。因为对于一个完整的交易系统,仅仅判断对方向是不够的,最终落地到交易还要考虑到路径过程如何执行(何时入场、如何加仓、如何止损止盈、容忍多大的亏损,被洗出来之后如何再次入场等等)、资金仓位管理、风险管理等细节问题。
 
交易执行不是一开一平两个点就能完成的,中间是一个动态的路径过程


量化投资和主观基本面正好相反,量化投资的劣势在于很难通过模型构建出高胜率的大方向判断,优势反而在于交易的后半段执行上。在有了基本面逻辑判断的基础之上,可以通过使用量化投资模型“落地”交易,自动化地执行路径控制、资金管理、风险管理。
 
基本面量化投资体系的核心是:构建有基本面逻辑支撑的和量化投资体系,实现基本面分析定“战略”大方向和量化工具定落地“战术”的结合。而不是只有纯量化策略,做到量化策略背后一定要有基本面的逻辑支撑。
 
 3
PTA-MEG量化对冲策略讲解
 

1、基本面分析定战略方向。基本面逻辑分析的结论是量化对冲做多PTA09 & 做空MEG09。
 
做多PTA09:从PTA的角度,我们觉得原油这一块主流观点震荡偏强一点,特别是8月份前后。PX短期弱反弹,中期有下行的空间。PTA社会库存高于去年,7、8月份PTA工厂存在检修预期,加上台风的情况,天气的情况,对供应端还是有阻碍的,再加上流通货源比较紧张,需求端刚才我们讲了地产家纺在金九银十的旺季会不会有一波释放,价格涨,这个预期就在,可能就会补库。所以,我们认为9月合约可能是紧平衡。
 
从基本面角度,我觉得8月份前后可能还会有一轮向上驱动,但是能否高过7月初这个通过资金情绪博弈出来的这个价格高点,要打一个问号。中期来看,在PX、PTA产能兑现的情况下,PTA还是会有回落的空间。
 
做空MEG09:乙二醇这个产品大的周期处在一个产能扩张和需求降速的周期中,中长期供应过剩的局面难以改变,从产量出清到产能出清还是需要一段时间间隔,所以当前的情况可以类比2014年4月的PTA,乙二醇实际上是一个超跌的反弹,难有一个趋势性的上涨。
 
2、基于基本面分析,设计相匹配量化策略
 
商品期货跨品种对冲的波动幅度相对跨期价差来说,波动大幅增加。并且往呈现周期性地趋势走势,针对这一特点,本文采取基于BOLL指标的趋势策略来设计量化模型来实现这一正套操作的逻辑。
 
 
同时为了降低参数过度拟合的影响,本文在设计boll趋势量化模型时,采取自适应的周期参数代替优化的参数。通过市场的波动率来进行调节参数。
 
量化策略回测:2019.1.1-2019.4.22
 

量化策略跟踪:2019.4.23-至今
  


加入自动化动态资金管理

初始阶段,只运用资金的20%,该数值确定是通过科学的计算(凯利公式)本金收益率和最大限度减小风险得来。账户产生一定的收益后,按照事先确定的比例提取资金用以加开新仓,这样既保证了资金的利用率,同时已有的盈利也得以确保,为了控制风险,加开新仓的资金不超过即得利润的三分之一,目的是保证资金在风险可控的情况下能够得到更有效的利用,从而扩大盈利;账户发生一定的亏损时,通过确认问题所在,相应减少该合约或该系统的资金量甚至暂停交易,直到确定该指标重新通过验证有了好的获利方法。
 
量化细则:
1.初始建仓20%
2.建仓后,每笔单一损失不超过标准仓全部资金的0.4%-0.6%
3.一定浮盈rate3以后,止盈50%的仓位。
4.一定浮盈rate2以后,盈利的1/3建新仓。
 

加入自动化风险管理程序,
基本面大方向判断出错时,
防止出现巨幅亏损
 
 
止盈位置1(TP1): 95%历史分位水平(即根据历史统计,95%概率可以触及TP1)
止盈位置2(TP2): 85%历史分位水平(即根据历史统计,85%概率可以触及TP2)
止盈位置3(TP2): 75%历史分位水平(即根据历史统计,75%概率可以触及TP2)
止损位置1(SL1): 突破历史最大水平
 
最后交给计算机自动化执行,
准确又节省人工
     

金融大数据和AI技术的应用
 
基本面分析往往会依赖很多重要的供需数据,但是目前传统的三方数据存在很多问题,比如:数据来源的可靠性问题、数据发布的频率过低、数据更新滞后等。因此我们在研发基本面量化模型的时候,时常会引入一些另类金融数据,并结合一些深度学习的智能算法进行分析预测。
 
基于另类AI数据支持的PTA-MEG量化对冲
对冲掉复杂的共性,留少量个性
能大幅提高交易胜率!

首先,PTA和MEG处于产业链的同一位置,并且有内在生产公式(0.85吨PTA+0.33吨MEG=1吨PET)的制约。所以从长期“共性”上看,PTA和MEG价格走势具备较强的相关性。但是这并不代表PTA和MEG在各个阶段,每时每刻的价格走势都是一样的。从短期截取某一时间区间来看,PTA和MEG宏观上可能是同涨同跌,但是微观层变幅度强弱却又明显的差异。这种差异来自于PTA和MEG各自供需基本面的差异,也就是“个性”的差异。通过分析各自品种的个性差异,再通过量化的工具进行对冲交易,对冲掉复杂的共性,保留少量的个性,。能够大幅提高交易的胜率。
 
量化对冲交易的是品种的强弱差异,而不是单纯的价格涨跌。单个品种的影响因素非常多。不仅受产业供需的影响,还受成本端原料供需方面的影响,还有一个非常难把握的因素就是宏观金融层面,所以,单品种趋势交易分析,有时难度是非常大的。通过跨品种的组合分析,可以对冲掉大部分共同的影响因素,只留下少量易于分析的个性因素,能够大幅提升对品种强弱的判断效果。
 
 
  
另类AI数据
分析“个性”需要供需基本面“个性”数据,
数据从何而来?
 
使用基于卫星遥感和地理定为的另类数据,利用人工智能深度神经网络驱动对“个性”的供需数据进行分析,为构建量化对冲模型提供强有力的支持。

 

有了“个性”(供需)数据之后,
如何判断谁强谁弱?
 
采用有监督的机器学习分类模型SVM(支持向量机),对PTA和MEG(-1,+1)强弱特征构造量化模型,其中训练集属性(X_train)采用PTA和MEG的供需及库存数据(数值型数据),训练集label(Y_train,分类数据)带入一段时间窗口下的PTA和MEG强弱的差值。

 

 
再利用PTA和MEG(-1,+1)强弱分析预测值Y_predict辅助构建量化对冲模型
 
 

想学习量化交易,还不知该如何着手?
加入《陈荣璞基本面量化交易圈》
手把手教你建立属于自己的量化交易模型
 
 
点击阅读原文即可查看陈荣璞基本面量化交易圈圈子详情。

    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存