查看原文
其他

“阿尔法狗”们在证券投资上也能和人类一较高下?

张家林 中国金融四十人论坛 2017-01-27

围棋一直被认为是计算机无法攻克的人类博弈游戏的最后堡垒,但是Google Deep Mind公司开发的AlphaGO(阿尔法狗)在3月的“人机大战”战胜李世石,并掀起了“人工智能”热。此后,Google DeepMind宣布将转向在机器翻译、语义识别和图像识别方面人工智能以及深度学习的应用。电脑下围棋同机器翻译等领域看似差距很大,然而对于人工智能系统而言,其原理却类似。在计算机的世界中,看似风马牛不相及的任务,其求解方法却可能高度类似。

中国金融四十人论坛(CF40)常务理事,北京资配易投资顾问有限公司董事长、创始人张家林在新书《证券投资人工智能:人工智能时代的财富管理变革》中提出,电脑围棋系统的人工智能算法也可以使用在证券投资分析当中。他认为,资产投资管理是一个长期的、多步骤的过程。在证券投资过程中,人工智能证券分析系统不断地根据当前的市场环境以及证券价格走势调整投资组合的结构,动态监控投资风险,通过生成新的投资策略来锁定收益或者规避风险。因此在投资决策生产的流程中,同AlphaGo这样的人机对弈系统的决策流程非常类似。

本文节选自新金融书系《证券投资人工智能:人工智能时代的财富管理变革》第三部分《证券投资人工智能(SIAI)的虚与实》。


张家林 著

新金融书系

中国经济出版社

AlphaGo的算法原理

传统的人工智能方法是将所有可能的走法构建成一棵“搜索树”,对于围棋而言穷举法超出了计算机的数据处理能力,并且计算效率极低。AlphaGo基于Google DeepMind一直专研的深度学习技术,将高级“搜索树”与深度神经网络结合在一起。

基于深度神经网络的深度学习是当前人工智能领域的最热门话题之一,深度学习是机器学习的一个分支。2016年1月28日的《自然》杂志刊登了一篇论文详细介绍了AlphaGo的技术原理。AlphaGo的算法核心是通过概率计算将明显效率低下的大量走棋步骤排除,这样就避免了大量低效率的穷举。AlphaGo运用到的深度神经网络是策略网络(Policy Network)以及值网络(Value Network)。

AlphaGo程序包含了离线学习和在线对弈两个过程,其中离线学习过程分为三个训练阶段。

首先,AlphaGo利用3万多幅专业棋手对局的棋谱训练出了两个网络:策略网络和快速走棋策略。基于全局特征和深度卷积网络算法训练出来的是策略网络,其任务是负责减少搜索的宽度,排除明显不合理的“臭棋”。利用局部特征和线性模型训练出的快速走棋策略负责减少搜索的深度。人工智能会一边推算一边判断局面;局面明显劣势的时候,就直接抛弃某些走棋路线。策略网络速度较慢但精度较高,值网络则相反。

其次,人工智能利用第t轮的策略网络与先前训练好的策略网络互相对弈,利用增强式学习来修正该轮的策略网络的参数,最终得到增强的策略网络机。

最后,先利用普通的策略网络来生成棋局的前U-1步,然后利用随即采样来决定第U步的位置。随后,利用增强的策略网络来完成后面的自我对弈过程,直至棋局结束分出胜负。此后,将第U步的盘面作为特征输入,以胜负作为标记,学习一个值网络以用于判断结果的输赢胜利。对于AlphaGo来讲,值网络是其一大创新,通过机器学习,AlphaGo初步掌握了根据当前局势来判断最后结果的技巧。

接下来的在线对弈的核心思想就是在蒙特卡洛“搜索树”中嵌入了深度神经网络来减少搜索空间,这个过程共分5步:

第一,根据当前盘面已经落子的情况提取相应特征。

第二,利用策略网络估计出棋盘其他空地的落子概率。

第三,根据落子概率来计算此处往下发展的权重。

第四,利用值网络和快速走棋网络分别判断局势,两个局势得分相加为此处最后走棋获胜的得分。这里使用快速走棋策略是一个用速度来换取量的方法,从被判断的位置出发,快速行棋至最后,每一次行棋结束后都会有个输赢结果,然后综合统计这个节点对应的胜率。而值网络只要根据当前的状态便可直接评估出最后的结果。

第五,利用上一步中计算的得分来更新之前走棋位置的权重,此后从权重最大的那条边开始继续搜索和更新。

证券投资与AlphaGo

同人工智能围棋系统相类似,证券投资交易以及投资组合所面对的也是海量的可能性,以及最优解的搜索问题。AlphaGo所面对的是大约10180的可能走棋局面,而证券投资分析面对的是大约10500的投资组合理论数量。在利用简单的筛选法则排除了明显不具备投资价值的劣质证券后,可以将证券投资组合的数量大约降低至1033,在计算量上同AlphaGo不相上下。

另外,从原理上来讲,两个系统都是海量策略中的寻优问题,AlphaGo系统使用了策略网络同值网络在准确度和效率之间寻求平衡点。证券投资决策系统来说也存在类似的情况,需要系统在瞬息万变的市场中既考虑到时效性,又要顾及策略的优选性。因此在使用蒙特卡洛“搜索树”搜索优势的投资组合时,系统可以牺牲一部分的准确性并不一味追求绝对最优的投资组合,转而追求在一定的风险下相对较高的收益的投资组合;并且同时还兼顾到投资者在其他方面的投资偏好,例如投资期限、证券资产的流动性等。

电脑围棋系统在比赛中的任务并不是一步致胜,事实上人机对弈是一个漫长的过程,一盘围棋比赛通常要在150个回合之后才可以决出胜负。在AlphaGo同李世石的比赛当中,电脑系统也曾经出过明显的“臭棋”,可见是其算法在寻优当中陷入了局部最小解。然而AlphaGo系统的活力在于每次在电脑系统给出局部最小解之后,系统都会根据当前的局势重新搜索最优解,一步一步地带领电脑走出颓势,扭转败局。

在证券投资管理中,投资也并非一步定胜负,实际上,资产投资管理是一个长期的、多步骤的过程。在证券投资过程中,人工智能证券分析系统不断地根据当前的市场环境以及证券价格走势调整投资组合的结构,动态监控投资风险,通过生成新的投资策略来锁定收益或者规避风险。因此在投资决策生产的流程中,同AlphaGo这样的人机对弈系统的决策流程非常类似。

由此可见,将人工智能以及深度学习应用到证券投资分析当中是完全可行的,并且会有出色的结果。

证券投资人工智能系统的形成

简单来说,证券投资人工智能系统(Securities Investment Artificial Intelligence,SIAI)就是利用智能软件帮助投资人快速做出股票投资决策,并完成股票投资全过程。区别于传统证券投资方式的是,投资人无须参与复杂的筛选、实操就能轻松完成证券投资。大数据技术和云计算筛选出的投资策略模板和智能交易代理,为证券投资人提供了一种全新的智能投资体验。

这样一个全自动的证券投资系统可以为用户提供两项服务:一是提供投资策略模板;二是提供人工智能交易代理。使用这样的证券投资人工智能交易系统进行资产管理,将不同于传统的“人眼盯盘”“手工下单”和简单的量化交易模式。该系统变革性地采用了基于大数据的人工智能代理进行投资策略选择和交易执行操作,使资产配置变得非常简便和高效。

基于大数据的人工智能证券投资模型构建了投资策略机器学习的模型,这样就能够采用大规模机器学习的方式生产投资策略。这样的生产方式在理论上可以生产出无限的投资策略模板。投资策略模板的生产过程使用大量的人工智能技术,综合考虑当前市场价格、宏观经济环境、货币政策,以及用户个人作为投资人的投资风险收益偏好,经过大量的计算而得出。

从投资人的角度来看,人工智能交易代理(Intelligence Agent,IA)就是加载了“投资策略”的证券投资智能机器人,是一个不知疲倦的交易员。智能交易代理构建了学习机制以及基于该学习机制的知识库,因此具备了一定的推理能力,是一个真正意义上的智能体。智能交易代理由如下几个部分构成:信号事件监听器、决策系统、学习系统、规则库和智能执行器。

当智能代理“装载”了某个投资策略模版后,就具有了一系列的投资推理机制。智能代理的学习系统学习了投资策略模版内蕴含的“知识”,并保存到其自身的规则库中。智能交易开始后,智能代理会通过数据监测与分析模块对外界实时数据的分析结果对证券进行相应的操作,包括建仓、平仓、调仓等。智能代理发起指令,通过券商主经纪商向交易所下达;交易所执行后通过券商向智能代理返回执行结果。功能强大的人工智能交易系统可以为每位投资人生成一个或多个智能代理,投资人使用智能代理后,无须人工操作就可以实现交易。

以上描述的这样一个人工智能交易系统的服务对象是个人投资者,而其所使用的技术则是顶尖的金融机构才有能力搭建的证券智能分析平台。在移动互联网时代,通过新型的金融服务机构,作为提供人工智能交易系统的第三方,将人工智能技术引入个人证券投资的层面。

这样,对于个人投资者而言,既获得了专业投资指导,提高了投资的预期收益,同时定制化的策略又可根据投资人自身情况控制风险,这无疑大大加强了个人投资者在证券投资市场中的专业性与抗风险性。

而对于人工智能交易系统供应商而言,其隶属于新型金融服务领域的翘楚,依靠过硬的人工智能技术与对证券价格准确的预测形成其竞争力,这样的服务机构必须随时更新其算法技术以及相应IT建设,以创造价值。

对于整个金融市场而言,证券投资人工智能交易系统创造了新型的个人投资者以及新型的金融服务机构,这样使证券交易市场的参与者更加多样化,加深了市场的层次。另外,人工智能交易对于金融类证券的价值寻找功能更是超越了以往的各种证券投资分析方法,能够更加高效智能地还原证券的自身价值,加快市场的效率,从而推进价值投资在我国证券交易市场的发展与推广,促进理性化市场。

人工智能交易系统与传统证券投资相比的优势在于:

首先在传统证券投资形式中,普通散户直接面对的是专业的投资机构和职业股民,没有精力也没有渠道获取海量证券市场信息,在选股策略上存在片面化的弊端。而人工智能交易系统克服了这一困难,从巨量证券市场信息中,依据机器学习所归纳的经验和大数据技术,科学计算得出符合投资人风险收益偏好的投资策略,精准性和科学性都大大提高。

其次,传统证券投资中,普通散户在投资决策上容易受心理因素影响,证券投资市场不乏羊群效应和锚定效应等心理误区造成的失败案例。而智能交易代理依据大数据的巨量信息中监控各种信号,克服了人性的弱点,精确做出买入、抛出等投资决断。

最后,传统证券资产配置服务已不能满足移动互联网背景下的用户需求。雇佣投资顾问经理能在一定程度上降低证券投资的风险,但投资顾问由于费用及模式问题,无法普惠普通散户。人工智能交易系统可以采用模型构建投资策略机器学习的模型,这样就能够采用大规模机器学习的方式生产投资策略。区别于传统的基于人工的投资策略生产方式,这样的投资策略生产方式可以在理论上形成无限制地生产投资策略,人工智能系统按照一定的指标进行筛选后,就可以提供给用户,充分满足移动互联网背景下散户投资人碎片化、个性化的理财需求。

想深入了解智能投顾的小伙伴可以大力戳链接:【赠书】新书来袭,你准备好迎接证券投资人工智能新时代了吗?,留言即有机会获赠这本证券投资人工智能的最新著作~

该书目前只在京东有售,心急的小伙伴也可以点击文末“阅读原文”直达购买链接哦~


近期文章精选:

亚行前首席经济学家魏尚进:电子货币完全取代纸币为时尚早

证券投资人工智能对证券市场的影响研究初探

张家林:金融科技公司的正确打开方式是与持牌机构、客户之间明确责任界定

“机器人投顾” 作用原理、应用前景和监管建议


中国金融四十人论坛

  “中国金融四十人论坛”(CF40)是一家非官方、非营利性的专业智库,专注于经济金融领域的政策研究。论坛成立于2008年4月12日,由40位40岁上下的金融精锐组成,即“40×40俱乐部”。

       CF40定位为“平台+实体”新型智库,专注于经济金融领域的政策研究。在四十人论坛平台型智库基础上,逐步形成了四十人和新金融两大实体型智库系列,分别包括四十人金融教育发展基金会、四十人金融研究院、丝路规划研究中心和上海新金融研究院、北方新金融研究院、北大互联网金融研究中心、浦山新金融基金会等机构。

       CF40平台集聚了来自政府机关、研究机构和商业机构的300余位金融领域精英人才;同时,CF40研究院专职研究员队伍也渐趋充实。CF40每年召开双周圆桌会议、金融四十人年会、国际学术交流研讨会等百余场闭门研讨会,开展课题研究近30项,出版周报、月报、要报、《新金融评论》期刊以及金融类书籍共计100余册,受到决策层领导重视和经济金融界人士高度评价。

       

       关注中国金融四十人论坛,请长按下方二维码:



    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存