证券投资人工智能对证券市场的影响研究初探
文 / 张家林 中国金融四十人论坛常务理事,北京资配易投资顾问有限公司创始人、董事长
摘要:围棋人工智能AlphaGo取得的成就让人们看到了人工智能的巨大潜能。可以预期的是,当越来越多的投资人运用人工智能来进行证券投资时,一种新的投资者类别出现了:“人工智能投资者 ”-即证券投资人工智能(以下简称SIAI)。SIAI会对证券市场带来哪些影响自然就成为当前人们关心的问题。
本文主要通过对SIAI的行为进行建模,以此出发研究SIAI的行为对证券市场将会产生哪些影响。由于我国证券市场尚未大规模应用SIAI,缺乏可靠的实证数据,因此,本文的研究主要通过数学模型进行演绎推理、大量模拟、结合少量的实证数据进行分析,得出一些基本推论,目的是建立评价SIAI的行业标准及规范,促进SIAI在证券投资领域的应用和可持续发展。
Stuart J. Russell 提出了目前业界公认的人工智能概念、模型和方法。他将人工智能定义为“从环境中感知信息并自主活动的软件和硬件实体-艾真体 (Agent)。对于一个艾真体应该具备什么样的智能,至少有四种理论模型 :
1)完美理性(perfect rationality)的艾真体(以下简称为 Ppr):基于可获取的信息,具备最大化其期望效用的能力。
2)计算理性(calculative rationality)的艾真体(以下简称 Pcr):基于可获取的信息,具备通过计算得到最理性的决策的能力。
3)元级理性(metalevel rationality)的艾真体(以下简称 Pmr):在必须通过计算进行选择的约束条件下,具备将“计算-效果-行动”进行最优组合的能力。
4)有界最优化(bounded optimality)的艾真体(以下简称 Pbo):基于可获得信息和已知计算资源,具备最大化其期望效用的能力。
Herbert Simon反对完美理性(或近似完美理性)的概念,并用有限度理性(bounded rationality)的概念取而代之,并把此作为艾真体决策的一种描述性理论。他指出“用于对复杂问题进行形式化和求解的人类思维的能力与在真实世界中实现客观理性行为所需要求解的问题的规模相比是非常渺小的-甚至对这样的客观理性的一个合理近似而言也是如此。”他提出,有限度理性就是只思考足够长的时间,得到一个“足够好”的答案为止。Simon因为此项研究而获得了1978年的诺贝尔经济学奖。但这种描述对于艾真体而言并不是很好的形式化说明,因为理论中并没有对“足够好”的定义。
在上述四种理论模型中,有界最优化(Pbo)逐渐成为人工智能的的理论基础。有界最优化指定的是艾真体内部结构中的最优化程序而不是它的最优化行动,毕竟,行动由程序产生,而程序才是艾真体的设计者所能控制的。
人工智能就是构建有界最优化的艾真体的观点成为业界主流是从90年代中期开始的。这样的理论模型可以很自然地适用于很多任务和平台-从工业机器人到类似AlphaGo这样的游戏AI,以及金融交易系统。目前的大多数人工智能都是基于此理论模型来进行构造的。
基于上述理论基础,Stuart J. Russell提出艾真体是由程序和该程序在某个具备物理传感器和执行器的计算装置上运行的体系结构构成。
艾真体=体系结构(机器)+程序(Programme)
体系结构可以简单的是一台个人计算机、一辆自动驾驶汽车、一套复杂的机械运动装置、也可以是复杂的大型云端计算机网络。程序被定义为:输入为传感器得到的当前感知信息,返回的是执行器的行动抉择。
考察艾真体对外部环境的影响时,我们主要是关心它能做什么,而不是怎么做。由此,我们可以构建一个数学模型来描述:
这就是说,完美理性的艾真体任何时候,都以其期望效用最大化的方式行动。这显然是做不到的,因为大多数环境下实现这个目标需要的计算时间都太长、计算所消耗的资源也太多,这是不可能实现的目标。有界最优化的理论模型给我们一个可能的框架来构建艾真体。
这个模型表达的意思是说,对于给定的计算资源和机器的约束条件,通过寻找最佳程序 Popt,可以获得最优的行动Aopt 。按照有界理性理论的定义,这样的最佳程序是必然存在的。我们知道,在计算科学领域,程序可以简化的定义为“数据+算法”。因此,自然的,对于寻找最佳程序的路线一个是从数据维度,一个是算法维度。数据维度涉及数据的获取、处理、存储等方面,当前主要是针对大数据的处理。算法维度方面主要包括两个方面的问题,一个是算法效率,即渐进性 O()问题,以及算法是否存在的问题,即NP问题 。
涌现,Emergence,也译为进化。这个词来源于系统科学。由于涌现在商业、经济、计算机和游戏娱乐等方面都有体现,现在已经广泛的流行。涌现性是指那些高层次具有而还原到低层次就不复存在的属性、特征、行为和功能。
对涌现的揭示,是随着三论(系统论、控制论和信息论)的发展以及对复杂系统的研究而逐渐推进的。在此之前,我们一般使用还原理论来解释问题,它的基本观点是:整体是由局部组成的,所以局部决定整体。整体的任何一个变化都可以在局部找到其原因,还原理论分析的方式符合我们的思维习惯,并且在很多地方都可以快速的,行之有效的解决问题。但是在遇到复杂系统的时候会产生一些无法解释的现象,比如生态、人脑、经济系统等等。因此人们开始引入复杂系统并展开研究。
在本世纪80年代,在美国圣塔菲(Santa Fe)这个地方,一群离经叛道的科学家(包括夸克之父盖尔曼、经济诺贝尔奖得主阿罗以及遗传算法之父霍兰等人)成立了叫做圣塔菲的研究所(Santa Fe Institute)开始正式讨论复杂系统中的问题,标致着复杂性科学的诞生。这里的科学家来自多个领域,他们打破了学科间的界限,用一种全新的,统一的视角来认识生命系统、神经系统、经济系统、计算机系统等等,不再关注每个领域的细节,而是大量运用隐喻和类比的方法,寻找不同系统之间的共性。
在这些复杂系统的共性中,“涌现”是一种最引人注目的普遍现象。所谓“涌现”,就是指系统中的个体遵循简单的规则,通过局部的相互作用构成一个整体的时候,一些新的属性或者规律就会突然一下子在系统的层面诞生。涌现并不破坏单个个体的规则,但是用个体的规则却无法加以解释。比如说,生命是一大堆分子作用的产物,每个分子必然遵循固定的物理规律,但是当分子聚合到一起的时候,原生生命却在整个分子群体的基础上诞生。分子构成的这个整体活了,它可以为自己的利益控制低层次的分子个体,它具备了自己的生命。
在这个过程中,我们无法把生命这一现象还原到单个分子的物理规则上去,并且也没有哪个“领导”分子给其它分子下达命令。所有的过程和奥秘,都只存在于系统的相互作用之中。另一个例子就是蚂蚁,蚂蚁的神经系统非常简单,只能进行简单的思考。然而大量的蚂蚁相互作用的时候就会形成等级森严的蚂蚁王国。研究证实,蚁后并没有直接给所有的蚂蚁下达命令,每只蚂蚁也没有整个蚂蚁王国的地图,每个蚂蚁只遵循简单的规则交互,大量的蚂蚁就能够聪明的觅食,建巢,分工等等,蚂蚁王国就是在整个蚁群之上的一种“涌现”现象。
关于涌现,最新的网络科学给出了很好的诠释:通过不断重复的小变化引起的网路特性的转变。通过涌现我们可以看到两个基本的原则:
1)通过不断的重复应用非常简单的规则构造任意复杂的结构是可能的;
2)现实世界的网络结构,无论是生物、物理还是社会网络,都可以解释为涌现的结果。
因此,具备涌现的艾真体的出现不仅是必然的,也是必须的。它大大扩展了艾真体的理性。
深度机器学习的核心理念就是寻求构建一个多层次的、异构的复杂学习系统,期待在此之上产生“涌现”,从而获得对更高级层次的认知。围棋AlphaGo取得的惊人成就,笔者认为,主要是它的系统具备了“涌现”。这些理论和实践,预示着人工智能的“智能”完全可以通过“涌现”获得巨大的飞跃。目前开发者都是非常期待“涌现”出现的,但涌现的出现,必然存在利与弊,如何发挥其利,抑制其弊是今后人工智能研究领域非常重要的工作之一。
接下来,我们将运用上述基本理论模型来分析证券投资人工智能结构以及对证券市场的影响分析。
有些学者已经指出,人工智能对金融市场将产生颠覆性的影响。人工智能技术在证券市场的应用领域很宽,比如前台的客服AI、中后台的结算清算AI以及投资研究都可以运用人工智能技术。虽然这些领域都可以给证券市场带来影响,但证券投资人工智能的大规模运用对市场的影响会更显著,将会改变市场的微观结构以及产业生态。因此非常有必要针对此问题进行重点关注。
证券投资人工智能(以下简称”SIAI“)是指能够自主感知证券市场的信息,并按照用户设定的目标或投资任务,自主完成投资组合选择、交易执行以及风险管理的艾真体。笔者提出了这类艾真体的模型。
SIAI是按照人工智能系统标准架构与证券投资任务环境要求构造的一个可以独立运行在云端的系统,具有感知、认知、用知这三项核心功能的人工智能系统。每个SIAI都包括如下几个子系统:
(1)数据&信号采集:获取外部环境的元数据、信号采集。包括证券的行情数据、基本面数据以及其他数据集。
(2)机器学习系统:包括投资规划、投资组合选择以及风险管理的模型选择、参数寻优等。
(3)知识库:由以往机器学习系统学习到的一些可重用的规则库、模型以及事件。
(4)决策系统:对于证券买卖、投资组合选择和风险管理规则运用的决策。
(5)交易执行系统:按照决策系统的输出,生成交易指令或交易建议的系统。
(6)业绩评价系统:对每个决策的事后分析、行为评价系统。
(7)激励机制:由用户自定义的一些惩罚、激励函数指标,指导机器学习系统的“方向”的一种负反馈机制。
在用户设定一些初始条件后,比如投资金额、投资期限以及目标函数(收益、风险方面的指标),SIAI就可以完全自主的进行证券投资,其间无需人工任何操作 。
SIAI是一个运行在大规模云计算服务架构上的艾真体,我们采用前面的艾真体的理论模型框架对其进行建模,分析其行为。
长期以来,证券投资理论主要可以分为价值投资理论、现代投资组合理论、行为投资组合理论这几个基本的方法。价值投资理论虽然得到很多知名学者和投资人的推崇,但事实上缺乏数学基础,它需要更多的“艺术”成分,并不适合用机器学习的方式。
现代投资组合理论和行为投资组合理论本质的区别在于是否假设投资者“完全理性 ”。现代投资组合理论以投资者是理性的、风险回避、预期效用最大化,以及在此基础上形成的相机抉择为前提,承认市场是有效的; 而行为组合理论认为,投资者是有限理性的,在进行风险决策时并不完全按照贝叶斯法则进行,而是采用简单而有效的直观推断。
Das、H.Markowitz、M. Statman等认为Markowitz的均值-方差理论(MVT)与Shefrin和Statman的行为投资组合(BPT)是殊途同归的,他们用数学方法将MVT和BPT整合到一个心里帐户(Mental Account)中,证明了MVT、MA和VaR的风险管理模型在数学上是等价的。因此我们将其合称为“组合投资理论”。
从上面简短地叙述,我们看到组合投资理论中的“有限度理性”、“相机抉择”、“预期效用”这些概念,恰恰也是人工智能中的理论基础。因此,我们很自然地在开发设计SIAI时,会必然的、也是合理的是以投资组合理论为基础 。
Morck等提出的“股价同步性”的概念,是指单个证券价格的变动与市场平均变动之间的关联性,即通常所说的“同涨同跌”现象。它的度量方法是用资本定价模型(CAPM )对个券收益与市场收益的回归模型的拟合优度来度量股价同步行。 越大,表示个券收益变动被市场收益变动所解释的部分越大,同步性越高。 很多学者基于行为金融学的理论,研究了投资者情绪、行为与股价同步性的关系。胡才泓通过实证分析得出股价同步性与投资者的趋同交易行为正相关,趋同交易行为是影响股价同步性的决定性因素的结论。 更进一步,行为金融学认为,投资者的行为有多种,如羊群效应、反馈交易行为、集中持股行为和短期投资行为等,但主流观点指出“羊群行为”、“正反馈交易行为“足以涵盖全部投资者的行为。
羊群行为也被称为从众行为,指投资人受到其他人的影响而跟从大众的思想或行为,如同时买入或卖出同一只证券。羊群行为是一种特殊的有限理性行为,它是由于投资者不完全信息或非理性而容易受到其他投资者的影响,模仿他人的决策;或者过度依赖舆论,而忽略自己的信息的行为。正反馈交易行为就是指“追涨杀跌”的交易策略,它与羊群行为高度相关。它是市场集体认知偏差呈现自我实现的特征,加剧市场的波动。
综合上面的分析,我们可以看到,投资者行为对证券市场的影响的根源是趋同交易。我们可以看到,当趋同交易规模较小时,主要影响是导致个券价格同步性提高;随着规模加大,将会产生羊群行为以及正反馈行为,引起更多的个券价格同步性提高,这样的扩散效应,显著地增加了市场的波动性。
从上面简要的梳理,我们可以看到,对“趋同交易”的度量是考量SIAI对证券市场影响的最基础、最核心的指标。
SIAI是否存在“趋同交易”的可能?如果存在,这种可能性有多大,规模有多大?如何管控这些风险就是我们接下来要重点讨论的问题。
通过上面的数学模型,我们可以做得出一些定性的结论:
1)投资组合空间越大,SIAI输出的投资组合的相似性度量大的概率就越小;
2)SIAI输出的任意两个投资组合的相似性度量与组合的证券数量成正比;
3)虽然初始条件、投资组合空间大小、市场信息、艾真体程序这些SIAI的输入以及内在构造的状态空间很大,SIAI输出的任意两个投资组合一样的概率非常小,但其相似性度量是有界的,与市场的总的证券数量呈负相关性。
4)由于机器学习可以大规模的计算,相比传统投资人而言,它的投资组合空间很大,趋同性交易的概率更低。
笔者采用北京资配易投资顾问有限公司开发的证券投资人工智能(以下简称”资配易SIAI“)为例,通过一些实证数据和模拟来分析。资配易SIAI是该公司开发的“机器人投顾 ”系统,各种类型的投资人可以定制自主拥有的“机器人投顾”来管理自己的投资。这些”机器人投顾“是运行在云端的艾真体,资配易公司负责开发、运营和维护整个SIAI的云端系统。先简要介绍下工作流程:
资配易SIAI通常在完成用户的适当性评测后,根据用户特征来定制。一旦完成定制,用户就完全拥有了一个“艾真体”,资配易的每个艾真体都有自己的身份ID 。
用户开始使用时,首先给SIAI下达投资任务,用户初始化条件包括:预计投资期限、投资金额等。SIAI就会输出几个投资方案(一般按收益-风险度量分类)让用户选择。如图:
每个投资方案中包含若干投资组合,每个投资组合为数量不等的证券组成:
实证分析的方法是,我们首先通过模特卡罗模拟用户不同的初始条件下、给定投资组合范围、其他条件相同的场景下,考察资配易SIAI的艾真体函数的特性:
1)每次输出的投资组合是否相同;
2)任意两次投资组合的相似性度量。我们取2016年4月11号资配易SIAI的模拟测试结果如下:
资配易SIAI输出了10000个投资组合,我们提取其中的100个投资组合的预期收益-风险显示如下:
这张图横坐标显示的是每个投资组合的预期收益率,纵坐标显示的是投资组合风险系数。
接着,我们计算任意一个投资组合与其他投资组合的相似度度量,这需要计算100!次,产生约100!个点。为显示方便,我们提取其中的100个点计算结果图示如下:
上图中,左下角的红线,显示的是任意两个投资组合的平均相似度。可以看到,资配易SIAI输出的投资组合相似度很低。左上角、右下角的图显示的是任意两个投资组合的合计证券数量与相似度的关系,可以看出投资组合的证券数量越多,其相似度就越小。
从上述实证分析可以看出,资配易SIAI的艾真体函数的投资组合的相似性度量很低,引发趋同交易或股价同步现象的概率非常小,评测性能优良。
从上面的分析可以看出,证券投资人工智能对证券市场的影响,主要需要关注的是其“趋同交易”的行为,而“趋同交易”行为是导致个券同步性的决定性因素,个券同步性决定了市场的羊群行为以及正反馈交易行为。度量证券投资人工智能的“趋同交易”行为的主要指标是投资组合的相似性度量:即证券投资人工智能在任意时刻,对于不同初始条件,在相同的市场信息、投资组合空间下,输出的“最优”投资组合的相似度。
因此,对于证券投资人工智能可以采取“截面面板”的方法,评测其相似性度量指标,并以此评价其行为对市场的影响程度。如果相似性度量指标很高,说明此SIAI对市场波动具有较大的影响。
“趋同性”交易是SIAI开发设计者需要尽量减小的行为。具体的实施方法有很多,包括提高投资组合空间、投资组合构成的数量等。但在实践中,考虑到不同时刻进行的投资组合选择,因此,会大大降低“趋同交易”的可能性。同时,通过压力测试可以有效的评测SIAI是否满足合规性和审慎监管要求。上述评测证券投资人工智能的行为的方法和度量指标,旨在有效的检验和消除其行为对市场的不利影响。
需要强调的是,“羊群行为”本质上是有限理性的必然结果,因此,采用有界理性的SIAI并不能完全消除“羊群行为”以及其衍生影响,但它可以大大的降低市场“羊群行为”的规模、频率和影响程度。针对SIAI完善的评测指标体系如何构建,还需要根据监管要求、投资者保护方面的综合考量拟定,这方面的研究还需要继续展开。
通过“趋同性”压力测试和相似度度量评测的人工智能系统的优点是非常显著的:它通过独立、差异化的投资策略,有效的保护投资者。当更多的投资人应用“合格”、“适当”的证券投资人工智能后,可以预期市场会更趋“合理性”,而且会显著降低市场的波动性。“人工智能投资者”的大量出现,对于改善A股市场投资人结构具有非常显著的优势,从这个意义上讲,“人工智能投资者”对于中国证券市场的发展具有非常积极的意义。
原创声明:本文仅代表作者个人观点,不代表CF40立场,转载请注明出处。
近期文章精选