查看原文
其他

如何预测股票走势?一个模型带你揭秘股票的语言

FinTech研究所 人大金融科技研究所 2022-05-12

近日,斯洛文尼亚卢布尔雅那大学教授Marko Poženel和Dejan Lavbič针对股票预测问题发表论文《Discovering Language of the Stock》,提出了一种新的结合 NLP (Natural Language Processing,自然语言处理)和日本蜡烛图的股票趋势预测方法 (Word2Vec),中国人民大学金融科技研究所(微信ID:ruc_fintech)对文章核心内容进行了编译。该算法将处理自然语言的语义分析,运用到股票当中,试图揭秘股票走势的语言。预测结果表明该方法在大多数情况下都比传统的Buy&Hold、MACD和MA策略表现地更出色。

作者丨Marko Poženel , Dejan Lavbič

来源丨《Frontiers in Artificial Intelligence and Applications 》

编译丨詹钥凇



一、导言


股票预测一直是研究人员和投资者最具吸引力的话题,适度准确的股票趋势预测可能会导致高财务收益和对冲市场风险。虽然该研究领域有非常大的吸引力,但是成功预测的研究论文数量仍然相当少。主要原因是,投资者长期接受了有效市场假说(Efficient Markets Hypothesis,EMH),价格包含了所有可用的关于股票的信息,只有新的信息能够改变价格走势,所以异常收益率不可能只基于研究股票价格的过去行为的演变就能获得。

 

在过去的几十年里,一些经济学家对 EMH 持怀疑态度,并赞同股票价格部分可预测的观点。其他人则声称,股票市场比最近的许多学术论文更有说服力和不可预测性。尽管如此,许多预测未来股票价值的方法已经被提出。


在这项工作中,作者提出了一种新的预测未来股票价值趋势的方法,结合日本蜡烛图(将各种股票每日、每周、每月的开盘价,收盘价,最高价和最低价等跌变化状况,用图形的方式表现出来,也被称为k线)的技术分析方法和深度学习。该模型利用了 Word2Vec,这一算法常用于非结构化文本的处理技术分析,可以找到文档中单词之间的深层语义关系,在英语文本分类和聚类中表现出优越的性能。


二、预测模型


下图是算法预测模型的流程图,主要可以分为识别单词,单词成句,语义分析,预测走势这几个步骤。



识别单词


将数据正规化,利用无监督学习的K近邻算法,将股票历史的每日K线分成最多nw个不同的类别(参见以下英文原文),每一类别就是一个单词。



从单词到句子


规定每一个句子的单词个数为ls个,那么将股票连续ls天的k线所表示的单词连起来就构成了一句话。如果股票有很多天的历史数据,将历史数据所包含的天数设为nd,那么可以根据这些数据形成许多个句子。S是股票历史数据构成的语句矩阵,每一行代表一个句子,将矩阵的行数设为ns行,意味着由历史数据一共可以构成ns句话。



Word2Vec 算法


Word2Vec通过使用仅包含一层神经网络来获取语言的一些规则和模式。虽然算法相对简单,但是已经被证明在识别自然语言的领域这个算法是非常出色的工具。该算法可以实现自然语言构成的向量所进行的加减运算,比如在通过一定训练后,可以计算:

最后得到的答案是“France”。


通过Word2Vec算法,将语句矩阵S转换成WM矩阵,用来表示单词在句子之中的联系、逻辑与规则。



算法训练


首先定义需要根据机器学习预测的变量,为了简化模型,将”买”,“卖”和“持仓”这三个指令,作为被预测的变量。当一定日期之后的股票收盘价大于现在的收盘价和手续费之和的时候,定义变量y=0,意味着买股票。反过来,当价格小于几天后的收盘价和手续费的时候,y=1,表示卖股票,其他情况y=2,表示持仓。

定义好后,利用股票的每日历史数据,以及通过全样本人为设定的每一天的交易指令,来训练模型,得到预测之后股票交易指令的算法。


预测


最后,进行预测,并根据预测的交易指令作为交易策略,对该机器学习的交易策略回测,分析最后的收益。


三、最终结果


对苹果、微软和可口可乐三家公司的股票数据,利用Word2Vec算法进行预测然后模拟交易,并与Buy&Hold,MACD和MA三种策略进行比较,发现通过Word2Vec开发的策略的收益,明显高于其他三种策略。



以下为部分文章截图

……

获取完整动态报告

请后台回复“股票语言”

获取下载链接


END

翻译/詹钥凇

编辑/罗妤

责编/詹钥凇 齐庆武


【延伸阅读】


关于我们

中国人民大学金融科技研究所(以下简称 “研究所”),英文名“FinTech Institute of Renmin University of China”,简称“RUC FinTech Institute” ,是专注于金融科技理论、应用与政策的新型智库和研究机构,也是人民大学金融科技学科“双一流”建设的延伸科研平台。研究所充分利用中国人民大学在金融、经济、管理、统计、法律以及计算机科学等方面的跨学科优势,打破学科壁垒,加强交叉融合,不断推进金融科技的前沿研究。研究所坚持理论联系实际,注重应用成果转化,不断加强学界、业界和政策部门的良性互动,重点打造一个“产学研政”四位一体的多元化平台,为推动金融科技行业健康可持续发展提供决策参考。

加入群聊

为了增进与粉丝们的互动,研究所建立了金融科技微信交流群,欢迎大家进群参与。


入群方法:后台回复“加群”,加小助手为微信好友,添加时备注个人姓名(实名认证)、单位、职务等信息,经群主审核后,即可被拉进群。

中国人民大学金融科技研究所

扫码关注我们

Research portal for all FinTech trends and policies.


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存