基于新一代人工智能的量化金融实践教学研究
(图源:网络 侵删)
0 引 言
随着技术的不断发展,新一代人工智能作为中国制造产业升级的战略高地受到了国家的高度重视。以深度学习为代表的Alpha go战胜了世界围棋大师,这代表了新一代人工智能更加接近于人类智能。它如同当年的互联网技术,正在向社会、产业的各个方面渗透,推动经济社会各领域从数字化、网络化向智能化加速跃升,高校作为新一代人工智能人才的培养基地,人工智能应该成为计算机类专业实践教学的重点,信息工程专业实践教学改革正是要探索“AI+”背景下实践教学的模式创新。
新一代人工智能技术以深度学习为代表。目前,比较著名的有Google的Tensor flow、加州伯克利分校的Caffe、蒙特利尔理工学院的Blocks和Keras,以及Facebook开源了大量Torch的深度学习模块和扩展[1]。国内有百度深度学习平台PaddlePaddle,易学易用的特点非常适合教学。从2017年开始,我国政策的重点已经从人工智能技术转向技术和产业的融合。2017年出台的《新一代人工智能发展规划》明确指出:必须加快人工智能深度应用,培育壮大人工智能产业,为我国经济发展注入新动能。分三步走:第一步,到2020年人工智能总体技术和应用与世界先进水平同步;第二步,到2025年人工智能基础理论实现重大突破,部分技术与应用达到世界领先水平;第三步,到2030年人工智能理论、技术与应用总体达到世界领先水平,成为世界主要人工智能创新中心,智能经济、智能社会取得明显成效,为跻身创新型国家前列和经济强国奠定重要基础。这需要大量的新一代人工智能人才,高校人工智能教育责无旁贷。
为了将人工智能与实践教学有机结合,笔者首先确定了以高素质、应用型人工智能人才为培养目标,立足满足传统行业产品创新和服务升级的“AI+产业”人才培养需求,通过教育部协同育人项目建立产学研实践基地,准确把握新一代人工智能人才需求规格,据此重构信息工程实践教学体系,引入量化金融等实践内容,重点培养学生的人工智能创新思维和创业能力,实现与产业的无缝衔接。
1 信息工程专业实践教学改革的核心理念
新一代人工智能人才的培养要着眼于深度学习、大数据和云计算等新一代信息技术的学习和应用,以及双创能力的培养。在教育理念上,将双创活动与产学研活动有机融合来重构教学大纲和实践体系,涵盖传统信息系统改造升级、新一代人工智能产品、服务构思和实现的全周期。人工智能教育理念的核心就是要以新一代人工智能技术进行产品创新、系统集成以及商业模式的创新,因此,实践课程要以新一代人工智能技术知识传授为“点”,以传统行业结构调整、产品升级和模式创新为“线”,以新一代信息人工智能产业培育和发展为“面”,通过“点、线、面”一体化的人工智能项目贯穿整个信息工程实践教学的实验、实训和实习过程。在项目构思和设计阶段采用可公开获得的财经、金融大数据作为信息源,然后以量化金融作为实践教学的主要内容和创新方法,在实施和运行阶段融入双创活动培养学生的创新精神和创业意识,从而全面提高学生的工程实践能力,即不仅包括个人的理论知识和专业技能,而且包括团队意识和创新创业素质拓展[2]。
2 基于新一代人工智能的信息工程专业实践教学改革的关键问题
2.1 人工智能实训项目选取是重中之重
笔者通过问卷调查、产业调研和头脑风暴方法,结合专业转型的中、长期规划,并根据大数据实验室建设,确定了一系列人工智能项目作为突破口,其中比较有代表性的是“量化金融实训系统”(如图1所示)。
本项目以浙江省大学生学科竞赛为抓手,采用同花顺Mindgo量化金融平台和MQL智能交易平台,结合优矿、聚宽、米宽、易盛、金字塔、交易开拓者等主流量化金融人工智能社区,开发金融、财经等领域的人工智能算法、软件和系统,为证券市场的机构投资者(公募、私募、券商、银行、保险等)和个人专业投资者提供智能投研工具、智能投资平台和智能投顾服务。
2.2 人工智能项目与实践教学体系的无缝融入
将人工智能针对不同课程的教学大纲分解成多层次的实验、实训、实习子项目,各子项目既相对独立又互有关联,在实验、课程设计、毕业设计等课内教学中反复引用,在实习、实训、助教、助研和学科竞赛等课外活动中实现迭代开发。新一代人工智能理论知识结合产业发展的实践不断深化,全过程体现产学研相互促进的连续性和有序发展。新一代人工智能知识学习采用先固化、再消化、后优化三步走:首先学习经典的人工智能算法和新兴的深度学习理论,按照已有案例重复实验进行验证,做到实验模式的固化;然后消化人工智能的知识,并根据当前金融行情的变化搭建创新的模型以指导实践,将知识转化为能力;最终实现模型和策略的持续优化。
以海龟智能交易系统为例,首先基于MQL在外汇平台上进行模型的验证,消化海龟模型的策略和特点;然后将其用Python语言实现并移植到Mindgo量化金融平台,在股票市场进行进一步验证,反复实践;最后,基于SVM等机器学习传统方法对模型进行优化。由于Mindgo对Tensorflow等新一代人工智能开发工具的支持有限,因此,借助zpline开源系统搭建平台(WorldTrade)、接入聚宽JQData等,并基于深度学习模型对海龟模型进行最终优化。将优化后的成果对接投资机构和国内外著名量化交易社区进行产业化输出。整个过程结合了毕业实习、毕业设计、学科竞赛、课外学术活动、双创活动和素质拓展活动,给学生及时的学分反馈和成绩评价,避免因长时间实践的枯燥性而造成学生兴趣的丧失。WorldTrade实训平台如图2所示。
1)以C语言为基础底层接口。
C语言在程序算法运行的速度上是有目共睹的,具有很大的优势,决定了金融量化交易系统的底层速度优势。
2)以 MATLAB 和Python为中层打造交易系统框架。
MATLAB是经典的人工智能开发语言,开发者基于MATLAB 函数库编写了大量经典模型,其稳定性和可扩展性决定了金融量化交易系统具有很强的灵活性。
Python是新一代人工智能的主流语言,人工智能包含常用机器学习和深度学习两个很重要的模块,而Python拥有matplotlib、Numpy、sklearn、keras等大量的人工智能库,pandas、sklearn、matplotlib可以做数据处理、数据分析、数据建模和绘图,基本上机器学习对数据的爬取(scrapy)、对数据的处理和分析(pandas)、对数据的绘图(matplotlib)和对数据的建模(sklearn),在Python中都能找到对应的库来进行处理。
3)以文本信号为基础信号来源。
WorldTrade以文本信号为基础信号源,决定了金融量化交易系统的可接入能够生成文本信号的程序化交易平台(包括交易开拓者、金字塔、Multi Charts、Trade Satition、Magic Quant等),同时支持编程软件Python、R、Vba、C#、C++、Java 外部链接等,还可以链接 Wind、Sina 、Yahoo 等财经网站,保证了金融量化交易系统可以充分整合外界资源的优势。
4)系统操作界面。
WorldTrade金融量化交易系统的操作界面简洁,主界面图右边为本金融量化交易系统的各项交易操作。该操作系统可实施批量操作以及实施股票账户风险监控。系统包括实时股票账户本地股票池,本地股票可以选择手动代码输入,也可以选择交易设置的批量导入。
5)基于大数据分析平台。
WorldTrade采用Nutch来采集金融大数据。不同于Google Crawler,Internet Archive Crawler,Nutch 是一个开源Java 实现的搜索引擎,它提供全文搜索和Web爬虫,支持国内外多种网页类型的信息采集,性能稳定,采集高效,能够节省大量编程调试的时间。WorldTrade具有高度的可扩展性,遵守Robots 协议,可以灵活地实现金融数据的抓取逻辑,从互联网上抓取所需要的财经数据,并且支持各种底层数据存储模型(包括HDFS、Mysql、Hbase等)。
WorldTrade采用ElasticSearch提高金融信息的检索性能。ElasticSearch是一个基于Lucene的搜索服务器,它提供了一个分布式多用户能力的全文搜索引擎,基于RESTful web接口,是当前流行的企业级搜索引擎,实时搜索稳定、可靠、快速。当索引量很大、搜索请求并发很高时,需要使用SolrCloud来满足这些需求。SolrCloud是基于Solr和Zookeeper的分布式搜索方案,它的主要思想是使用Zookeeper作为SolrCloud集群的配置信息中心统一管理,具有大规模、容错、分布式索引和检索能力[2]。SolrCloud和ElasticSearch这两个开源的分布式搜索方案均支持分布式、实时索引,通过http请求来获得搜索结果,部署简单、使用方便、性能强大,是当前领先的数据索引方案,可以很好的满足金融数据的检索性能。
2.3 建立新一代人工智能实验室
人工智能专业实践教学改革的场景是真实的量化金融实验室体验项目,但目前基于CPU的实验箱的传统教学,无法满足以GPU为核心的新一代人工智能技术日益发展的行业需要。为此,我们采用国际先进的人工智能一体机,面向金融、财经数据等领域,以大数据分析为主要手段、以深度学习为突破口,基于Python、MQL和Matlab语言,将机器学习应用到金融工程中。所选的软硬件配置相对比较先进(见表1)。
量化金融实验室的建立,将有效弥补传统实验室的不足。信息管理和信息系统方向有关传统机器学习算法的验证性实验可在现有实验室进行;基于新一代人工智能的大数据分析和应用创新,可以分阶段在量化金融实验室中实施。
3 面向新一代人工智能的信息工程专业实践教学改革
经过师生的共同努力,量化金融实训系统顺利完成(如图3所示),综合运用了新一代人工智能技术中的深度学习、云计算和大数据技术,这不仅实现了与新一代信息技术产业的无缝对接,也大大促进了学生的创新创业能力的培养,激发了大学生的学习兴趣和创业热情。通过收益率排名、策略分析、实战对抗等模式增加了实践教学的趣味性和真实感。
量化金融实训项目的综合评分三大指标包括业绩指标(40%)、风险指标(40%)和风险收益指标(20%):业绩指标评分标准包括累计收益率(30%)、成功率(10%);风控指标评分标准包括收益波动率(20%)、最大回撤(20%);风险收益指标评分标准包括Sharpe Ratio(20%)。
4 结 语
基于新一代人工智能的信息工程实践教学改革的实践,最初起源于学校财经特色的打造和信息工程专业转型升级的时代需求,后以学科竞赛和双创活动为抓手、以人工智能实验室建设为契机,结合教育部协同育人项目,将新一代人工智能的实践教学贯穿于实验、实习和实训中,应用于智慧金融产业的创新驱动,也促进了学生创新创业能力的提升。
基金项目:教育部产学合作协同育人项目(201701017084,201701017101,201702065116);浙江省公益项目(GF19G020002);宁波市自然科学基金项目(2017A610126);宁波市科技项目(2017C50024,2017A610126);浙江省新苗计划(2017R425003);宁波大红鹰学生科研项目(1042218023,1042218006);宁波大红鹰学院科研、教学项目“基于新一代人工智能的量化金融实践教学研究”。
作者简介:潘铁军,男,宁波大红鹰学院信息工程学院教授,研究方向为人工智能,pantiejunmail@126.com;郑蕾娜(通信作者),女,浙江万里学院商学院副教授,研究方向为管理科学,leina_zheng@126.com。
参考文献:
[1] 潘云鹤. 新一代人工智能的应用将极其广泛[J]. 中国科技财富, 2017(8): 42.
[2] 张新新, 刘华东. 未来出版的新模式与新形态: 以《新一代人工智能发展规划》为视角[J]. 科技与出版, 2017(12): 38-43.
[3] 传忠, 胡俊, 陈维宣. 我国新一代人工智能产业发展模式与对策[J]. 经济纵横, 2018(4): 41-47.
[4] 潘铁军, 郑蕾娜, 王明, 等. 基于IEC-PER理念的项目化实践研究与应用[J]. 中国信息技术教育, 2017(8): 80-84.
(完)
更多精彩:
专业课的创新创业能力培养实践——以Android应用开发课程为例