查看原文
其他

【速记】广发证券 刘幸:大数据和人工智能助力证券期货业务创新

2017-11-29 星环科技 星环科技

11月3日,星环在中国深圳举办主题为“证券基金未来|‘大’有可为”——暨2017星环首届证券基金行业论坛“,吸引了超过80家券商基金近300位业内观众参会。


因会后收到不少嘉宾反馈,对演讲内容非常感兴趣,演讲信息量大,现场又无法及时记录,特在后期推出嘉宾演讲速记系列,以最大程度弥补这个遗憾。


广发证券大数据平台技术负责人刘幸:“FinTech促进券商的业务转型,是下一代券商的核心竞争力。人工智能已经处在风口,在国外的券商业务中已经有经典的应用场景并显示了其巨大的价值和潜力。”那么,广发证券的智能证券业务未来的发展趋势如何呢?


【演讲内容】

一、大数据和人工智能的时代;

二、人工智能和大数据在行业中的应用;

三、人工智能和大数据在广发的实践。

大数据和人工智能的时代


时代趋势。这是一张反映技术成熟度的图,大家可以看到大数据和人工智能所支撑的技术基本上都在顶峰,也就是说这两个是比较火的。我们再看一下人工智能和大数据给我们带来一个很大的领域叫FinTech。我个人总结一下大概是三个,第一个是人工智能,第二个是大数据,第三个是区块链。这里我主要讲人工智能和大数据,再加上传统的证券业务,传统证券业务推出了一系列创新型的产品,用技术去推动业务的发展。



行业形势。一句话来概括,FinTech促进券商行业的业务转型,是下一代券商核心的竞争力之一。这里主要有两个技术:一个是大数据,一个是人工智能。大数据现在已经进入成熟期,因为从我进入这个行业开始,大数据就已经非常火热了。大概从2004、2005年发表论文开始,2007、2008年Hadoop开始横空出世,那时候大数据就逐步的火起来,到了一几年,基本上是火遍天。现在大数据技术提的已经比较少了,因为这个风头已经被人工智能所取代,这个标志性的事件可能就是AlphaGo事件,所以人工智能现在处在一个风口。据我个人判断,确实存在可以落地和实践的地方。


人工智能和大数据在行业中的应用


人工智能和大数据在行业中的应用主要有三方面:智能证券业务、数据化运营、智能监管。


1、智能证券业务


智能证券业务有几个大的方向:①智能报告,比如投资银行、证券研究类里面可以做一些智能研报,这些都是全部智能化,比现在人工建模人工写的这种效率高很多。②量化交易、征信,可以把这个归结为人工智能辅助工具。③智能投顾,这个也炒得非常火,我们广发也有相应的智能投顾产品,叫贝塔牛,应该是券商里面第一个吃螃蟹的人。④金融知识图谱,这也是我们现在正在建的一个东西,还没有完成。


智能证券业务里面的智能投顾和智能客服部分,分为三个维度:用户服务、投资产品服务和资讯类服务。这几个东西在我们金融行业看起来好像比较新,其实在互联网行业早就已经玩得非常成熟了,比如说资讯,我们智能化推荐,根据他的个人兴趣去推荐一些东西。


2、数据化运营

数据化运营也是非常成熟的。之前我们把这个东西叫做基于数据的运营,或者叫数据化运营,第二步我们会跳到智能化运营。我们看一下数据化运营里面主要的几个点:数据化运维、智能风控、智能合规稽核和智能财务,后面我会讲到数据化运营和智能风控实现的方式。


3、智能监管

监管行业就是有适当性的检测、交易的检测和反洗钱的检测,这三个都是非常适合用智能化的技术去解决的。


人工智能和大数据在广发的实践


这部分内容包括广发在人工智能和大数据方面的技术介绍以及人工智能和大数据在广发的应用情况。


1、广发在人工智能和大数据方面的技术介绍


①服务层级关系

资源层。最底层的一定都是资源。首先有资源,我们才能干活。最底层的资源我们有大数据和人工智能技术站,必须有比较多的技术储备;往上有数据源的集成,有IT的资源,有专业的人力资源,这整个构成了我们的资源层。


服务层。我们有了资源以后,会推出各种各样的服务,由此建一个服务层,有大数据开放的研发服务,有智能引擎,有大数据引擎,有自动化产品,有专业的方案和研发。


客户层。再往上是客户层,这不一定是我们广发最终真正的客户,但是对我们的大数据和人工智能平台来说有可能是我们的客户,所以我们对内所有的业务部门也算我们的客户,比如我们的手机APP的使用端也是我们的客户。也就是说使用了我们整个服务的都算是我们的客户,所以有浏览器,有APP,有最终用户,以及我们的业务部门等等,这对我们来说都是客户。这是我们的服务层级关系。


②广发大数据团队日常工作

平台建设及运维。我们会运维一套人工智能和大数据平台,不但要建设它,还要维护它。


数据运营。有了这个基础之后,会做数据运营,常见的有常规的数据治理工作、数据建模工作、以及与数据资产与运营管理相关的工作。


价值发掘。数据运营之后,接下来就进入价值发掘阶段,这个是最核心的东西,一级一级往上推的话,它的价值越容易被人所看到。价值发掘阶段,有AI、大数据、云服务、研发、运营管理。我们刚才讲的服务层,我们要进行研发,我们把它称为内部的私有云服务。价值发掘有产品研发运营服务。再往后我们有业务项目的研发方案,这个就相当于不是我们主导的一个产品,相当于某个业务方,比如我们要做一个智能化的风险识别,提出业务需求,我们用大数据和人工智能的能力去支撑业务的开发和运营。


③系统架构


系统架构分成四层:天源层(数据池)、集市层(数据集市)、服务层(SaaS层)、PROD产品层。


天源层。我们再看一下系统架构是怎样的。这是整个系统的架构,这一块技术人员会比较感兴趣。我们看一下左边这一条,数据治理体系,从下往上要保证它的开放性、应用性、合规性、安全性和可靠性,这些是用一套标准和规范来约束着下面这一层。


下面这一层大的东西是我们的PaaS层,PaaS是平台即服务的意思。我们建了一个大数据和人工智能平台,大数据平台是最中间的这一块,叫广发Data Platform,最右边是AI Platform,人工智能平台,这个平台是平等的关系,并不是上下级的关系。


再往上是DaaS,是数据即服务,我们下面有一个数据池,我们叫做天源层,这个Date Lake是我们所有数据的池子。我们把所有业务的数据,包括它所有的历史,全部采集到数据池里去,供大家使用原始的数据。大家可能会有很多的问题,比如一份数据有很多人使用,比如我需要一个指标,很多人重复计算,我们就非常缺乏一个金融建模。


我们再往上有一个FDM3.0,是金融模型3.0,这个金融模型是下面那个层之上,做了一个统一的金融建模,这与我们协会里面做的统一证券行业的模型,我们也受邀参与建设了行业数据模型,我们是先于行业数据模型去做这个FDM开发的,最后我们在这个项目里发现,整个行业的数据模型和我们自己建的数据模型,有百分之九十几都很类似。所以这个故事告诉我们,基本上我们这个行业的数据模型层是很相似的,非常有相互借鉴的意义,大家可以在协会的官方渠道里面了解到,他们已经发布了行业测试版的模型,大家可以相互参考一下。


集市层。再往上,在这个模型之上,针对各个业务、各个产品,去建很多的数据集市,有风险集市、用户集市、资讯集市、风险集市,各种指标集市等等。这个是面向于某一个细分的业务领域的,我们做统一的建模。


SaaS层。最后再往上看一层SaaS层,是服务层,我们整个服务层有两块:一个是技术和存储服务,还有数据云服务,和AI能力云服务。这个服务层就是把数据和底层的计算能力和存储能力开放出来,给我们整个集团来进行使用,当然不是对公开放的,我们是对内网开放的,把这个以云服务的方式开放出来。


PROD产品层。再往上一层是PROD产品层,这就是一般人看到的东西,就是产品,有我们整个大数据研发套件,有任务编排,源数据管理,多维分析,数据质量,大数据管控台,制度查询,这是大家能直接看到界面的产品。


左边这一套是大数据开放平台,再往右,大数据类的产品,如数据门户、经营分析系统、用户画像系统,这些系统也是大家能看得见摸得着的产品级的存在。最后右边是智能化的产品,比如智能投顾,精准营销系统,智能量化金融相关的产品。


2、广发在人工智能和大数据方面的应用


数据化运营


再看下我们常用的数据化运营,简单说就是看报表,搞一堆报表,整在一块,大家把权限一设置,大家去看,我关心这个报表,你关心那个报表,用权限来隔离就行了。这个东西我们把它叫做数据门户,这其实就是一套报表和权限的管理系统,所以我们通过大数据技术将企业运营各方面各层次的数据集合在一个平台里面,等一些业务的变化和趋势呈现业务分布的特点,透视业务的细分特性,这样就能全面掌握我们的业务运营情况。比如我负责某个业务线,我一眼就能盯出今天的业绩是怎样的,今天我正不正常,这是数据化运营。当然盯的更细的可能是运营人员,或者营销类的人员,都会看这些,甚至产品经理都会看这些东西。


用户画像及其应用


我们喜闻乐见的就是用户画像,几乎所有做大数据的团队都会做用户画像。用户画像就是了解我的客户有哪些特性。举个简单的例子,这个客户是我们的三星级的客户,他的风险承受能力是高,他偏向混合型的,不是偏向于基金而是股票的,投资者类型是稳健型的,投资经验有五年,平均持仓33天,资金周转率20%,通常是通过手机端交易,而不是通过PC端交易,这个就是用户画像。用户画像还有一个很大的属性,就是人口地理学的属性,比如说年龄、身高、性别、职业等等。其实我之前也在互联网行业待过,我们在互联网行业做用户画像的时候,更多依赖的是预测型的标签,就是你很难拿到这个人具体是什么样,但是在金融行业用户画像反而更好做,因为金融行业你能拿到用户很多具体的信息,用户把自己很多信息都直接告诉你了,然后你再辅以预测和建模,用户画像的质量往往比互联网行业的用户画像准确性和质量高很多,这是我们的用户画像的优势。


所以在座的金融行业的各位,不妨大量的把用户画像给应用起来,因为这个东西在互联网行业已经是一个非常成熟的技术和业务,金融行业能得到一个比互联网行业更加准确的画像之后,我们能发挥更大的价值。举个简单的例子,这个画像做出来,只是一个基层的工具,也就是说它是一堆数据,我怎么使得这个数据发挥价值,这个画像就要有应用,有哪些应用点呢?比如精准营销、精细化运营。精细化运营有一个用户生命周期管理是最容易做的,比如客户获取,我们通过用户画像,识别到这个客户是怎么样的性格,他可能不是我们的客户,而只是我们的潜在客户,我们可以识别出潜在客户。当他成为我的潜在客户之后,他们可能会使用我们的哪些服务呢,我们就要挖掘客户的需求,他可能会用我们的服务,他感兴趣的服务,我们就推给他。再往上客户到了成熟期,我们会进行交叉销售、产品营销,来提升我们的销售额,当然这一切都是以客户不要有反感,要把握度,不要整天给他推送消息。


用户生命周期管理

客户衰退和客户流失,这也是很重要的问题,而且这是非常好做的,只要跑SQL,你去建一个模型,跑几个SQL,就很容易得到哪些客户是我们潜在的流失客户,我们有针对性地做一些客户关怀,就很容易把潜在流失客户拉到,隔几个月做一次,基本上我们的效率是非常好的,每次都挽回了几十亿的资产损失。


基于大数据精准营销


再往后看是基于大数据进行精准营销,用户画像是精准营销里面的一环,除了用户画像之外,还要有运营分析和营销服务,我们有了用户画像之后,我们还要建一个运营系统,还要建一个营销服务系统,这三个是交叉的,这也是跟我们互联网一样,拉新、促活、留存,这是互联网最常用的东西,金融行业这一点也是没有改变的。给运营人员、产品经理提供事前、事中、事后客户运营的一个平台。


我们的运营人员会主动查询一个人群,针对人群去做营销,比如我们针对20到40岁的白领女性客户,专门给她做一个特定的,看她的构成是怎么样的,针对这个构成,筛选出来后,我们可以有针对性的发一个产品。


大数据指标库


这是一个内部系统,但是也是特别常用的。我们建了一堆可能感兴趣的指标,这是解决什么问题呢?因为金融建模之后会产生很多的指标和维度,我们会做成一个很灵活的系统,放在那里给我们的业务人员和运营人员,主动去查询、组合这些维度和指标,得到他们想要的报表,可以极大节省我们的人力投入去开发报表。这个非常灵活,因为它的组合是相乘的关系,是几何级倍数的关系,如果有了整个核心的指标库之后,用户去洞察我们整个的数据就非常方便,不用再开发了,基本上两三分钟就能产生一个他想要的维度去整合起来。这是非常重要的一个产品,相当于一个内部使用的产品。


量化与投资云平台


这个平台是用FinTech技术,有云服务技术、大数据技术、人工智能技术等等,去打造一个传统的量化投资平台。


这个系统和传统的量化软件有什么区别呢?


它最大的区别是基于云端技术打造的,它上面的编程语言、用户体验、数据环境都是以云的理念去打造的,不像传统的是没有客户端的,每个人打开手机或者浏览器就能去使用。第二,所有的服务是以云服务的方式去提供的。第三,它整合了现在很多流行的技术,比如大数据、云服务等概念,最后把我们的实盘交易打通,我们相当于一个云端的交易平台。它如果发展得比较好的话,可以发展成一个生态,比如说有人基于人工智能技术、大数据技术,可以做很多事情,像融资融券、策略服务管理、投研报告、量化交易、开放、量化策略、风控、相关的PB业务,以及交易通道、策略研究、模拟交易等等,这些东西最终会形成一整个的量化生态。我个人觉得,这也是我们下一代交易系统所必备的功能,也是一个雏形,所以这一块也是一个探索,大家可以访问这个网站quant.gm.com.cn,进去体验一下。

大数据监控


这个大家都玩的比较多了,券商必须有一个监控大屏,但是大数据监控和一般的监控大屏有什么区别呢?最大的区别其实就一点,我们是用流计算技术去解决的,传统的监控大屏是专门开发一套case by case的监控系统。我们现在的流计算技术,把实时的业务数据流处理过来,这样能够解决海量的数据,比如交易明细、日志都能拿来分析,这是传统监控大屏系统解决不了的,因为我们的数据量极其庞大,一天下来就有几千万的交易明细的列表,如果用传统的技术去解决,几乎是计算不过来的。这是我们用流计算的技术去做大数据监控。


智能投顾


可能是大家听的最多的,这个截图还是用的比较早的版本,现在的版本比这个界面美观很多。这个是贝塔牛,在券商行业也是比较有名的系统。贝塔牛的后端服务给大家看一下,这一块用到了我们广发大数据平台。


我们自己基于Eagle发了很多微服务,所以贝塔牛的后端技术还是蛮先进的,把所有的服务全部都微服务化,然后在后面直接对接大数据平台,微服务做了哪些东西呢?做应用服务接入、session服务、注册、安全验证、投资组合管理、股票组合管理、资产配置、任务监控、一键跟单和统计分析,这一块相当于用微服务解决整个业务系统的问题,数据的计算以这个用户该给他做哪些股票,应该选哪些股,应该怎么生成策略,它的资金投资组合应该怎么办,这些都是大数据计算出来的。


大数据应用——产品&资讯推荐


大数据应用还有一个产品和资讯的推荐,这一块比如我们建投资组合推荐的时候,是根据用户的偏好和行为,推荐的一个他可能喜欢的股票和投资组合,当然他也可以不选择这个,只是系统会给他推一个出来。比如说我们发现这个人是风险型承受能力比较高的,喜欢做短线操作,不喜欢买一些蓝筹股,那系统就会自动算出来,这个人推荐中小盘成长策略。如果我们发现这个人是稳健型的,经常买大盘股、蓝筹股,我们就给他推荐一些相对稳健类的策略,这样我们就可以更提高用户的转化率,比让用户在一堆策略里面自己选择好很多,这就是推荐的好处。


第二个是资讯中心,比如他资讯看完了之后,可能对相关内容的资讯,下面会有几个相关资讯,还有用户可能感兴趣的资讯,做一个资讯推荐。再往下就是(易淘)的广告推荐,相当于是一个能变现的推荐,前面两个是提升用户体验的。第三个,比如说在首页、理财产品、基金产品的地方,我们会放一些广告的推荐。在互联网行业给用户推荐东西是非常理所当然的,没有协会的存在,没有规章制度的存在,没有条条框框的限制,互联网给大家做推荐是非常多的,到了证券基金有很多条条框框的限制,有合规的限制,有各种证券基金管理的限制,比如说我们现在又出了适当性管理办法,这些就对用户有了比较明确的要求,我们做推荐的时候,要在用户授权的情况下,才会给他做推荐,所以我们为了给到用户适当性管理的要求,我们做推荐就要给用户做一个选择,就是你愿意看的推荐和你不愿意看的推荐,给他一个开关和入口。


产品体验改进


再往下,我们可以做产品体验的改进,这个是我们用大数据的技术自己去分析我们的产品。比如我们埋几个点,埋到我们系统里面,我们可以改善整个系统的产品。举个例子,我们把估值由以前的每天算一次变成实时算一次,改进产品的体验。比如说页面布局,我们用AB test,有几套布局,我们让不同的用户看到不同的布局,看用户的喜好程度是怎么样,然后来改进我们自身的产品。


全面风险管理

全面风险管理用大数据和人工智能技术做风控,这也是业界说的最多的话题,我们有个专门的部门叫风险管理部,一块做的全面风险管理项目,把传统的风险那一套逻辑,用最新的大数据和人工智能技术替代掉,第一步先替代它,第二步再去改进它,为什么我们用大数据和人工智能去替代传统的风险管理呢?最主要是传统风险管理的技术层面,有几个不足,一个是数据全面性不足,数据内容不足,系统计算能力不足,实施性不强,就是传统的这些技术解决方案,它的计算能力在海量数据面前是没办法发挥应有的功效,它不支持海量数据。第二是传统的数据代价比较大,比较昂贵,如果我们实现的话,它的代价也是非常大的。用Hadoop之后,不但能解决大数据的问题,也能解决系统的造价问题,这个是风险最喜欢的两点。我们有了大数据技术以后,就有了数据抓取能力,有更强大的计算集群,更强大的数据存储,内层化的流数据计算,这样我们的全面风险管理能力大幅提升。


我们看一下风险管理这个图,底下一堆是我们从各个系统里抓的数据源,再往下是我们的大数据平台,跟贝塔牛一样,也是处于承上启下一个比较重要的阶段。


实时风险管理


这个我们目前正在做,我们还没有完全实现这个实时风险管理。我们现在的风险并没有想象那么实时,这个很简单,把我们的T+1的一线数据计算变成实时的T+0的实时的数据计算,这个通过卡夫卡组件,就可以把各种各样的数据拉过来,进行实时计算,做一些实时的分析,多层神经网络模型预警,最后产生报警,可以去交易。风险有事前事中和事后的风险,我们前面那一块事前和事后的风险,这个是事中的风险管理,我们可以拒绝他的交易,可以报警。


智能投研


智能投研,这也是讨论比较多的话题,我们要建一套语义图谱、知识图谱、机器学习图谱,然后智能投研会建一套智能投研的引擎,可以完成数据梳理、辅助智能投研报告以及数据支持。


内容如与现场演讲有出入,请以演讲现场为准。


点击或回复关键词,查看相关内容

公司

简介 | 星环科技成长大事记 

投资 | 星环科技获腾讯领投2.35亿C轮融资,与腾讯云达成战略合作


产品

产品 | 星环的划时代版本-Transwarp Data Hub 5.0

TDH社区版 | TDH社区版提供官方下载

评测 | 大数据产品最新测试基准看哪家(TPC-H or TPC-DS)?

流式计算 | 用Slipstream构建复杂事件处理应用

Holodesk | 业界最强的SQL引擎Inceptor为何这么快?

培训 | 学完这些课程,你也是大数据专家了!

认证考试 | 数据中心联盟—星环联合认证体系首次认证考试报名中


技术

技术 | 原创技术干货大合集!

技术支持 | 最完整的星环技术支持体系

评测 | 大数据产品最新测试基准看哪家(TPC-H or TPC-DS)?

TED视频 | TEDxLujiazui精彩视频:【大数据 大趋势】

白话大数据 | 白话大数据合集


案例

银行 | 河南农信:数据辅助决策,决策引领创新

证券 | 中泰证券:剑指大数据处理 多券商革新IT架构

智能金融 | 星环科技发布证券业大数据战略规划纲要(白皮书)

运营商 | 运营商的新方向-运用Hadoop技术将大数据资产变现

交通 | 大数据在智慧高速中的创新应用

物流 | 星环Hadoop发行版助快递业迎战“双十一”

邮政 | 中国邮政大数据平台建设

税务 | 大数据提升税务系统核心能力

审计 |让数据成为竞争力

视频监控 | Hadoop大数据在实时视频监控的应用场景

广电 | Hadoop企业级应用新添重磅案例

电力 | 华南某市供电局全景可视化大数据平台案例

能源 | 厉害了,我的营销大数据!

智能工厂 | 大数据技术助力中国石化智能工厂

农业 | 农业大数据的研究与实践

医药 | 医药产业链大数据前沿探讨


速记

【速记】河南农信 牛玲玲:数据辅助决策,决策引领创新

【速记】数起科技 李明国:让数据成为竞争力

【速记】天士力 刘晓煜:医药产业链大数据前沿探讨

【速记】国家农业信息化工程技术研究中心 陈天恩:农业大数据的研究与实践

【速记】同济大学教授 王伟:同济-星环“数据科学与大数据实践平台”建设


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存