金科委研究课题 | 数据治理在证券期货行业的发展与实践研究
*文章来源于深圳资本市场金融科技委员会研究课题
引言
近年来随着数据作为生产要素理念的提出,数字信息技术革命日新月异,数据价值愈加凸显,数据治理已经成为了各类企业数字化转型的必经之路。数据治理的理论最早在国外兴起,原术语为“Data Governance”,在国际数据管理协会(DAMA‚The Data Management Association)提出的数据管理框架中,指出数据治理应作为企业数据管理的核心,统筹和指导企业数据管理的工作。
金融业作为典型的数据敏感度高、数据应用场景复杂、数据规模和价值巨大的行业,数据治理的发展十分迅速,其中银行业起步最早,证券期货经营机构也紧随其后,行业内正如火如荼地开展数据治理工作。金融业数据治理的发展与业务经营的发展、风险管控的需要以及监管指引的要求密切相关,国家和行业监管机构也先后发布了多项法律法规,给金融机构数据经营合规、以及进一步的数据资产化治理与发展提出了新的挑战。
一、行业数据治理发展现状和问题
(一)起步
证券期货业第一次明确以法规的方式明确数据治理的重要性,是在2018年12月21日发布、2019年6月1日生效的《证券基金经营机构信息技术管理办法》(证监会令第【152】号)。但是,在该法规发布之前,行业即开展了数据治理的相关探索,例如,2016年12月30日中国证券业协会发布的《证券基金公司全面风险管理规范》,明确提出证券基金公司应当建立健全数据治理和质量控制机制等数据治理相关要求,这是首次在行业内提出数据治理;以及2018年9月发布的《证券期货业数据分类分级指引》(证监会公告〔2018〕28号)。因此,我们可以看到,监管机构非常重视数据治理的探索、验证、总结、实践、以及规则发布。随着监管机构对大数据监管的日益重视,以及企业内部数字化、智能化的发展要求,证券期货经营机构纷纷加大了数据治理工作的资源投入。
(二)发展现状
当前证券期货业内多数经营机构都在不同层次、以不同方式尝试推进数据治理工作,个别头部公司在数据标准、元数据、数据生命周期管理方面处于行业领先地位,但大部分证券期货业经营机构在组织保障、实施路径、技术路线等方面存在较大差异,普遍处于尝试阶段,与国内银行业相比,尚有不小差距。
(三)问题和挑战
1.数据领域面临的问题
对于大多数的证券期货业经营机构来说,数据方面存在如下典型问题:
数据孤岛化:数据存储分散在不同系统之中,整合不足,形成大量数据孤岛,数据无法在企业层面共享,造成数据冗余和重复加工。
数据标准不一致:各部门依据各自系统及自身业务场景进行数据指标的设计,数据统计口径不一致,部门之间的数据经常打架,导致数据可信度降低。
数据出口不统一:对于基础数据和统计指标数据,普遍存在多个数据出口。
数据不准确、不完整:基础数据偶尔录入或维护错误,导致数据不准确、不完整。
数据线下维护:当前依然存在大量的数据依靠线下手工维护,导致这些数据无法及时更新,可靠性低。
2.数据治理落地的挑战
数据治理工作能否良性运转,与组织管理、企业文化、技术支撑等因素有很大的关系,基于实践经验,现阶段数据治理工作普遍存在以下挑战:
缺乏足够的支持:公司管理层无法确定数据治理的实际效果,尤其是短期效果,一般情况下投入资源较有限。
价值难以衡量:数据治理本身是一个较为抽象的概念,涉及战略、组织、系统建设等各个环节,很多部门认为数据治理对绩效的有利影响不足,从而导致数据治理政策难以落地。
数据治理周期长、难度大:数据治理属于投入周期长、规模大、见效慢的系统工作。
部门之间的配合问题:生产数据、使用数据的工作人员分布在不同的职能线与部门,角色不同,立场也不同,这些因素会影响数据治理的最终结果。
缺乏数据治理文化:大部分业务部门认为数据治理仅仅是为了满足监管报送的要求,或者是牵头部门的工作,“与己无关”。
二、数据治理的建设目标和框架
目前国际上最为广泛的数据管理框架,是国际数据管理协会(DAMA)的车轮图,其将数据管理分为了十一项领域,其中数据治理位于车轮中心,起到监督管控的职责。
资料来源:《数据管理知识体系指南2.0》
图1:DAMA数据管理车轮图
在国内,较为权威的数据管理模型则是全国信息技术标准化技术委员于2018年发布的《数据管理能力成熟度评价模型》(DCMM)。根据DCMM模型,数据管理被分为了8大领域,着重强调其在组织、制度和沟通机制方面的工作。
资料来源:《数据管理能力成熟度评价模型》(DCMM)
图2:DCMM数据管理模型
基于数据管理框架与证券期货经营机构的行业特点,数据治理的目标可以归结为以下三点:
(1)运营合规,建立符合法律法规和行业监管的数据运营管理体系;
(2)风险可控,建立数据风险管控机制,确保数据及其应用满足风险偏好和风险容忍度;
(3)价值实现,构建数据价值实现体系,促进数据资产化和价值实现。
为了达到以上目标和愿景,证券基金期货机构可以在以下五个方面开展数据治理工作:
(1)数据治理体系架构。建立数据治理组织、制定和发布数据治理制度规范、落实数据治理流程管控机制、开展数据治理考核评价,上线数据治理平台工具;
(2)数据标准管理。梳理各个业务域的数据标准,统一数据标准的来源、定义和口径,避免数出多门、数据同名不同义、数据同义不同名等情况;
(3)数据质量管理。建立数据问题跟踪和整改机制,丰富关键系统、客户信息和报表的数据质量监控;
(4)元数据管理。对公司内部数据/外部数据、结构化数据/非结构化数据进行采集和版本管理,管理数据间的血缘关系和数据链路,构建公司数据地图;
(5)数据安全管理。完善有效可落地的数据安全是数据管理和应用的底线。需要通过数据的分类分级、个人客户信息等敏感数据的识别、数据加密、数据脱敏、数据水印、权限管理等流程和工具,在公司内形成一个比较全面的数据安全管理体系。
三、数据治理的实践探索
(一)体系架构实现方案
结合证券期货业的数据治理需求,参考国内外最佳实践,分别从组织架构、制度规范、流程管理、考核评价和支撑平台五个方面逐步建立组织架构健全、职责边界清晰的数据治理体系架构。1.组织架构
有效的组织架构是项目成功的基石。结合实践经验,企业数据治理组织体系可以大致划分为决策层、管理层和执行层三个层面。企业也需结合自身的发展战略和目标确定建立适合的数据治理组织,下图以南方基金为例说明了三层组织架构的模式。
图3:南方基金数据治理组织架构图
决策层:定义企业数据管理战略和目标,指明数据治理方向和蓝图,批准实施数据治理制度及流程,对数据治理过程的重大事项进行审核和决策。
管理层:定义企业数据标准、质量规则。制定数据管理流程和相关制度,对数据治理过程进行监控和管理,使其符合数据标准、管理制度和流程规范的要求。
执行层:根据企业的数据标准、管理流程和制度要求,执行数据标准,实施数据治理,提升数据质量,挖掘数据价值。
2.制度规范
数据治理制度,包括元数据管理、数据模型、数据标准、数据质量、数据生命周期管理、数据应用等领域的管理办法,其主要目的是明确各数据领域的主要工作内容与要求,明确各部门、机构在各个数据治理领域工作中的职责分工,为开展数据治理领域的管理工作提供参考依据。下图以国信证券为例说明了数据治理相关制度的组成形式。
图4:国信证券数据治理制度体系
3.流程管理
流程管理包括流程目标、流程任务、流程分级,根据数据治理的内容,建立相应流程,并遵循本单位数据治理的规则制度。实际操作中可结合所使用的数据治理工具,建立符合公司的流程管理。下图以南方基金的数据质量管理流程为例,说明了数据治理的流程设计和落地方案。
图5:南方基金数据质量管理流程
4.考核评价
考核是保障数据治理制度落实的必要措施,考核需要同时面向数据的业务归口管理部门和技术归口管理部门。实际操作中可根据公司内部情况,建立相应的针对数据治理方面的考核办法,并与部门或个人绩效相关联。
5.支撑平台
在数据治理实施过程中,需构建符合自身需求的数据治理平台,全面梳理数据资产,建立全局数据地图。例如,通过元数据管理,实现上游血缘分析和下游影响分析;通过数据质量模块,实现全链路数据监测与质量跟踪,对全生命周期数据进行全方位稽核,确保数据质量。下图以国信证券的数据治理平台为例,通常包含如下功能模块。
图6:国信证券数据治理平台功能架构图
(二)数据标准实践方案
数据标准是数据业务、技术和管理属性的集合,良好的数据标准管理体系是打破数据孤岛、统一数据口径、提升数据可用性的基础。
图7:数据标准定义框架
在数据标准应用方面,传统的数据标准在定义之后,往往存在缺乏使用和推广场景的痛点,对业务无感知。部分证券公司例如国信证券,则将数据标准与业务应用结合,实践了数据标准融合落地的方案。
图 8:数据标准、数据应用融合架构设计
在此架构下,数据治理、数据中台、数据应用三大平台将标准和数据融合,通过经营分析系统、报表系统等业务应用直接面向业务部门和分支机构用户进行展示,提升数据标准的场景化应用价值。
(三)数据质量实践方案
数据质量的提升是体现数据治理成果最直接的方式,数据质量差会增加经营决策、日常展业、运营合规的经济和沟通成本,直接或间接地造成经济损失。数据质量管理不是一个项目,而是一项需要业务、技术、和管理多方参与的持续性、体系化的工作。
数据质量问题主要集中在公司的经营管理、业务流程和技术实现三个方面:
1.经营管理。例如,缺乏有效的数据管理制度、流程,以及数据认责。
2.业务流程。例如,业务需求不清晰,数据录入不规范。
3.技术实现。例如,系统实现存在漏洞,数据开发不规范,数据传输不及时。
典型的数据质量提升框架有PDCA戴明环和六西格玛DMAIC模型。招商基金数据质量管理通常包含数据问题的跟进、数据质量的监控、数据质量报告。以DMAIC方法为例,在此框架下,按照定义、度量、分析、提升、控制这五个阶段来进行数据质量管理工作,每个阶段需要不同的角色和人员来参与工作。以招商基金为例,数据质量管理模块通常包含下图所示内容。
图9:招商基金数据质量管理框架
(四)元数据实践方案
元数据是对数据本身的说明,它描述了数据的含义、分布、流向,是公司数据治理和数据资产化的基础。元数据的管理应遵循“统一管理、全面贯通”的原则,有利于保障跨部门、跨系统元数据的一致性,促进公司内部的数据资产化管理。
缺乏有效的元数据管理,就无从得知公司内部数据种类、分布位置及其归口管理部门,也无法完整地构建公司数据地图和数据资产目录,使数据标准、数据模型等各项数据工作难以落地。
基于对元数据采集、整合、存储、分析和应用等生命周期的管理,元数据的管理框架如下:
图10:元数据管理框架
通过框架图可以看出,元数据的常见应用在如下几个方面:
1.数据血缘关系:通过向上追溯数据的来源,帮助快速定位和分析数据问题;
2.影响分析:与血缘关系相反,通过向下游追踪数据的去向,及时分析和评估数据变更造成的影响;
3.数据地图:基于元数据的采集、分布和血缘关系,构建企业数据资产的全景地图;
4.数据冷热度分析:评估数据的使用频率和价值。
以影响分析为例,为了在事前保证公司各个系统间数据的一致性,避免产生问题,国信证券实施了预发布库影响分析的自动通知。
图11:国信证券预发布库影响分析通知流程
(五)数据安全实践方案
数据安全是数据应用的底线,需要通过长效可落地的数据安全策略和流程,在经营管理、业务开展和技术实现多个方面共同构建起公司的数据安全治理体系。
图12:数据安全治理框架
基于各级政府、行业组织发布的《数据安全法》、《深圳经济特区数据条例》等各种相关法律法规,为保证数据安全治理工作能够长期持续的得以执行,经营机构的首要任务是成立专门的数据安全治理团队。数据安全治理团队要覆盖到安全、业务、运维等多个部门,要明确数据安全治理相关的角色和职能,能够协调多方参与到数据安全治理工作中。
数据安全治理的策略和流程,要以制度文件的形式明确企业内部的敏感数据类别,并对敏感数据进行分类和分级,对不同类别和级别的敏感数据落实不同的管理控制策略和流程。
数据安全治理的技术支撑,旨在明确在数据安全治理的过程中,要采用何种技术工具帮助完成数据安全治理工作,包括数据梳理、数据访问控制、数据加密、数据脱敏、数据水印、数据隔离、数据防注入、数据审计、数据访问的风险分析等。
总结与展望
大数据时代,数据治理是基础性工作,任重而道远,其价值需要持续探索和深化。证券期货经营机构应当抓住转型的契机,利用安全可靠的高质量数据驱动业务高质量发展,发挥数据价值,促进数字经济可持续发展。
展望未来,随着数据要素、数据交易、数据空间等理念的发展,以及AI、联邦学习、数字孪生、神经网络、边缘计算、DataOps等技术的成熟和推广,资产化、智能化、安全化、服务化将成为数据治理发展的方向。
资产化,意味着数据要素需要确权、标准化和定价,只有主权明确、完整规范、安全合规、风险可控的数据要素才能成为可管理、有价值的数据资产,甚至成为资产负债表的一部分。
智能化,是金融企业数据治理的必经之路,金融行业数据规模巨大、敏感数据集中、数据使用和交换场景复杂,日常数据量可以达到千万级,需要借助智能化、可视化的方法和技术来实现数据治理的常态化。
安全化,近年来数据安全事件屡屡发生,一旦发生数据安全事件,后果不堪设想。尤其是金融行业,数据安全事故就是高压线。数据安全事件的发生使证券期货经营机构承担经济上的损失,以及监管的相关处罚。因此做好行业和公司的数据安全治理迫在眉睫。
服务化,通过与业务场景、用户痛点、应用的融合,从管控走向服务是数据治理保持长效和活力的秘诀。管控只是数据治理的手段,服务和价值创造才是最终目标。数据治理的服务化有不同的切入点——业务、用户和平台,例如嵌入数据录入、监管报送等业务场景,以解决用户经营分析、绩效考核等用户痛点,从而保障和加速数据价值的兑现。
课题组信息
牵头单位:国信证券
课题研究专家组成员:
国信证券 | 李明军 |
国信证券 | 何志强 |
国信证券 | 左银康 |
国信证券 | 肖雪 |
南方基金 | 屈磊 |
南方基金 | 尚涛 |
艾芒科技 | 殷昊南 |
前海开源基金 | 陈广宇 |
摩根士丹利华鑫基金 | 周涵 |
中山证券 | 高丽峰 |
中山证券 | 叶标松 |
景顺长城基金 | 陈少怀 |
世纪证券 | 刘育兵 |
招商基金 | 刘志坤 |
招商基金 | 李军权 |
中信期货 | 缪巍巍 |
平安期货 | 周达 |
金证股份 | 胡纯超 |
金证股份 | 颜滕 |
注:排名不分先后。