查看原文
其他

沈百军:筑牢数据安全屏障,赋能银行零售战略转型

金融电子化 金融电子化 2022-11-29

大数据时代,为了顺应数字经济与数字社会的发展,银行业不断运用金融科技手段促进企业的数字化转型升级,数据已成为银行的核心资产和驱动发展的核心引擎。大数据技术和应用高速发展,伴随而来的是新金融风险:虚假数据泛滥、敏感信息泄露、非法篡改、欺诈、不正当利用等数据安全事件频发,在数据采集、存储、利用、开放的每一个环节稍有不当就可能造成数据泄露、个人隐私被侵犯。2020年10月,全国人大常委会审议《中华人民共和国个人信息保护法(草案)》,标志着数据和隐私保护进入立法时代。在此背景下,商业银行亟待建立一套完备的信息资产分类分级保护体系,完善敏感信息存储、使用及传输等高风险环节的管控机制,严格防止敏感数据泄露。


平安银行大数据平台存放银行所有的数据,是业务挖掘的核心资产,其中大部分数据已经过多层次开发,具有相当高的价值,这里面也包含了大量的客户敏感信息。为此,平安银行以保障数据安全、提升开发效率为目标,启动无感数据安全项目,致力于构建一套面向数据使用的安全治理平台,解决系统开发过程大数据使用效率与数据安全控制间的矛盾。


平安银行零售大数据平台技术总监  沈百军


总体设计方案

无感数据安全控制项目是平安银行数据安全治理的重要组成部分,主要针对开发、测试、业务人员使用银行大数据平台数据的行为,进行多维度、立体化的数据安全管控。


1.全流程的数据安全管控体系。项目从事前、事中、事后三个方面建立了全流程数据安全管控体系。事前制度建设:项目开发前修订了新的《平安银行数据安全管理办法(2.0版)》,做到规则在前、制度先行;事中技术管控:采用“统一认证服务”“数据加密”“数据脱敏”“敏感客群数据保护”“实时智能阻断”等技术手段构筑强固的数据安全保护伞;事后监控审计:基于规则引擎建立数据访问审计平台,采用自动+人工的方式识别异常访问。


2.多维度、立体化的技术管控方案。项目通过对底层数据脱敏类型的自动识别与标识,覆盖了大数据平台上所有敏感数据,同时提供多个接口可灵活决定数据脱敏类型;通过统一引擎对SQL语句进行解析,智能判断是否需要脱敏;最后通过自定义的UDF函数针对不同类型的数据进行脱敏。这一技术管控方案的特点可概括为:分层数据安全架构、全链路数据访问闭环、数据强控制。

图  项目技术管控方案


关键技术解决方案

1.全链路动态脱敏。数据脱敏最早提出是在用测试环境使用生产数据时,一般是通过正则匹配后发现脱敏字段,然后执行字符替换,这种方式误脱敏现象比较严重,对性能也有较大影响。而无感数据安全控制项目则通过存储环节的静态加密和数据访问的动态脱敏,巧妙借助了大数据分布式框架的计算能力完成脱敏,在原有静态脱敏思路的基础上提供了动态的数据安全保护策略。


在源数据集成阶段,大数据平台通过预设规则的智能检测+人工,对源数据表涉及的敏感字段(证件号、卡号、手机、姓名、地址、电子邮件号等12项)进行标识并存储。在数据处理加工阶段,依据大数据调度的依赖关系及数据处理加工的SQL,自动分析出每个表所引用源数据字段的关系,再依据源数据层敏感字段标识,确定大数据平台每个表敏感字段的范围。在数据访问阶段,平台根据用户提交的SQL语名,通过大数据统一查询引擎对SQL语句进行解析和重写,自动判断并进行脱敏处理,将脱敏后的数据返回给用户,整个过程在用户无感的情况下完成。


2.敏感客群数据查询保护。高敏感客群如企业高管、公众人物及其家属的信息泄露有可能造成较大的社会影响,为加强敏感客群信息保护,针对查询过程可能涉及的敏感数据进行行级数据保护。具体步骤为:(1)基于脱敏表及敏感字段,判断用户提交的SQL是否具有敏感信息。(2)根据访问所返回数据是否为聚合数据或明细数据判断是否需要阻断。(3)结合敏感客群信息表,通过智能引擎完成涉及敏感客群数据的阻断,切断针对高敏感客群数据记录的查询。


3.监控审计项目。打通元数据管理平台与权限管理平台、监控平台、规则决策平台之间链接,使权限管理审批、数据访问审计等过程透明化、可视化。安全审计人员通过决策引擎平台可以配置需要监控的有关规则,从而对用户的访问行为基于规则进行实时的分析预警,自动发出预警邮件。平台界面、菜单操作便利,为安全审计人员提供了强大、实时的数据监控平台。至此,平安银行无感数据安全闭环管控体系基本建成。


项目应用成效

无感数据安全控制项目构建了完整的数据安全防护体系,对银行原有以网络为中心的安全体系进行扩充完善,弥补了传统防护技术短板。目前该平台已经在行内普及使用,实现了组织内部数据全生命周期可视、可控、可管,保障了数据的机密性和完整性,促进业务安全运行和新业务的安全开展。一是节约人力成本。项目上线之前,平安银行大数据平台主要依赖人工进行数据脱敏/加密,需要投入所有数据开发人员进行人工操作,至少100+人力配合进行敏感数据识别和安全治理工作。通过平台的自动化脱敏和加密,解放了开发人员的人工操作。当前,平台已自动识别和标注敏感信息字段总计40万+,安全层面降低了人为标注的风险,效率层面每张数据表可以分钟级别自动实现安全脱敏。二是提升用户体验。开发是一个连续的过程,需要不停的分析数据。实际中,大部分情况下开发人员均为“盲”开发,即只看表结构开发,然后试运行验证数据。银行为保障敏感数据安全,项目测试申请数据必须经过审批,数据必须经过严格脱敏才能转移到测试环境,开发人员进行数据查询必须进入操作室,流程复杂、体验很差。无感数据安全控制项目通过统一引擎对前端发送的SQL进行智能判断,根据安全要求进行SQL重写,修改后的SQL仍按原路径执行,保持其原有逻辑,完全不影响开发人员的正常使用,真正做到了无感的效果,让开发人员可以在办公网络环境下对数据进行即时分析与查询,不需要申请进入操作间操作,提高了用户操作体验,加速开发进度。三是有效防止数据外泄。无感数据控制项目对高敏感数据字段和普通敏感字段分别进行加密控制和脱敏控制,对数据字段操作过程,通过智能阻断功能将SQL语句中包含特定字段的过滤查询提前阻断,有效防止了开发人员误操作导致的敏感数据泄露。这种提前阻断的方式比数据泄漏后追责更加有实际效用,把敏感数据外泄的可能性降到最低,确保数据安全。


结束语

平安银行无感数据安全控制项目基于大数据时代对于金融数据安全的迫切要求,建立了多层次、多维度的数据安全保障能力,在大数据平台汇聚全域数据、实现数据融合贯通、释放了数据资产有效信息的过程中,主动发现并隔离异常操作风险,减少数据安全事件的发生,并尽可能提升业务开发测试的效率,有效平衡数据安全风险与系统开发大数据利用间的矛盾,为银行数据安全管控提供了新思路、新平台。未来,无感数据安全控制项目将打造从宏观到微观的多层次数据安全控制平台,通过持续迭代,提供更加强大的功能,更加丰富的API,进一步扩大应用领域和范围,为银行乃至整个金融业提供系统、安全、可用、可靠的数据安全控制解决方案。


(栏目编辑:韩维蜜)













推荐阅读

(点击图片查看精彩内容)



精彩内容回顾

(点击查看精彩内容)


■ 实战 | 中小城商行数据安全建设实践

■ 观点 | 视频监控人脸识别技术可能存在的法律风险及对策

■ 知书 | 小而美——一家小银行的逆势破局之道

■ 观点 | 区块链 :搭建金融数字化转型的可信桥梁

■ 匠心筑梦 | 众志成城闯难关,自立自强创新路——农行研发中心荣获首届“Call for Code”国际代码大赛全球前五




《金融电子化》新媒体部:主任 / 邝源  编辑 / 傅甜甜 潘婧

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存