查看原文
其他

案例 | 智能一体,防微杜渐,着眼未来——光大银行数据库平台云创新实践

金融电子化 金融电子化 2023-01-22

文 / 中国光大银行信息科技部    于树文  金凤华 李萧萧

近年来,随着金融业务互联网化的快速发展,以及数据库技术向“云原生+分布式”的加速演进,金融业务系统所使用的数据库种类与数量呈指数级增长,对数据库的部署交付提出了更高的要求;同时,随着金融业数字化的持续推进,光大银行在信息科技部“123+N”数字化银行发展体系指导下,建设了以全栈云为核心能力的基础设施平台,打造赋能创新、开放融合的云服务体系,孵化出光大银行数据库平台云,结合大数据分析技术和深度机器学习等算法,以统一和精细化管理代替了传统的手工分散模式,降低了数据库管理与运维成本,提升数据库系统的运维效率,提高了信息系统的建设效率和运行稳定性。


建设背景

1.数据库应用的种类与数量急剧增长

业务发展与技术创新需要底层基础设施的强有力支撑,数据库作为基础设施的核心,支撑了企业对数据存储和处理的各种需求。目前光大银行生产环境运行数据库套数不断增多,种类也从传统的商业数据库逐渐转型为开源数据库、自研数据库等。数据库运行环境和架构日益复杂,对数据库运维人员的规模需求和能力要求均在不断提高。


2.数据库管理体系亟需完成标准化、一体化、智能化转型

面对众多种类的数据库产品,在安装部署、监控告警、问题处置、性能分析等运维场景中,由于产品自身及标准规范的差异,造成维护管理的复杂度较高;同时已建设的多种运维工具或平台之间也存在界面不统一、功能不对齐等问题,运维成本随使用规模的扩大日益增加。


3.复杂业务场景问题的快速定位和数据可视化的重要性日益凸显

随着光大银行全栈云的投入使用,网络架构日趋复杂,对数据库的系统性能、稳定性、安全性、服务连续性要求持续增加,因此在故障场景下的精准定位和分析判断能力变得尤为重要。同时,应用版本迭代加快,在投产变更或上线之前缺乏对SQL语句的快捷审核手段,使业务系统运行过程中存在一些由于SQL写法不规范产生的性能或安全隐患。而这些隐患通常是在出现业务连续性或稳定性问题后才会暴露,且无法以较为直观的方式使运维人员快速了解数据库运行情况等信息。


平台实践

光大银行于2018年启动数据库平台云项目建设,目前已完成试点落地和赋能推广,正在进行规模化应用阶段。该平台是对数据库全生命周期进行全方位管理的系统,平台充分发挥了数据库管理产品的技术特性,为光大银行提供了开发、测试和生产环境的平台化数据库服务,提高技术能力、优化运维资源,进一步提升了光大银行的信息系统建设效率和运行稳定性。


1.整体部署架构

结合光大银行的实际情况与建设需求,数据库平台云采用的逻辑架构支持跨机房或网络分区部署,在纳管节点不断增加的情况下,平台自身也具备较强的横向扩展能力。平台功能上则通过分层化及模块化设计,支持分布式监控数据存储及高可用部署,自上而下分层共治的同时,可确保无单点故障的情况出现。

图1    部署架构模型


2.完善的数据库问题管理体系

数据库平台云以监控功能和管理功能为核心,实现了传统商业数据库、国产数据库及新型开源数据库等多种类数据库的实时性能监控及分析管理等功能。平台通过多种监控方式,采集运行环境数据,为系统的智能分析提供数据支撑,可发现和跟踪各种数据库问题及告警情况,对数据库全生命周期实现自动化和智能化的数据库管理机制。


基于运维管理自动化等模块,采用Vue、Echarts、AntV、Axios、Ansible等多项技术,实现数据库管理可视化,使数据库运维操作自动化执行、复杂操作流程化编排,通过对数据库操作进行可视化改造,将专业的数据库操作命令转变为可视化运行流程,提升运维操作跟踪审计和执行能力。通过提供可视化数据分析、运行状态等多维度图表展现功能,支持投放大屏幕,通过大屏可实时展示运行趋势图、指标图和性能评分结果等,有助于数据库管理员全面掌握数据库运行状况,提高数据库管理员的管控能力和管理效率。

图2    应用功能模型


3.平台可扩展设计及配置

在金融行业数字化转型的时代背景下,银行运维工作需求日益复杂多变,为了应对这一情况,并实现对现有数据库及未来更多种类数据库的全生命周期的标准化、自动化和智能化的运维管理,进行服务化的输出,进一步提高数据库管理效率、安全性、性能和故障的预防,数据库平台云项目基于微服务架构建设了一套自主可控的数据库统一云管平台,可面向我行包括DBA、应用运维、开发测试人员等所有用户,无缝集成我行包括工单系统、配置管理等系统,功能和性能均可有效扩展。通过平台对所有用户提供标准化、自动化和自助化的数据库运维服务,提升所有用户数据库运维能力,将数据库管理人员技能以服务化的形式输出给开发、测试及应用运维人员,增强运维时效性。依靠平台的高扩展性,以解决需求的动态变化,并解决数据传输、数据血缘、异地备份等问题。


项目成效

随着本项目的逐步落地与推广,实现了我行数据库管理运维统一、自动、自助、智能的管理模式,通过上线前自动审核,上线后动态巡检,故障时快速定位,处置操作可标准化等平台能力,大大降低了运维难度,提高了运维效率的同时也降低了人工成本,为未来数据库转型发展与运维管理夯实了基础。


1.统一自动化管理能力

通过数据库标准化架构快速交付功能模块,可实现不同种类数据库常用架构的自动安装部署,大幅减少了重复、繁重的工作内容,提升了交付过程标准化、自动化能力及交付效率,减少了架构不统一、运维难度大的问题。管理入口的统一及管理功能的集成,减少了平台建设项目成本,节约了人力投入并有效增强了安全运维能力,全面提高数据库生命周期管理的工作效率。


2.完善的监控和告警能力

数据库平台云具有数据库监控、问题告警、性能容量管理等功能模块,可以迅速对发生的问题进行分类展示,并通过其他方式发送给运维人员,以做到及时通知、及时处理。通过已采集的运行数据,平台可提供数据库总体性能评分,并形成全面准确的数据库系统性能量化评分报告,实现大规模数据库系统性能趋势管理,为管理人员提供高效可靠的数据库性能瓶颈分析依据。


3.智能管理运维能力

在数据库日常管理维护过程中,人工操作稍有不慎就会产生预期外的影响,通过数据库平台云,完全由页面化和内嵌标准化操作的方式进行分析与操作,可最大化减少命令输入,从而预防误操作和不当操作的风险。同时利用平台内置知识库、审核规则、影响规则及学习算法,可实现对待上线SQL的在线审核,避免可能存在的安全隐患和性能问题。


4.清晰的数据可视化能力

平台可对数据库运行情况及各类运行指标以图表的形式实时展示,内置报表及自定义报表也可对健康检查项、容量趋势等数据进行回溯分析。数据展示及数据采集模块也具备灵活的扩展性,可对已有的工具脚本进行整合集成加工,最终使运维管理的过程变得更为直观,大大降低了管理运维难度。


未来展望

伴随着银行业数字化转型,光大银行在“123+N”数字银行发展体系下不断深化建设。金融科技领域在引入云原生、分布式、智能化等创新技术后,对数据库运维管理的要求越来越高,数据库平台云的建设落地,提升了光大银行的运维效率及能力,优化了数据库服务的交付速度,并降低了运维管理成本。数据库平台云为全行的业务发展提供了敏捷化、高可用、高性能的数据库服务,保障了业务的稳定性、连续性发展,为光大银行在数据库技术转型工作中保驾护航。 





往期精选:

(点击查看精彩内容)


● 案例 | “玄武”大数据平台,助力公司数字化转型——银联商务基于云平台的湖仓一体建设

● 案例丨海通证券湖仓一体架构的探索及实践

● 案例|量化巨灾风险管理,提升金融保险韧性——记中国台风巨灾模型项目

● 案例丨筑基金融活水“宽”通道,建设银行打造首个端到端IPv6+智能云广域网

● 案例 | 金控集团量子计算探索与实践











新媒体中心:主任 / 邝源  编辑 / 傅甜甜  张珺  邰思琪

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存