干货分享 | 金融业务应急切换管理解决方案
伴随各行业数字化转型的不断深化,业务系统的持续稳定运行已成为信息化建设的最基础诉求。作为业务连续性基础保障的灾备建设,也成为各行业最基础的运行安全设施。
以金融行业为例,金融系统和数据具有全行业高标准的业务连续性和监管安全要求,其具有信息化程度高和信息安全需求高两大特征。以最为严格的银行容灾架构为例,大部分均完成本地容灾或本地+异地容灾建设,确保银行的数据不丢,业务不停。
但金融机构业务系统复杂多样,各系统、各数据库采用的容灾技术各不相同;同时各金融机构受银保监会、央行等强监管。整体来看,目前金融信息中心在灾备管理及运营方呈以下现状:
数据中心灾备实现方式“散、杂、多、乱”;
银保监会、央行等监管机构对责任单位的应急预案有突击检查机制;
银监会有明确要求:商业银行应当至少每三年对全部重要业务开展一次业务连续性计划演练;
不敢“切”,系统故障时的容灾切换不能确保业务的连续可用;
日常演练和应急切换需提交标准报告满足合规审计和归档要求;
容灾切换责任大,风险高,需求急,缺乏安全授权机制;
面临各类监管和测评考核要求,缺乏日常容灾运营机制。
基于以上现状分析,为提升金融机构应急处置效率,保障灾难场景下的容灾顺利切换和业务的连续,对于应急切换管理系统建设应基于以下原则:
01资产统一管控
实现数据中心核心容灾资产的统一集中纳管和监控,并实时展示资产运行状态以及RPO等信息,并对异常资产提供主动预警机制。
02一键式容灾演练和灾难切换
平战结合,满足计划内的演练场景和灾难时的切换场景下,对容灾资产的灵活编排和一键切换:1)面对监管部门发起的突击式容灾演练任务,和计划内的演练任务,支持一键容灾演练切换,确保在数据不丢失情况下的演练切换和一键回切;2)面对数据中心灾难场景,支持一键业务级容灾切换,确保核心业务连续运行,保障RTO。
03报告自动输出
对演练和切换场景提供过程自动截图留存、切换报告自动输出,报告内容满足合规要求。
04安全授权机制
满足面对内外网完全隔离情况下,业务管理员不在现场的切换任务顺利进行;满足先获取领导或管理员授权,再进行切换的需求。
05可视化灾备运营
对建设完成的容灾系统,提供日常运营服务,如搭建切换指挥和状态监控大屏,实时显示灾备状态、应急切换过程和切换时长,给灾难发生时的决策指挥提供有力支撑;提供便捷可视化及可持续更新的组织容灾预案管理能力;提供常态化桌面演练和一键自动切换能力。
助力金融应急切换管理系统建设
面对金融行业的灾备建设呈现出多样性、复杂性、规模化等特征,以及相关监管要求和容灾管控现状。美创基于已有的灾备集中管控平台DRCC进行优化,持续匹配金融行业的应急切换管理需求。
DRCC是一款以业务连续性为目标,以业务系统为视角单元的灾备集中管控平台,具备灾备集中管理、故障自动预警,以及应用级一键式切换等业务连续性保障功能,可有效提升银行等金融机构重要业务系统灾备运维自动化水平及应急响应能力,保障辖内业务系统持续稳定运行。
DRCC灾备集中管控平台为应急切换管理系统建设提供云-端架构的解决方案:支持以DRCC为中心平台,容灾技术&容灾设备为端,实现容灾资产管理、调用和切换,真正做到容灾管控平台化、一体化、智能化。
云-端灾备管控
DRCC以业务连续性时间(RTO)为目标,针对不同类型的灾备接入端实现集中管控,并提供切换预案、切换编排、桌面演练、容灾演练、灾难切换等功能,实现容灾切换流程标准化、自动化和可视化,缩短容灾切换时间,保证容灾切换成功率。
为满足合规需求以及真实用户场景需求,美创DRCC平台提供从资产接入到容灾运营的最佳实践路径。
容灾实践路径
容灾技术自动发现
场景化预案输出
可视化自由编排
用户根据每个业务流以及实际切换需求进行可视化自由编排。通过切换编排功能,彻底改变了传统容灾产品及方案的运行方式,以所见即所得的模式让流程的配置更为自由高效。
可视化编排,灵活设计容灾切换预案。兼顾并行和串行,支持可视化拖拽,可根据用户业务场景,自由编排。以业务RTO为目标,持续优化切换流程。切换流程标准化,简单化,为一键切换操作提供基础。
三种演练切换机制
平台目前提供三种切换演练场景:桌面演练、容灾演练以及灾难切换:
常态化高频次的桌面演练,在不影响生产端的前提下,提供了数据库级和业务级灾备端可用性的验证机制;
计划内或满足上级监管部门考核的容灾演练能力,在保证数据零丢失前提下,验证灾备可用性,通过模拟容灾切换实战的演练过程。
灾难场景下的一键容灾切换,创新性的解决传统容灾产品切换过程不完善、切换复杂、流程耗时、易出错、切换不成功等问题。整个容灾切换流程自启动后全程自动化完成,大大减少了误操作风险,保障了切换成功率,降低了RTO。
切换大屏
平台提供一键切换能力的同时,支持切换过程的可视化展示,提供切换监控大屏和切换指挥大屏,支持多人、全局、动态的切换过程视图,可以让领导直观感知并参与和指挥切换过程,同时为应急场景提供决策依据。
安全授权机制
基于OTP技术,平台为现场值班人员、切换负责人员提供切换操作安全授权能力,确保安全性的同时,保障切换任务顺利进行。
自动化报告输出
灾备管理工作一方面有内容归档诉求,要便于审计追溯,另一方面有内容标准化要求,便于规范化管理。面对日常的桌面演练以及容灾演练、容灾切换过程,自动化的输出报告,同时支持报告的自定义,便于归档和审计。
一)实现应急切换管理系统建设:提升重要业务系统运维自动化水平及应急响应能力,保障辖内业务系统安全稳定运行,维持各业务系统长期安全稳定运行,避免系统因故障产生服务中断、业务数据丢失而产生的各类损失。实现灾备管理、故障预警及应用系统一键式自动应急切换等业务连续性保障功能,并且最大程度满足了RTO和RPO的要求。
二)提高运维效率:无需登录多个容灾平台和资源挨个进行状态查看和配置,满足所有容灾的统一管理和监控。
三)降低技术人员能力要求:预先排好切换手册,对切换流程进行标准化、规范化和可视化;切换流程标准化、规范化、可视化,降低切换操作人员的技术能力要求。
四)保障业务连续性:灾难发生时,通过战前切换演练,以业务RTO为目标,持续优化切换流程,缩短切换时间,确保灾备快速、成功切换。
五)灾备管控可视化:通过大屏可视化,直观展示散杂多乱的灾备运行状态。形象展示切换状态,进程统计,包括切换完成百分比、切换资源数量、耗时,实时感知切换过程、助力决策指挥。
六)输出报告且满足监管需求:由于灾难切换任务重大,涉及部门众多,需要事后追溯。DRCC支持自动输出演练报告,灾难切换报告,便于审计和归档,同时满足相关监管合规要求。
请输入标题
请输入标题