银行行业基于华为 OceanStor 18000F V5 高端存储的两地三中心容灾解决方案设计
【作者】徐东升,七年的系统集成及IT服务、数据库运维经验,精通主流硬件厂商的硬件设备包括(IBM Power小型机),华为、IBM、EMC以及HDS厂商的存储设备,精通存储区域网络(SAN)的配置和调优。精通IBM PowerVM虚拟化和VMware vSphere虚拟化以及VSAN等技术。参与过多个客户(包括银行)的容灾建设,包括容灾方案制定、容灾建设实施等;集成实施、维护等方面经验丰富,熟悉传统IT基础架构、虚拟化架构、云架构。
1.项目背景
1.1项目概述
随着银行信息化程度的不断提高,信息系统在金融行业的关键业务中扮演着越来越重要的角色,企业对IT系统的依赖程度越来越高,信息系统业务中断会导致巨大经济损失、影响品牌形象并可能导致重要数据丢失。因此,保证业务连续性是信息系统建设的关键。业务系统的连续性和灾难保护的重要性也越来越突出。
在某银行目前的业务系统中,新建北京、上海两地三中心架构。本次项目将在原北京、上海数据中心部署3台高端闪存以满足在北京生产中心、同城灾备中心及上海数据中心老旧应用项目的生产替换改造、灾备需求。
1.2 建设要求
合规性要求
银行核心存储项目,属于国内大型商业银行的重要IT基础设施建设,意义和影响重大,必须满足国家及行业监管机构的合规性要求,本次项目建设需满足包括但不限于以下国家和行业规范:
银监会《商业银行业务连续性监管指引》
银监会《商业银行数据中心监管指引》
银监会《商业银行信息科技风险管理指引》
银监会《银行业重要信息系统突发事件应急管理规范(试行)》
银监会《银行业金融机构信息科技外包风险监管指引》
人民银行 《银行业信息系统灾难恢复管理规范》
人民银行 《关于进一步加强银行业金融机构信息安全保障工作的指导意见》
人民银行 《关于加强银行数据集中安全工作的指导意见》
国家质量监督检验检疫总局《信息系统灾难恢复规范》(GB/T 20988-2007)
国务院信息化工作办公室《信息系统灾难恢复规范指南》
中办发27号文《国家信息化领导小组关于加强信息安全保障工作的意见》
工信部《2006-2020年国家信息化发展战略》【2006年5月8日】
知识产权要求
本次项目建设所涉及的方案和产品需要完全自主的知识产权,对核心技术拥有研发、维护、升级、技术支持的完整能力。避免出现局部或上下游产业的技术垄断和产权风险。
兼容性要求
银行存储资源池建设属于现有数据中心内资源池的扩容性质,必须考虑在网运行的所有IT基础环境的兼容性。根据目前银行数据中心运行情况,本次存储资源池的建设至少需要兼容如下环境和设备技术:
Brocade、Cisco等光纤交换机设备。
AIX、Redhat Linux、Windows等操作系统。
Power VM、VMWare、Hyper-V等虚拟化平台。
Oracle、DB2等数据库软件主流版本。
VMware VAAI等虚拟化接口认证。
数据迁移的要求
本次数据中心存储资源池建设必然涉及老旧存储或者老旧系统间的数据迁移。需至少支持异构第三方存储设备连接及存储层面在线数据迁移功能,并提供迁移必要的技术支持
设备高可用的要求
本次存储池建设属于行内最核心业务系统,T1A和T1B级,因此所采用设备应为金融行业广泛使用并长时间验证过的高端全闪存储。存储系统不应存在任何部件的单点故障,可用性不能低于99.999%。
环境要求
该用户生产数据中心/同城灾备数据中心位于北京,异地位于上海数据中心。目前主要的业务系统包括业务应用和数据库Oracle,DB2等数据库系统以及AIX、UNIX和Linux等操作系统,前端业务系统通过数据库或者操作系统存取数据。详细情况如下:
1)应用系统现状
该银行目前已经建成四级容灾系统。其中,核心应用系统为T1级,建设两地三中心架构。
2)网络系统现状
北京生产/同城灾备机房:
当前已建设同城灾备中心,两中心距离约40km。中间链路租用运营商裸光纤链路,并自购DWDM波分设备进行网络连接。
北京生产中心与上海数据中心:
异地灾备中心与测试中心复用,且已建成使用多年,生产中心与异地灾备中心通过租用WAN链路,带宽根据业务需要动态申请和调整。
北京同城灾备中心与上海数据中心:
同城和异地灾备中心之间实现数据的异地容灾复制,目前暂未建设容灾网络,后续根据业务容灾发展需要会适时进行相关网络资源的申请和建设。
2.设计原则
基本原则
通过对该银行本次存储资源池建设需求的了解,结合金融行业业务系统的应用特点,本次方案设计建设过程遵循如下原则进行:
可用性原则
灾备系统的故障不影响生产系统的运行,不会大幅度影响业务处理能力。
系统器件选择要考虑能支持7×24小时连续长时间大压力下工作;
系统具有充分的冗余能力、容错能力,如支持双活动控制器,满足高可靠性需求,至少达到99.999%可用性。
系统具有专业的技术保障体系以及数据可靠性保证机制;
确保系统具有高度的安全性,提供安全的登录和访问措施,防止系统被攻击;
异常掉电后不丢失数据,供电恢复后自动重新启动并自动恢复正常连接;
系统支持运行状态管理和技术保障体系。
先进性原则
系统必须严格遵循国际标准、国家标准、国内信息行业和金融行业的规范要求;
需符合存储技术以及IT行业的发展趋势,所选用的产品型号已规模上量;
所有的系统处于先进的技术水平,确保较长时间内技术上不落伍;
系统的处理能力要达到业内领先,对于业务的使用要留有一定的余量,以满足后续升级的需求;
对工作环境要求较低,环境适应能力强。
开放性原则
系统必须支持国际上通用的标准网络存储协议、国际标准的应用开放协议;
与主流服务器之间保持良好的兼容性;
兼容各主流操作系统、卷管理软件及应用程序;
可以与第三方管理平台、云平台集成,提供给用户定制化的管理维护手段;
与现有IT系统、软硬件系统兼容并可无缝替换和升级;
系统必须支持国际上通用的标准管理协议。
易维护性原则
系统支持简体中文,通俗易懂,操作方便、简单;
系统具有充分的权限管理,日志管理、故障管理,并能够实现故障自动报警;
系统设备安装使用简单,无需专业人员维护;
系统容量可按需要在线扩展,无需停止业务;
系统功能扩充需要升级时,支持不中断业务升级;
支持WEB管理方式或集中管理方式。
扩展性原则
考虑银行未来五至八年数据中心、业务系统和存储系统的整体规划,既能满足短期建设需求,又能满足该银行中远期规划方向。
系统易于扩充;
系统选择标准化的部件,利于灵活替换和容量扩展;
系统设计遵守各种标准规定、规范;
可以与第三方管理平台集成,提供给用户定制化的管理维护手段;
具备各主流厂家设备的扩展接入能力。
经济性原则
综合考虑集中存储系统的性能和价格,最经济最有效地进行建设,性能价格比在同类系统和条件下达到最优。
绿色性原则
满足环保与节能的要求,噪声低、能耗低、无污染;
必须选用无铅器件;
有节能降耗的技术手段;
具备环境管理认证,符合环保规定,包材可回收,支持重复利用。
3.设计方案
两地三中心的容灾方式是当前金融行业容灾建设的最高配置和主流方案。
通过建设近距离的数据中心(同城数据中心)获得接近于零数据丢失的数据保护,通过建设较远距离的数据中心(异地数据中心)获得远距离的数据保护,避免区域性的灾难导致业务无法恢复。在出现小概率的大范围的灾难时,如自然灾害地震,造成同城灾难备份中心与生产中心同时不可用,应用可以切换到异地灾难备份中心。通过实施经过日常灾难演练的步骤,应用可在业务容许的时间内,在异地的灾难备份中心恢复,保证业务连续运行。但异地恢复通常会丢失少量的数据。
3.1 方案概述
根据该银行现有两地三中心容灾解决方案现状:一个生产中心、一个同城灾难备份中心、一个异地灾难备份中心。生产中心的数据同步地复制到同城灾难备份中心,同时,生产中心的数据异步地复制到异地灾难备份中心。
相比仅建立同城灾难备份中心或异地灾难备份中心,“两地三中心”的方式结合两者的优点,能够适应更大范围的灾难场景,对于小范围的区域性灾难和较大范围的自然灾害,都能够通过灾难备份系统较快地响应,尽可能保全业务数据不丢失,实现更优的RPO和RTO。所以,两地三中心容灾解决方案得到了广泛的应用。
3.2 同步 + 异步的并联
3.3 容量方案设计
主要配置 | 安装/使用地点 | 备注 |
可用600TB有效容量(按RAID6 6D+2P计算) | 北京- 生产数据中心 | 生产 |
可用300TB有效容量(按RAID6 6D+2P计算) | 北京- 同城灾备中心 | 同城灾备 |
可用600TB有效容量(按RAID6 6D+2P计算) | 上海- 异地灾备中心 | 异地灾备 |
3.4 性能方案设计
3.5 数据一致性设计
3.6 数据保护设计
3.7 方案扩展性设计
同步+异步环形方案架构
双活+异步并联方案架构
HyperMetro+异步环形方案架构
3.8 方案亮点
性能高
华为OceanStor 18000F V5存储具备业界领先的性能表现,
绿色节能
华为OceanStor 18000F V5高端全闪存,相同容量下较传统高端节省超过70%的机房空间;节省超过65%的能耗和制冷消耗。
利用率高
数据缩减采用在线缩减,实时生效,更高效更节省空间。
数据高可靠
除标准容灾能力外,还可以做到数据本地、异地的多重逻辑保护。
全系列存储复制技术互通
华为全系列存储产品都采用统一的存储操作系统平台,高、中、低端阵列之间,闪存和全闪存阵列都可建立远程复制关系。用户在产品选型时,可以根据业务需要选择匹配的异地灾备中心磁盘阵列,显著提升容灾建设投入产出比。
多种3DC方案,支持不同业务要求的RTO和RPO
双活、同步复制、异步复制灵活组合,串联、级联、环形多种组网方式。基于Cache多时间戳的异步远程复制,最小支持3s的复制周期。同步复制则RPO=0。双活则RPO=0,RTO=0.
兼容性全面
支持所有主流的网络、IT硬件及软件,不会对用户使用习惯造成冲击,无需变动所有业务系统组件即可使用。支持异构虚拟化能力,不仅可以异构接管所有主流存储设备,还可以对接管设备进行无中断的数据迁移和灾备保护。
容灾业务和拓扑可视化管理
华为容灾管理软件OceanStor BCManager支持可视化展示两地三中心的物理拓扑和业务逻辑拓扑。并且支持一键式容灾测试和切换,支持用户定制脚本一键恢复备用业务系统,简化灾备系统的管理和维护。华为OceanStor系列存储也提供API接口可供各类第三方网管、运管、灾备管理等系统对接。
点击文末阅读原文,可以到原文下留言交流
觉得本文有用,请转发、点赞或点击“在看”,让更多同行看到
资料/文章推荐:
欢迎关注社区 “双活”技术主题 ,将会不断更新优质资料、文章。地址:https://www.talkwithtrend.com/Topic/71
下载 twt 社区客户端 APP
长按识别二维码即可下载
或到应用商店搜索“twt”
长按二维码关注公众号
*本公众号所发布内容仅代表作者观点,不代表社区立场