查看原文
其他

基于超融合构建关键业务数据库新型系统加固方案



类型:技术解析


金融行业关键业务数据库系统加固方案现状


金融行业客户(银行、保险、证券、基金等)传统关键业务系统数据库仍然运行在商业化品牌数据库平台之上,主流数据库以 Oracle、DB2、SQL Server 为代表,由于数据库在金融行业往往承载了关键业务数据,其数据访问具备容量大、事务处理高、延时低等特点,因此数据库的高性能、可靠性、可用性、容灾能力等关键指标成为金融客户在系统架构规划时关注的重点,直接或间接影响着业务系统的稳定运行。


以 Oracle 业务连续性为例,其主流的运行操作系统集中在 Linux 和 AIX(金融行业保有量大)之上,通常运行的物理环境多为小型机、数据库一体机、X86 物理服务器,除数据库一体机外,数据通常是存储在 FC SAN 传统存储之上(典型的 “烟囱式” 垂直多层 IT 架构)。


除了以上投入,为保护关键业务的可用性,客户普遍会采用以下系统高可用加固方案(以下简称 “加固方案” )。


1.使用 Oracle RAC(Real Application Cluster)集群部署模式,通过多节点的集群部署为数据库层面提供了高可用性、负载均衡、故障容错、无缝切换的能力,将硬件和软件错误造成的影响最小化。根据数据库处理能力、数据容量、业务特点等需求,常有以下几种部署方式:

  • RAC + 小型机 + FC SAN

  • RAC + 数据库一体机

  • RAC + x86 + FC SAN

  • RAC + x86 + VM + FC SAN


在数据保护和业务连接性维度,由于 RAC 实际保障的是物理主机和软件的高可用性,数据是集中存储在 FC SAN 存储(实际数据存储仍是一份),为防止存储设备的物理或逻辑故障为数据带来的可靠性风险,金融行业用户通常会采用带库备份、存储异地数据同步复制以及通过 RAC + DG 组合的数据备份容灾技术方案(行业监管对业务可用性和数据可靠性强要求)。


2.Oracle DG(Data Guard)创建和维护数据库同步副本,保护 Oracle 数据免受站点故障、灾难、人为错误和数据损坏,同时为关键业务应用提供站点间或站点内的数据容灾。DG 可以实现底层硬件平台的异构化,根据业务等级通常有以下几种常见的 DG 部署方式:

  • RAC + 小型机 + FC SAN

  • RAC + x86 + FC SAN


下图展示了金融行业的数据库部署、备份、业务容灾架构。



传统数据库系统加固方案面临的挑战


金融行业核心业务数据在行业监管下对业务连续性的要求不断提升,在数据可靠性、可用性、容灾能力也提出了更高的要求,同时也要求业务需要提供在多数据中心或异构环境下的数据备份和快速恢复能力,对系统软件、承载的硬件以及网络提出了全新的挑战,架构复杂性、易维护性、投入成本等方面也影响着用户对技术架构的选择。


以 Oracle 为例,数据库层面已经提供数据备份复制等技术,如 ADG,GG 等技术保障数据库层面的高可用、高可靠、数据容灾,但承载关键业务连续性的 IT 基础设施依然还是以传统架构主导,服务器(x86 / 小型机) + FC SAN 的硬件解决方案,这种硬件方案面对的挑战如下:


  • 架构复杂度高,运维困难。对于关键业务备份容灾、数据离线分析等场景,通常部署软硬件与主系统(活跃的关键业务系统,也称为 Master 系统)架构相同,均采用垂直的 IT 多层架构(软件-系统-服务器-FC 网络-FC SAN 存储),这种架构涉及多方面软硬件技术和产品,在日常管理运维中,例如环境部署、配置变更、故障处理、切换演练等工作给 IT 管理员提出了挑战。


  • 架构投入成本高昂。排除软件层面的投入,在硬件方面该架构通常也是配置了拥有高处理性能的计算单元和基于 FC SAN 的中高端的共享存储及网络设备(如使用存储级数据远程复制技术,还需购买相关 License 授权)。


  • 架构扩展能力差。基于集中存储架构的特点,存储控制器通常是整个架构的性能处理瓶颈,当瓶颈发生时,通常手段是增加新的存储设备进行替换或是新老存储共存,这样的扩展方法又会为整体架构带来更多的复杂度,可以看出架构扩展性完全受限于集中存储设备的制约。


两种监控应用系统模式


作为一个崭新的 IT 基础架构和产品形态,超融合基础架构(Hyperconverged Infrastructure 简称 HCI)作为近几年 IT 基础架构领域最重要变革技术之一,已经为越来越多金融行业客户所了解。部分金融客户已经将超融合架构尝试应用于各种业务场景,以下是超融合架构的特点和优势:


  • 基于标准通用 x86 服务器与以太网,硬件品牌异构开放,软硬件松耦合;

  • 分布式架构,支持横向按需扩展,性能线性提升;

  • 利用副本技术保障数据可靠性;

  • 资源集中统一管理,简化运维;

  • 融合部署,相较于传统架构,交付周期短;

  • TCO 整体成本低。


超融合架构特点结合数据库复制技术可以为关键业务数据库数据提供一套完整的数据容灾保护解决方案,该方案易维护、总投入成本低(相较与目前传统方案)、架构弹性按需扩展,为用户在异构场景下设计数据容灾架构提供了更多的灵活选择空间。


下图中以 Oracle 为例结合超融合架构实现数据容灾保护,该方案采用硬件基础架构异构的设计思路,上层数据库采用 ADG (Oracle Advance Data Guard 物理复制)和 OGG(Oracle GlodenGate 逻辑复制)组合的方式保障数据高可靠性,底层利用基于 x86 的超融合架构(融合计算、存储、网络)替代传统架构下的服务器 + FC 网络 + FC SAN 共享存储的三层垂直架构,使整体架构扁平化,易于日常运维,并有效降低硬件投入成本,根据业务处理要求,按需灵活水平扩展,线性提高架构处理能力和存储容量,为金融行业用户提供了一种新型的保障业务连续性的方案思路。



用户案例


某保险公司用户目前有 6 套业务数据库系统(核心库、非核心、OA、DMZ、财务、投资),分别运行在 Oracle 数据库一体机和基于 x86 + 共享存储架构平台之上,数据备份使用 Commvault + 带库方案实现,目前需要对当前 6 套业务系统 Oracle 数据库进行容灾备份并同时集中 6 套库的业务数据进行实时分析。在行业监控要求以及用户自身对业务架构可靠性、数据容错性、业务连续性、业务恢复速度的综合多方面考虑背景下,结合现阶段己部署的 IT 架构特点以及对新架构的大量评估、测试验证,最终用户选择使用超融合 + 传统架构混合异构的方式建设新一代容灾保护平台,为业务数据提供底层技术保障。


考虑到容灾的高成本,以及容灾的实际使用概率,用户一期计划在同一机房内的不同区域采用异构平台进行新的资源池部署,通过在不同资源池内对业务系统进行应用级高可用设计,实现同一机房内的系统加固,二期将结合私有云+公有云方案,实现数据在混合云架构下的可用性和容灾保障。


某保险公司一期超融合环境由 7 台 SmartX Halo 7100S 组成,采用 vSphere + 分布式存储 ZBS 的超融合模式部署,每台节点安装 ESXi 虚拟化操作系统,并在每个节点上部署 SmartX SCVM 虚拟机,用于将 7 个节点的本地磁盘组成分布式存储池,节点之间通过 10G 网络进行存储数据交换同步,提供 64TB 数据存储空间,业务系统的数据存储策略为 2 副本,数据库存储策略为 3 副本。目前支撑 90+ 业务系统。


逻辑拓朴


本次新建超融合集群主要目的是备份用户核心生产 Oracle 数据库,提供数据库容灾备份,通过在 HCI 集群新建备份数据库并与主库实时数据同步(ADG),在主库故障发生时,切换业务到备库的容灾方案,数据库 VM 的数据存储为 3 副本。通过 Oracle GoldenGate(OGG)逻辑同步功能,将 6 套生产数据实时业务数据同步到 HCI 集群,为业务关联数据分析提供支撑。


项目实施后的 Oracle 容灾逻辑拓朴


项目实施后为用户带来的价值:


  • 降低 IT 基础架构的日常运维复杂度,让管理员将运维重心更多的放在上层业务应用层面,利用简化的底层计算、存储融合架构,为用户带来简单、高效的底层架构管理能力。

  • 降低总体投入成本,通过使用基于 x86 架构的虚拟化 + 分布式存储解决方案,替代传统以物理服务器和小型机 + 共享存储的底层架构,新型的超融合基础架构按需扩展能力有效的帮助用户按需成本投入,并根据未来资源需求灵活横向扩展基础架构。

  • 基础架构快速交付,缩短基础平台的部署实施周期,向上层业务层快速交付计算、存储资源池。


总结


超融合架构具备交付快、高可靠、扩展易、成本低等特点,为金融行业关键业务系统加固提供了一种全新的 IT 支撑架构,方案己被金融行业客户严格验证,并在实际的生产环境中运行,与传统架构协同相互集成,发挥各自的优势和价值,为用户提供异构灵活的混合架构解决方案,并为金融行业用户未来的 IT 架构演进提供有力支撑。


↓ 戳原文进入 SmartX 官网。

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存