超融合支撑保险客户构建生产级数据库资源池
作者:深耕行业的 SmartX 金融团队
背景介绍
2018 年,某保险客户在开发测试环境部署了首套基于超融合的基础架构平台,成功使用国产虚拟化 + 分布式存储替代了 VMware + 集中存储阵列,并支撑了 300+ 虚拟机。在针对“团险销管”系统的容器化改造过程中,得益于 I/O 本地化特性,超融合平台在开发测试环境中的性能表现相比当前生产环境获得数倍提升,这进一步增加了客户将超融合架构应用于生产系统的信心。
随后从 2019 年到 2021 年,经过 3 年持续的基础架构转型推进,历经三期的改造和升级扩容,客户生产环境完成了 2 套超融合集群的部署落地,500+ 业务虚拟机通过合理的规划放置,并利用网络负载均衡,实现了集群级应用业务容错。
而客户的生产数据库硬件平台逐渐老化,使用年限已超 5 年,底层硬件平台升级替换在 2021 年被提上日程。由于超融合架构在开发测试和生产环境有着 3 年多的稳定运行及性能表现,得到了客户的充分认可,这为客户决定使用 SmartX 超融合架构构建数据库系统资源池提供了契机。
本文将介绍该客户的 MySQL 及 Oracle 数据库资源池建设过程和收益总结。
MySQL 资源池构建
MySQL 性能评估
SmartX 超融合在开发测试环境支撑多套 MySQL 数据库稳定运行 3 年以上,其中在针对“团险销管”系统报表功能进行性能对比测试中,超融合架构相比当前生产环境,基于相同的虚拟机资源配置下,表现出更快的业务响应速度,下图为对比数据。
客户在生产环境测试了“一天数据量”的数据查询,需要等待 50s,认为这个时间已经很长,做全量需要更多的时间。由于是生产环境,担心影响到业务,所以未进行全量数据测试。但是在开发测试环境的超融合集群直接跑全量数据的查询,与生产环境测试“一天数据量”(数据量与全量数据相差 3 个数量级)的查询数据对比,SmartX 超融合查询性能远高于当时的生产环境。
虚拟机资源配置如下图:
MySQL 资源池建设
客户新建一套 3 节点全闪架构的超融合集群,使用 SmartX 原生虚拟化 ELF,专门用于支撑 MySQL 数据库业务,使用 v2v 方案迁移 11 套 MySQL 业务数据库到超融合集群,包含渠道类、内部应用类和周边应用类业务系统,目前已完成一期 3 套系统的迁移,每套数据库系统均包含多个虚拟机,采用 MySQL “一主多从”的部署方案。
MySQL 超融合集群(3 节点),集群共提供了 192 个逻辑处理器,2.3T 内存,68T 存储裸容量。
Oracle 资源池构建
Oracle 性能评估
使用超融合架构支撑 Oracle 生产系统数据库,对于客户基础架构是一次关键的转型探索,需要进行全面的评估和充分验证。经过与客户的沟通讨论,客户确定临时构建一套三节点超融合集群并新装部署 Oracle RAC (虚拟机资源配置以及数据库配置参考生产环境中的电商系统),使用第三方的标准数据库测试工具 SwingBench 进行长达 8 小时的持续性能测试,评估 Oracle 数据库性能表现。
测试集群拓扑环境:
第三方压测工具 SwingBench 使用默认 TPC-C 压测模型,在 100 用户并发下,TPM 平均值为 63 万,平均延时为 6ms。
提升用户到 200 并发下,TPM 平均值为 101 万。
再次提升用户到 300 并发下,TPM 平均值达到 112 万。
本次性能验证,分别进行了 100 用户、200 用户和 300 用户的并发测试用例,通过测试,在高并发用户下,可以充分释放 Oracle 数据库性能(百万级 TPM),且性能曲线输出平稳。我们通过行业经验,看一下这里的 TPM 与应用业务的关系。每笔交易按 15 个原子操作计算,并根据行业经验保留 30% 余量,相当于每分钟处理超过 3 万笔复杂金融业务交易,在不能实际压测生产环境进行对比的背景下,此次测试数据库过程和结果得到客户的认可。
Oracle 资源池建设
本次数据库性能验证,超融合架构展现出的性能指标完全可以满足客户的业务需求。在对数据库的稳定性、可用性和性能进行多维度的综合评估后,客户最终决定,在建设 MySQL 资源池后,新建用于支撑 Oracle 数据库的全闪超融合资源池。为降低迁移复杂度,并保持和原虚拟化架构的一致性,Oracle 资源池的虚拟化层延用 VMware ESXi。
超融合集群(6 节点)共提供了 384 个逻辑处理器,4.6T 内存,230T 存储裸容量。
到目前为至,已迁移完成 26 套 Oralce 数据库系统,含 2 套 Oracle RAC(两节点),涵盖客户目前架构支撑平台、渠道类、周边应用类和 BI 报表业务等系统。
建设收益
基于超融合架构的企业云 IaaS 平台通过融合计算、存储、网络资源,有效降低基础架构的建设成本和复杂度,在保持架构可靠性和高性能的前提下,提高了架构敏捷性,通过两期的生产数据库资源池建设,客户利用超融合架构完成了对重要生产系统的基础架构转型。
近 3 年持续的基础架构转型,给客户带来了如下收益:
相比于服务器 + 集中存储的传统架构,超融合架构的 I/O 本地化、SSD 缓存等技术特性带来了更多的性能提升。全分布式的部署模式,使得集群 I/O 性能和存储容量在增加节点后可以获得线性增长;
超融合架构具备更好的弹性和敏捷性,能够实现计算存储资源的快速交付,架构按需扩容,从而更好地提升业务团队需求的响应速度,进一步提升业务需求方的满意度;
从总体拥有成本来看,基于超融合的分布式架构具有显著的成本优势。使用标准以太网交换机替换了专有 FC SAN 存储交换机,一台服务器节点既提供计算能力,也同时提供存储能力,不仅减少了机柜的空间使用,同时最大化利用上服务器磁盘插槽,将服务器的硬件能力充分释放。超融合架构支持小规模 3 节点起步,按需弹性扩展,拥有最佳的成本优势;
使用国产自主研发的分布式存储方案进行企业云 IaaS 资源池搭建,将为客户的国产化替代之路打下坚实的基础。
案例总结
通过实践探索,充分验证了超融合架构具备支撑生产级数据库的能力,鉴于超融合稳定的自研存储核心和全栈性能优化,客户决定将生产数据库(MySQL、Oracle)迁移到基于超融合构建的云化资源池运行,同时实现了企业云基础架构的分布式云化转型和虚拟化以及存储的国产化逐步替代。
推荐阅读:
点击阅读原文,下载《行业用户超融合转型实战合集》,深入了解各行业技术专家的超融合转型经验。