某国有水务机构:超融合构建统一管理虚拟化与容器环境的轻量云底座
近些年,企业 IT 基础架构现代化转型的步伐逐渐加快,不少金融、医疗、政府等行业的用户,已在生产环境部署 Kubernetes 等云原生基础设施,为业务应用提供敏捷支持。不过,一些企业的容器化转型仍处于起步阶段,以自建的方式搭建 Kubernetes 平台,难以高效开展 Kubernetes 集群的部署与运维。此外,除了容器环境,不少用户也同时使用虚拟化/超融合支撑关键业务、数据库等性能敏感场景。如何以一套架构方案同时支撑、管理虚拟化和容器环境,满足不同应用场景对性能、稳定性、敏捷性和简易运维的多重要求?
近期,某国有水务公司采用 SmartX 全栈超融合方案构建轻量云基础设施,为虚拟化环境核心数据库提供高性能支持的同时,优化 Kubernetes 集群管理效率,实现了虚拟化环境与容器环境的统一支持与管理。本文,我们将针对这一用户实践进行经验分享。
项目背景:原有超融合平台性能不足,容器环境运维效率低下
用户为某大型水务集团控股的地方水务机构,主要负责居民生活用水的生产与供应。作为集团的重要数据中心,该机构逐渐接管了整个区域的水务公司业务系统,并且以构建智慧水务、区域水务为目标,逐渐完善 IT 基础架构,计划构建一个可满足“等保”三级、业务双活的区域化数据中心。
随着业务的逐渐增长和建设的不断推进,水务机构渐渐发觉原有 IT 基础设施难以满足业务运行与运维管理方面的需求:
虚拟化环境性能不足:用户原计划使用某国产超融合一体机支撑 MySQL 和 PostgreSQL 数据库。由于业务量较大,用户希望超融合系统可提供高性能支持(预估达到 50 万 IOPS),而该超融合方案仅可提供 10 万 IOPS 性能,难以满足业务需求。另外,若想对现有超融合集群进行扩展,用户需要采购原厂配件,扩展成本居高不下,阻碍了业务的快速发展。
容器环境运维效率低:除了数据库,用户已对其他所有业务应用进行了容器化改造,部署在自建的 Kubernetes 集群并通过开源容器云平台进行管理。无论是自建还是通过容器云平台创建的 Kubernetes 集群都需要提前准备虚拟机、安装配置操作系统、配置优化参数、安装容器运行时、安装 Kubernetes 集群等手工操作。后续集群层面的运维也需要手动进行,同时回滚也不太方便,导致容器环境整体运维效率低下。同时,由于数据库部署在虚拟化环境,用户也希望将两个环境进行统一管理,进一步降低运维负担。
基于以上挑战和需求,水务机构计划对虚拟化环境和容器环境的 IT 基础设施开展同时升级,以一套架构方案同时满足虚拟化环境数据库的高性能需求,和容器环境易于管理的运维需求,并实现两个环境多个集群的统一管理与互联互通。
方案选型:评估基于 SmartX 全栈超融合的轻量云基础设施方案
随后,水务机构针对多种转型方案开展了选型评估。其中,基于 SmartX 超融合的轻量云基础设施方案给用户留下了深刻印象:整套架构基于 SmartX 超融合部署,以 SMTX OS 集群为虚拟化环境数据库提供高性能支持,同时以 SMTX Kubernetes Service(SKS)集群为容器环境提供敏捷交付与运维支持。欲深入了解 SmartX 超融合的全栈云基础架构能力,请阅读:SmartX HCI 5.1 发布:是超融合,更是虚拟化与容器生产级统一架构。
在虚拟化环境性能方面,用户主要考察了当时 SMTX OS 5.0.5 版本的性能表现:开启 Boost 模式和 RDMA 的 SmartX 超融合集群在 4K 随机读场景下可提供超过 100 万 IOPS(见下图),用户认为这一性能表现可以满足虚拟化环境数据库的性能要求。
注:以上性能测试基于 SMTX OS 5.0.5 版本,后续版本性能表现更佳。
针对容器环境,SKS 支持用户通过全图形化的单一管理界面对所有集群进行全生命周期管理,充分满足用户对于 Kubernetes 集群自动化创建与管理的需求。同时,由于 SKS 基于 SmartX 原生虚拟化 ELF 部署,以虚拟机为节点构建 Kubernetes 集群,用户可使用 SmartX 集群管理平台 CloudTower 对超融合集群和 Kubernetes 集群进行统一管理。
欲深入了解 SKS 产品能力,请阅读:
方案落地:一套超融合架构方案同时支持虚拟化与容器环境
基于以上评估,水务机构采用 SmartX 全栈超融合方案进行了架构升级:用户新建一个 3 节点 SMTX OS 集群,在虚拟化环境中运行 MySQL 和 PostgreSQL 数据库应用;同时,基于超融合构建 1 个 SKS 集群,支撑居民用水、污水处理、在线缴费、OA 等全部生产业务容器化应用和中间件,共计 140+ Pod,并使用 ECP 网络插件实现容器和虚拟机网络互通。两个环境通过 CloudTower 进行统一管理。
目前,用户端整套架构运行良好,在 SMTX OS 集群运行核心数据库的过程中,没有出现因为基础架构性能不足带来的困扰,同时 SKS 集群的使用帮助用户简化了日常运维,并大幅提升 Kubernetes 集群交付速度。
用户收益
满足虚拟化环境数据库性能需求:相比原国产超融合方案,SmartX 超融合大幅提升生产环境数据库性能,运行近 1 年时间里性能平稳且未发生生产级别故障。
提升容器环境部署运维效率:SKS 使 Kubernetes 集群交付速度大大提升,交付时间从原来的几天到现在仅需十几分钟;SKS 图形化的功能操作也降低了 Kubernetes 集群的运维难度,帮助运维人员快速上手。
简化架构,实现虚拟化与容器环境的统一管理:一套超融合架构同时为虚拟化和容器负载提供计算、存储、网络等资源支持,提升资源利用率,并方便用户通过统一的管理平台对虚拟化环境和容器环境进行统一管理。
降低采购与扩容成本:相较原先软硬件绑定的超融合一体机方案,SmartX 超融合支持纯软件交付和按需扩展,帮助用户有效利旧原有硬件,节省硬件采购和扩容成本。
欲了解更多 IT 基础架构团队 Kubernetes 运维与管理干货知识,欢迎下载阅读电子书《IT 基础架构团队的 Kubernetes 管理:从入门到评估》。
您还可关注 SmartX 用户社区,在 SmartX 学院中获取更多关于 IT 基础架构的干货内容与直播课程。
推荐阅读: