超融合基础架构在商业银行私有云中的应用
某商业银行结合自身“全行一体化”的IT架构战略目标,在私有云建设和实践过程中加深的对超融合基础架构的理解与认识,同时通过对开源软件的学习,改造,逐步形成了自身对超融合架构的自主可控,寄以开源软件的灵活性,探索并实践了一套适用于某商业银行的超融合架构切实可行的方案。
2014初国务院印发《关于促进云计算创新发展培育信息产业新业态的意见》(以下简称《意见》),为加快发展云计算,打造信息产业新业态,推动传统产业升级和新兴产业成长,培育形成新的增长点,促进国民经济提质增效升级。2016年《中国银行业信息科技“十三五”发展规划监管指导意见(征求意见稿)》公开征求意见,银监会第一次对银行业云计算明确发布了监管意见,是中国金融行业云建设的里程牌事件。
某商业银行在2014年完成了针对全行科技在云计算层面进行了全面规划,而后依据规划成果逐步实践了测试开发云建设,并开展了“全行一体化”的生产云建设和实施过程,将总行、分行的应用系统都部署至私有云环境中,在云环境中由总行来统一管理计算,存储,网络资源。
移动互联网时代的到来对银行业务敏捷性也提出了更高的要求,某商业银行的“全行一体化”就是在这种大背景下产生的,总行相当于云服务提供商,分支行相对于云服务使用者,日常受理来自分支行系统和应用的服务请求数量增长了30%,高效的保障了业务增长需求。传统IT架构应对业务增长,运维维护压力会相应增大,扩展困难,因此某行对IT架构的高效扩展和自服务能力作为“全行一体化”部署实践过程中的又一个重点。今天将介绍该行私有云环境下IT架构的优化实践。
一、 对于业界主流的IT架构技术的研究和思考
根据某商业银行“全行一体化”对IT架构的实践需求,我们认为当今在云计算分布式系统中的超融合IT架构可以很好的快速满足用户业务增长对资源的需求,实现总行对分行资源的统一运维管理,分行业务资源的敏捷满足。
一般商业银行都是总分支三级的分布式企业服务架构,在这样的架构体系下,传统的IT架构都是分开实施,分别管理,或只专注于总行,或只专注于分行,未能实现全行资源的统筹调度;资源交付专注于服务器虚拟化,无法实现计算,存储,网络资源的端到端交付和自服务管理。
随着企业开始数据驱动化转型,业务迭代周期变短,客户对资源要求更快,它们要求基础设施能够支持极大的可扩展性以及灵活的资源使用模式,并且提供前所未有的规模经济效益。超融合架构具备帮助用户完成该变迁的前景和潜力。
图一 传统的IT架构的问题
什么是超融合?
IT架构演变到今天汇集所有融合基础设施、虚拟化和软件定义存储技术的优势。您所需要的一切(包括服务器、存储、虚拟机软件、网络和管理)都可以全部集成并打包到一个高可用的设备中。
全球的IT专家开始意识到传统的架构已经不能适应当今的业务需求,如新的云交付模式、急剧的数据增长以及需要在几天之内推出新服务。在这个新时代,维持现状并不可取。作为对这些业务需求的回应,许多IT部门已经启动了服务器虚拟化和云计算项目,以促进服务交付并增强IT敏捷性。然而宏大的虚拟化,云和基础设施方案意味着冗长的项目时间、更高的管理复杂性以及更高的运营成本,这时超融合就应运而生,它可以在一个易于部署、管理和支持并且经济高效的紧凑系统中,实现虚拟数据中心的诸多优势。
超融合架构的核心是软件定义,并与硬件解耦。它的目标本身与虚拟化优势是一致的,超融合架构致力于提高资源的聚集度,利用率,降低成本,而虚拟机相对于物理机一大优势也是精细化资源,提高资源的利用能力。同时,企业可以通过硬件通用性带来的竞争获得成本优势。
部署更快捷
通过超融合,一切都能实现预配置,预安装,在按下一个部署按钮的几分钟之内就能开始运行,业务部署更方便,而不是需要一个单独的SAN或NAS设备。
借助可用的超融合系统,从具备一般IT经验的人员还是经验老道的管理员,任何人都能够可以快速部署完整的业务环境,而且只有15分钟就能从开机到配置的整个过程,并未无需外部系统集成商的帮助就能完成业务系统部署。这就使得平台具备自服务能力,把传统的IT部门从日常繁重部署工作中解脱出来,业务部门可以自行规划,申请,部署资源,加速迭代频率,缩短迭代周期,专注业务,更好满足客户。
线性可扩展
面对业务的爆发性增长,利用超融合系统,这个问题便迎刃而解。超融合系统能以线性方式水平扩展。新节点可以无缝添加到一个既有的公用集群中,通过新节点的添加就能提供新增的计算和存储资源。软件定义的好处做到了性能和容量的线性提升,好比我国的“动车组”同时提升容量和动力。
管理更简单
由于所有组件都集成到一个共同的管理的简易机箱中,因此无需一个精通虚拟化,存储,服务器,网络领域的专家团队。与需要许多分散组件(包括具有独立光纤交换机的关联SAN)的系统相比,超融合系统的简易性可以帮助减少资本和运营支出。现在一切都集成在一个易于管理,易于维护且占用空间相当较少的机箱中,可以在空间有限的数据中心中配置更多的计算和存储资源。同时单一云管理平台就可以为整个系统(包括硬件和软件)提供支持。
从商业角度来看,超融合系统能够减少前期资本和运营成本,比传统系统需要更少的组件,占用空间小,简化管理,高效的供电和冷却。无需雇用各个领域的专家来维持超融合系统启动和运行,一般的IT人员都能够进行日常管理。
在技术方面,超融合系统减轻的IT专业人员的每日工作负担,他们不在需要管理不同的服务器,存储,网络系统,系统基础设施集成了恢复能力,并且易于设置,掌握,维护和扩展。系统占用体积小并不意味着它的功能不强大,超融合系统也可以提供与传统IT解决方案相同水准的服务能力。
所有人(业务和IT方面)都可以从增强的敏捷性中受益,因为IT系统实现了轻松管理且线性方式水平扩展,从而动态满足业务的需求。新资源节点部署运行快速便捷。
二、 某商业银行在超融合架构技术上的实践
在传统模式下,某商业银行总分行都有各自的机房,需要采购各自的服务器,存储和网络设备,各分行机房空间有限,电力供给有限,业务需求增大时供给保障能力跟不太上。同时分行IT人员稀缺,且能力上稍有不足,特别是对小型机和高端存储设备的维护经验上。同时总行运维人员资源相对充足,经验相对丰富这些优势也不能很好的得到利用。各个分行各应用系统IT基础设施容易成为孤岛,各地标准不统一,运维风险高,总行监管对分行审计要求高, 总能发现各种各样的问题。当新的分行开业时,超融合架构又能非常快速的完成基础设施的搭建,不像传统的商业设备对机房空间,承重,电力有着严格的需求。同时超融合能整体提升IT的运维,运营能力和对风险的控制能力。
通过超融合架构,某商业银行私有云实现如下四项功能。
全面提升资源的交付效率和标准化程度
通过该私有云可以使得总分行资源从申请到交付从22小时缩短至30分钟,通过将某商业银行技术标准和规范固化配置在云管理平台中,使得总分行资源标准化、规范化,提高业务平台的稳定性,满足总行的监管需求。同时因为资源的标准化配给,使得实现资源的端到端交付成为可能,全面提升了生产、办公以及开发、测试的效率、灵活度以及安全性。
全面改变了运维模式和科技角色改变
全行IT基础设施“统一池化,统一灾备”后,分行的IT基础设施规模大幅缩小,结构更统一。通过高度一体化,自动化的管理,在提升IT运维服务质量的同时,极大的释放了分行科技人员的人力资源,可以更加侧重于对业务支持力度。分布式维护改为统一集中维护,释放分行IT人员,分行IT人员从技术维护转变为营销支持,实现“客户经理+科技经理”的营销模式,直接参与营销并提供技术支持。
全面提升分行IT系统的容灾备份能力
运用超融合基础架构在虚拟化和分布式存储上的优势,打造适用于分行的稳定、高可靠计算存储平台。从数据中心角度来说,云计算技术将服务器架构精简成几个镜像文件,这使得整个服务器实例可由几个镜像文件数据来代替,利用云平台管理系统中的IT自动化技术可以在恢复数据的同时恢复整个服务器。而传统备份是要求故障服务器在数据重新加载并恢复服务之前找回并启动。所以,更加完善的云计算灾备解决方案利用了这种将服务器架构变成几个镜像文件的精简性,可通过IT自动化技术一步到位的恢复服务器实例和数据。基于虚拟化的高可用特性使得部署于超融合架构上的分行生产系统原生的具备了容灾切换能力,分布式存储的快照功能改变了原有传统备份方式,加速了数据保护的效率。
同时,分行基础设施极大精简后积极建设分行本地的备份网络,其它基于全行私有云实现统一的云灾备,使得分行业务安全性得到更好的保障。
全面实现“全行一体化”的目标
对资源,运营,成本的集中管理,实现了全行的资源集中供给,集中调;提升了整体的运营水平和能力;IT资源建设复用度更高,极大降低重复建设,根据用户使用情况进行成本优化和成本分摊。
总统而言,超融合技术确保了某商业银行“大集中2.0”科技战略的成功落地,满足了业务对资源的快速、敏捷的部署的需求。
三、 某商业银行对超融合架构技术自主可控探索
某商业银行在私有云实践中为了实现“全行一体化”的战略目标,满足总行的统一管理和监控需求。将总行,分行所有资源纳入云管理平台统一管理,并进行了分行应用有筛选的集中迁移至总行一级资源池和分行二级资源池,创新性的形成全行性的总分两级资源池,实现了资源的集中管理和统一调度。
随着私有云建设的不断深入以及经验的积累,某商业银行发现商业的云管理平台的原生功能上仍然有一些不足,例如:
无法对不同资源的混合环境进行统一管理,需要进行二次开发。例如小型机资源池,商业虚拟化资源池,融合型资源池(参考架构),超融合资源池,存储资源池。
在日常运维工作中,商用云平台提供的监控信息不足,部分深度监控指标没有展示,需要二次开发以提升系统的可维护性。
同时为了保证未来私有云平台的可扩展性和可维护性,避免被单一厂商的产品和方案锁定。考虑到上述情况,并响应银监会对于银行业进行自主可控能力建设的号召,我们在仔细评估了各种技术方案后,探索选择使用OpenStack作为私有云平台自主可控建设的技术方案,并开始着手对OpenStack进行功能优化和产品整合,定制开发,力争逐步实现对私有云平台技术的自主可控。
图二 基于总分行两级资源池的商业银行云
之所以选择OpenStack技术,主要原因如下:
目前OpenStack是最活跃的开源云计算项目,能够提供云计算环境下的对计算,网络,存储资源的虚拟化,标准化提供,同时支持多种硬件平台,多种虚拟化技术解决方案,包含目前市场上主流的虚拟化商用和开源技术。
OpenStack实现上采用模块化设计,易于扩展。能够通过plug-in的方式支持多种软硬件方案,用户在此基础上可以进行各项功能的开发和优化,定制化开发难度相对简单。
目前某商业银行已经逐步尝试基于OpenStack进行的自主研发,实现总分二级资源池管理,同时支持多种虚拟机资源池管理,例如小型机资源池,超融合资源池,SDN网络资源池。通过对OpenStack的二次开发,某商业银行的私有云平台的可维护性,可扩展性大大提升,能够帮助总分行的系统IT管理员更便捷高效地完成运维工作。
同时OpenStack提供丰富的北向API接口和SDK包,便于开发简单,易用的用户界面,能帮助业务部门人员自主的申请和使用资源,批量处理任务非常快捷。某商业银行通过对OpenStack的二次开发,在一定程度上确保了对私有云平台发展的自主可控。
某商业银对超融合基础架构的研究与应用源自于“全行一体化”的战略规划和私有云的实施。从商业产品入手,通过逐步对超融合架构技术的了解,熟悉,掌握,并结合开源软件的优势,最终形成了满足某商业银行自身需求,并适应在银行推广的行之有效的超融合建设方案和实践经验。
参考文献:
[1] Converged vs. Hyper-Converged Infrastructure Solutions
www.tomsitpro.com/articles/converged-hyper-converged-infrastructure-solutions,2-817.html
[2] Why Hyperconverged Infrastructure is Different
www.hyperconverged.org/understanding-converged-infrastructure/
[3] Hyper-converged systems: What you need to know about this hot virtualization topic
www.techrepublic.com/article/hyper-converged-systems-what-you-need-to-know-about-this-hot-virtualization-topic/
长按下图二维码关注“AIX专家俱乐部”公众号
也可以直接搜索公众号名称“AIX专家俱乐部”或微信号“AIXChina”关注