经过一系列对比研究工作,软件定义存储比传统存储省钱、省时、省事、省电、省空间。
解放军302医院李源谈软件定义存储:从煤气罐到天然气
解放军302医院网络管理中心副主任 李源
“传统存储就像是煤气罐,专有硬件、紧耦合、故障域大、占物理空间大,可以纵向扩展,不能横向扩展。数据迁移费时费力,也就是换煤气罐很费劲。软件定义存储更像是家用天然气,打破了原来物理资源的界限,逻辑抽象出一个存储池,你不用关心给你分配的空间是哪块物理硬盘,部分磁盘的损坏也不会影响你空间的使用。软件定义存储的精华也就在于此。”
如此比喻让复杂的技术问题简单、明了、易懂。这是在4月21日举行的“医疗大数据服务能力建设研讨会”上,解放军302医院网络管理中心副主任李源在演讲时谈到的,他的演讲主题是《软件定义存储》。
虽然软件定义存储早已不是新鲜技术词汇,但是在医疗行业,这种技术实操的讨论,让更多医院对于新技术的接纳有了“定心丸”。
医院数据中心面临存储压力
解放军302医院是全国最大、全军唯一、综合实力最强的三级甲等传染病医院。多年来,在抗击非典、防控甲流、抗击埃博拉疫情等重大任务中担负了主力军和突击队作用。在信息化方面积极探索勇于尝试,成立了以院长为组长的医院信息化领导小组,多年来医院规划和建设了近百个信息系统。
从2009年开始,医院信息化建设进入加速期,整个社会的医疗信息化也渐渐走到风口,各类信息系统产生的数据在以几何倍数爆炸式增长,当然很大一部分数据是来自于像基因、影像等非结构化数据的增长。
大规模数据的增长给医院数据中心带来了5个方面的挑战:(1)存储容量不断增加、不断扩容、利用率低,使用不均衡,升级维护复杂,多厂商多品牌难以集中管理;(2)服务器数量不断增加,利用率低,而且不均衡,升级维护复杂;(3)数据中心空间紧张,能效不高,耗电量大,不能弹性伸缩;(4)运维管理方面,烟囱式架构,救火式运维,流程复杂,效率不高,自动化程度低;(5)容灾成本高,演练和切换流程复杂,备份恢复效率低。
302医院是最早使用虚拟化技术的医院之一,早在2008年,就开始使用当时最先进的vSphere技术,把物理机进行虚拟化,分配给不同主机使用;当时底层接的是外部传统存储。
在2016年前,由于已经使用虚机技术多年,传统存储最初使用时问题并不明显。但随着应用的增长,问题也随之而来:(1)存储交付,时间长达几小时或几天;(2)故障域大,一台主机坏了或者存储管理设备坏了就会导致很多个在上面的应用系统受影响;(3)当时的存储设备过于老旧,无法进行数据迁移,扩展性有限;(4)设备占用机房空间比较大;(5)无法满足高峰时期的门诊量访问,系统时有卡顿感;(6)运维人员管理难度大。
李源具体阐述了医院新上系统时的场景:存储管理员需要应对各种存储需求,如果是多个应用同时请求,存储管理员就要承担多个存储划分任务,需要确定正确的存储配置。从配置磁盘池开始做一系列复杂的步骤,再加上我院传统存储存在异构,磁盘性能不一致,造成分配管理时运维工作量比较大,耗时很长。而且,并不能确定分配的卷是否可以满足需求,毕竟传统存储不能做负载均衡,性能基本一刀切,并非量身定制的卷。
为了解决上述种种问题,302医院开始尝试软件定义存储。
迈向软件定义存储 实现零停机
李源谈道:“从软件定义存储衍生而来的超融合架构正在以每年64%的速度发展。Gartner预测:到2019年,全球企业级数据中心的存储空间将会有30%部署到以X86服务器为架构的分布式存储或超融合架构上。”
什么是软件定义存储?其核心是通过逻辑抽象和虚拟,将存储系统的控制平面和数据平面分隔开,建立一套独立于设备硬件的管理控制系统。其本质是由若干台服务器主机上的本地磁盘组,通过专业的算法融合成一套统一的存储系统空间。
软件定义存储拥有如下特征:允许用户自主选择通用硬件设备;硬件设施可支持横向及纵向扩展;支持异构存储资源的统一池化管理;支持存储和数据服务“解决方案”的渐进式建设;支持业务应用的不间断运行;允许管理员设置自动化的存储和数据服务的管理策略。
“在确定从传统存储转向软件定义存储之后,我们做了一系列对比研究工作,总体感受就是省钱、省时、省事、省电、省空间。”李源说,采用软件定义存储希望最终实现以下三个目的:
(1)实现存储的使用自动化,对异构存储池中的所有资源实施统一管理,提高存储整体利用率,同时降低系统管理的复杂度。使存储的使用像为每个虚拟机指定容量和性能那样简单。
(2)IT运维人员不必关心底层硬件,而是通过与硬件无关的虚拟化服务(如快照、克隆和复制)来部署所需的虚拟服务器,并按虚拟机进行调配和管理。 独立于底层存储硬件使得这些服务的分配极其敏捷和灵活。
(3)利用固态硬盘作为虚拟机的共享存储,可获得高性能、内置的恢复能力和动态可扩展性,并将存储总体拥有成本降低。
解决方案是传统存储和VSAN(虚拟存储区域网络)并存。据李源介绍,原平台是3 台 HP DL580 G7服务器上部署了 vSphere 5.1 企业版。每台服务器通过 2 块 FC卡连接到 2 台光纤交换机,后端连接了HP EVA4400 存储和 2 台 EMC VNX5300 存储,形成存储域网络,且网卡设计有冗余链路。其中的一台虚拟机上配置有 vCenter 管理服务器,组建了2 个 cluster 集群(HA-DL380 和 HADL580),通过这些配置实现了整个虚拟化环境。之前在上面的的虚机数量大概有80 余台。
新平台是新购 3 台服务器组建一个群集VSAN,每台服务器配置了 2 块 800 GB 的 固态盘 作为读写缓存、10块 4 TB磁盘作为数据盘,设置 2 个磁盘组,每个磁盘组使用 1 块 SSD 和 5 块4 TB的 磁盘,由于做了双副本,可用容量大概为 4 TB×10×3/2=60 TB。原有的 HP服务器组建另一个群集 DL580,2 个群集互不干扰。
改造后,分布式存储的架构有效提高了系统可靠性、降低了故障域。“我们进行了测试,当3 台主机中的一台发生了故障或者是某块硬盘发生故障,数据仍可正常访问。由于在其他节点设置了副本,因此可以做到当磁盘、网络或服务器故障时的零数据丢失率,确保在发生磁盘或网络故障时实现零停机,保证了我院业务的连续性。同时,可以做到存储资源和计算资源的同步增长。”李源说。
收益和性能对比分析
在成果收益上,传统存储一套下来采购成本是150万元左右,而VSAN方案的采购成本仅75万元左右;按照机房资源耗费成本5年计算,传统存储消耗的成本大约在20万元左右,VSAN集群消耗是在10万元以内;从机房空间来看,按照设备分类摆放需要占用三个机柜共20多U的空间,VSAN只需占用一个机柜6U空间。
在性能测试对比上,首先用Linux下的DD命令进行测试,因为该命令可以快速生成大文件,用来测试磁盘的读写速度。分别写入了4G、10G、20G的文件,综合结果来看平均性能得到了两倍的提升。之后,结合常用的VMware虚拟机功能进行了测试。用模板新建虚机,Windows2008环境、40GB的系统盘、实际数据约20GB。传统存储下虚机创建完成需花费27分钟,VSAN下仅需花费5分钟。节省了22分钟,效率提升达到400%。
目前只有一个应用在新老存储上同时运行,就是古老的FTP应用,我们分别在新旧存储上,用FTP传输同一个大文件,VSAN上的传输时间要比传统存储上的传输时间少一半。
“通过收益和测试的对比,以及一年时间的应用,我们认为软件定义存储已经很好地满足了我们的建设目标。”李源表示。
李源还进一步介绍了软件定义存储的缺点:(1)不支持传统存储的异构;(2)不支持大吞吐量;(3)性能不同的硬盘同池,按低性能硬盘处理;(4)VSAN只支持VMware的虚拟化方案;(5)分布式存储比较新,还需要时间进一步检验。
当然,还有更牛的解决方案:各种超融合一体机等,但是价格不便宜。
那么如何去选择?答案就是:选择适合自己的方案。那么如何选择适合自己的方案?李源认为需要三个步骤:一是了解自己,是要清楚自身的情况和要解决的问题;二是学习别人,学习别的单位成功和失败的经验;三是确定方案。“而且,这三个步骤的次序不可颠倒,尤其是第一步和第二步。”李源强调说。
近期热门文章:
HIT专家网∣最新鲜的医疗信息化资讯,不一样的专家视角
微信:HIT180com
投稿: public@hit180.com
商务合作:(010)823730