一文理清:如何设计医疗综合业务系统备份方案
信息化建设已成为医疗行业的主流,医院在日常运营的各个方面都是依靠不同的信息系统,这些信息系统每天都会产生大量的数据,这些数据是医院重要的资产,需要通过各种技术来保障数据的安全。但是由于不同信息系统的业务模式、数据特点各有不同,在对这些数据进行保护的时候就需要从多个方面综合考虑,设计出符合各系统特性的数据保护方案。本文以医院中常见的HIS、PACS和ERP系统为例,从不同的角度分析各系统的特点,设计对应的数据保护方案。
医疗信息系统数据保护需求分析
HIS系统数据保护需求
HIS系统是医院主要的业务系统,其数据量大小一般与所属医院的规模及业务量有关。80%左右的数据都是结构化数据,另外有20%的数据为非结构化数据。目前各医院HIS系统存储选择传统的SAN存储的比例比较高。经过分析,目前HIS系统的数据保护分三类:
第一种是备份,主要应对的是介质损坏、误操作等原因造成的数据丢失。备份数据的保留时间在半年左右,在出现故障时使用备份的副本对数据进行恢复即可。
第二种是归档,由于国家没有对HIS系统数据做强制性的保存年限要求,各个医院的需求也都不同。
一般三甲医院保存年限要求在5年以上,社区门诊保存年限一般在3年左右。归档后使用的几率非常小,使用时将存档的时间重新回调即可。
第三种是迁移,在某些特殊场景下,业务系统需要调用1年左右的历史数据。对于这些冷数据,如果还是存放在主存储,对目前比较珍贵的存储空间而言比较浪费,成本也比较高;如果完全归档到离线存储,调用时需要的操作繁琐,时间也比较长。比较合适的方案就是使用分层存储结果,设置基于策略的迁移,这样可以在成本和性能方面得到一个比较好的平衡。
综上所述,对HIS系统的数据保护需要从备份、归档和迁移三个方面来进行设计和规划。
PACS系统数据保护需求
PACS系统是医院的影像管理系统,以非结构化的图像、视频和文本类数据为主,而且数据增长速度非常快,在整个医院数据存储中占的比重最大。在数据存储的选择方面,NAS类型的存储都比较多,但SAN类型的存储也在使用。PACS系统的数据存储多采用大集中的存储方式,数据量和增长量特别大,数据保护方面比较有挑战性。经过分析,目前PACS系统的数据保护分两类:
第一种是备份,主要应对的是介质损坏、误操作等原因造成的数据丢失。备份数据的保留时间在半年左右,在出现故障时使用备份的副本对数据进行恢复即可。
第二种是归档,基于法规遵从方面的,医疗影像数据保存年限要求在15年以上。归档后使用的几率非常小,使用时将存档的时间重新回调即可。
综上所述,对PACS系统的数据保护需要从备份、归档两个个方面来进行设计和规划。在备份设计时尤其需要关注大数据量和快速增长带来的挑战。
ERP系统数据保护需求
ERP系统是医院的综合管理系统,其数据类型以结构化数据为主。数据量依医院规模和业务量而定,和PACS等系统相比不算大。一般采用SAN存储。ERP数据的保护一般是以备份和归档为主:
第一种是备份,主要应对的是介质损坏、误操作等原因造成的数据丢失。备份数据的保留时间在半年左右,在出现故障时使用备份的副本对数据进行恢复即可。
第二种是归档,大部分医院的ERP数据会保存5年以上。归档后使用的几率非常小,使用时将存档的时间重新回调即可。
医疗信息系统数据保护策略设计
确定了各信息系统的数据保护需求,就可以针对备份需求设计备份方案。在进行需求分析时,分析的角度是基于各个业务系统的;但是是进行方案设计时,需要从选项产品的角度来设计。在需求分析和方案设计之间,就需要我们将数据保护需求做抽象转换,使之可以和备份方案相互匹配。我们从数据类型和备份存储两个维度来匹配各个系统的数据保护需求。
医疗信息系统的数据类型汇总
我们对各个医疗信息系统的数据保护的需求分析中,不管是哪种类型或规格的保护,最终都是对数据的处理和保护。从医疗信息系统的角度,有两种类型的数据:
1. 结构化数据:具备统一的数据结构或格式,一般在数据库中以二维表的形式存在。
2. 非结构化数据:不具备同意的数据结构或格式,如图片、文本、网页、视频等数据。
当我们设计备份方案,使用备份软件或数据管理软件来保护数据时,从备份软件的角度看,数据有以下类型:
1. 普通文件:多为非结构化文件,文本、声音、图像等,在操作系统里以文件或目录方式存在,或者存放在NAS存储里,供其他系统使用
2. 数据库或应用程序文件:如Oracle、DB2等数据库的数据文件;exchange、lotus等邮件系统文件;可以对应到医疗信息系统的结构化数据
3. 操作系统:如windows、linux、aix等操作系统
所以,医疗信息系统的数据保护要求,可以通过备份软件,以备份普通文件、数据库、应用程序或者操作系统的方式来实现。
备份方案的存储策略分析
经过对HIS、PACS和ERP系统的数据保护需求分析,发现三套系统共有备份、归档和迁移三种数据保护要求。三套业务系统产生的数据具有生命周期的特性,与之对应的是,存储系统依据其特性也有分层的特性,如下表所示:
一般来说,现有的生产业务系统产生的热数据都是直接存放在服务器内置存储、生产SAN或NAS存储上的,这些数据被处理和调动的频度非常高,对性能和稳定性有着非常高的要求。随着时间的推移和业务的变化,热数据会变成温数据。数据被调用和处理的频道降低,对数据处理和调用的要求也会降低,但在一定的期间内还是有可能会用到,此时这些温数据存放在在线存储就不太合理了,除了浪费宝贵的在线存储空间,还有可能影响现有热数据的处理速度。可以通过策略将这些温数据迁移到近线存储上,这里的近线存储可以是高密度大容量的NAS存储,也可以是虚拟磁带库。当数据变成冷数据,极少或完全不被使用时,可以将数据归档到磁带存储中进行离线保存,当然,大容量、周期长、使用几率小的备份数据也可以存放在离线的磁带存储中。
受保护的数据根据其生命周期的特性进行分层存储或备份时,可以最大限度的利用各级存储的特性,得到更高的综合收益。通过备份数据管理软件,这些备份数据可以根据实际需要在各层级存储间流动。
除此之外,分级存储也可以被用来实现多层数据保护。比如备份数据基于性能考虑首先将备份数据备份到虚拟磁带库中。然后再通过策略将虚拟带库中的备份数据复制到物理带库中离线保存,通过这种D2D2T的方式增强数据的保护。
医疗信息系统的存储设计
在确定了数据保护的分层存储设计后,还需要对分层存储的容量、性能、冗余等方面做规划设计,使得设计的备份系统可以满足现有的备份需求及未来的扩展。
备份存储的容量设计考虑
信息系统的数据备份最终要存放到备份存储中,备份存储可以是磁盘存储、虚拟磁带库或者物理磁带库。在规划设计数据备份存储时需要从多个方面进行考虑,最终估算出备份存储的空间需求,规划时需要考虑的因素包括但不限于如下几点:
1. 确定数据保护的方式,如备份、归档、迁移
2. 确定需要保护业务系统的数据类型以及现有的备份软件是否支持该类型
3. 确定要进行数据保护业务系统的数量、备份频率、保留周期、保留版本等因素
4. 确定要进行数据保护业务系统数据量的增长率
5. 根据备份明细和备份数据增长率估算需要用到的备份存储空间
根据这些因素可以估算到备份存储的空间,如果采用分层存储,还需要考虑多层存储之间是迁移关系还是复制关系,以进一步明确存储的空间需求。
备份系统的性能设计考虑
在进行数据备份方案设计时,除了数据空间要求还要考虑性能要求。从备份的角度来看就是RTO和RPO是否可以得到满足。再进一步也可以归结为备份窗口的需求。应该对现有的环境情况做充分的评估,确保方案可以满足用户的需求。可以先获取到用户期望的备份窗口,然后再根据现有主流的软硬件参数去做对比分析。比如对于一个主流的环境,使用的千兆LAN网络和8Gb的FC网络。要求数据库必须在2小时内完成备份。假设当前最大的数据库为1TB。则备份需要达到的速度为:1*1024*1024/(2*3600)=145.6MB/S。这个速度千兆的LAN网络是肯定达不到的,这时就需要规划采用san网络进行备份。
8GbFC网络理论上最大的传输速度可以达到1GB/S,可以满足当前的备份速度要求。如果备份的速度要求更高,可以通过增加驱动器并行度、使用多个独立的HBA卡平衡流量等方式来提升备份速度,直到可以满足指定的备份窗口。
跨站点的异地容灾备份系统
目前基于本地的数据备份方案可以解决本地数据保护问题。但是对于一些大型的灾难,比如地震、火灾等事故无法做到全面的保护。基于异地的备份系统可以很好的解决这种故障。根据资金投入和RPO、RTO的要求,目前有两种类型的方案:
第一种是基于备份磁带的异地存放。即还是采用本地备份系统,但是备份数据会备份到或者导出到磁带里,导出的磁带定期运输到异地保存。当发生故障时利用异地保存的数据磁带重建业务系统进行数据恢复。
这种方案的优点是结构简单,成本低廉。缺点是效率低下、RTO过大,真正的做数据恢复时耗用的时间过长,丢失的数据也比较多。
第二种方案是通过网络将备份数据传输到异地的数据中心。这种传输可以通过硬件设备来做,比如EMCdatadomain或IBMProtectier虚拟磁带库都支持异地复制;也可以通过备份软件来做复制,如TSM的servertoserver、nodereplication或者NBU的AIR等特性。
上文摘自《医疗行业数据存储备份方案设计架构参考手册》,该手册适合有一定存储技术基础、对数据保护技术感兴趣的IT技术人员、医疗行业信息中心技术支持人员、架构设计人员,以及为医疗行业提供IT技术解决方案的集成商和软件开发商。目录如下:
点击阅读原文可以下载手册
长按二维码关注公众号