查看原文
其他

备份和归档有什么区别?| 小知识

twt社区 twt企业IT社区 2022-07-03

备份和归档是现今企业中最流行的两种数据保护方式,那么这两种数据保护方式各自的含义是什么,二者又有什么区别呢?


备份(Backup),含义是创建一份数据对象的拷贝,便于数据恢复时使用。一个数据对象可以是一个文件或一个用户定义的数据对象。某些情形下,你可以做多个版本的数据备份,每个版本发生在不同的时间点。这些版本作为一组备份和原始数据对象紧密相关。如果在客户系统上,原始数据对象崩溃或丢失,可以从服务器发送一个备份的版本到客户端,即执行恢复操作。一般来说,会采用最近一次的备份版本来做恢复,但你也可以从现存的备份版本中任选一个版本做恢复。备份版本的数目可以通过在服务器上作定义来控制。当有新的版本被创建时,老的备份版本可以被自动删除。

归档(Archive)含义是创建一个文件的拷贝,作为storage repository里的一个独立对象存在,且要保留特定的一段时间。一般来说,你使用这个功能来创建一份数据的拷贝,主要是出于历史目的加以保存。重要的记录(出于法律或其他商业原因,数据必须被保存)一般会被作为归档的对象。一旦在服务器上完成了归档拷贝,你可以选择在源系统上删除原始数据。(via@聂奎甲)


先从对应场景来说吧。

一般情况下,我们把用于恢复目的数据保留称作备份。这类数据一般变化较大,保留时限较短。仅仅是为了应对数据丢失来设计的。

而归档,一般对应的是长期存放,数据变化量相对较小,比较多的场景是基于法律法规要求的以年为单位的数据保留,应对的数据审查等操作。

再从备份软件设计的角度来看。

这里以tsm为例,如果是数据备份,备份软件里对应的有数据保留的活动版本、非活动版本、删除版本以及非活动版本和删除版本的保存期限等参数(copygroup的verexistes、verdelete、retextra、retonly四个参数)。能比较灵活的应对备份数据的各种需求点。

对应归档来说,没有非活动版本的概念,每个版本都是活动的,只能以时间来界定(copygroup的retver参数)。

针对刚刚谈到的归档和备份的区别,根据第一点提到的需求差别,可以灵活的选择即可,比如:

对于大多数的普通文件、sql数据库、IBM domino、MS exchange等数据保留都可以通过上面说的副本组参数来灵活配置。

对于db2和oracle分别由程序自身来控制,db2使用db2adutl,oracle使用rman。

当然,也有一些特殊情况,比如db2的归档日志存放,或者sap的数据保留也会用的归档模式,这里根据备份和归档的设计差别,也可以解释的通。

通过上面的解释,在选择数据保留方式时,基本可以很好的做出选择。(via@王巧雷)


备份可以创建数据的副本(文件、数据库等),用于防止因为人为错误、系统崩溃和自然灾害造成的数据丢失。当原始数据丢失时,可以通过获取数据副本来获得想要的数据。备份适合快速恢复大量数据的场景。但是,由于数据的快速增长,备份环境可能需要不断拓展,这对于备份管理员而言是一件头疼的事情。磁带和磁盘提供高可靠性,通常被用作备份的介质。但是,如果一个备份系统没有使用合适的数据管理软件,它就会显得非常低效甚至无效。如果企业决定长期保留数据,那么对备份系统的投资花销、时间成本以及专业人员数量都会有较高的要求。总而言之,备份主要是复制那些经常需要读取或更新的在线数据。

文件归档是现今另一种数据保护的流行形势。由于归档使用相对较便宜的存储介质(如磁带),并且可以离线存储,所以归档可达到减少开支和方便存放介质的目的。文件归档系统还可以根据文件属性来保存文件。这些属性可以是作者、修改日期或者一些其他的自定义标签。归档系统会保存文件本身以及它们的元数据和属性。此外,归档系统还会提供压缩功能。总而言之,归档主要是将不再需要经常读取或更新的备份数据长期离线保存,并按属性打上归档标签,方便将来的搜索。

备份和归档系统的目的是不同的。它们应当一起被用来实现数据的保护。备份主要用于保存数据的副本,达到数据保护的目的;归档作为数据管理的一种方式长期组织并保存数据。换句话说,备份可以认为是短期保存副本,而归档则被认为是长期保留文件的方式。在现实生活中,你通常不会在备份之后删除原始副本。但是,一旦文件被归档了,原始文件就可以被删除了,因为我们很可能不再需要去快速获取它了。备份和归档相辅相成,配合一起使用可以更好的保护数据。(via@戴尔易安信技术支持)

 资料/文章推荐:


长按二维码关注公众号

*本公众号所发布内容仅代表作者观点,不代表社区立场

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存