扫一扫
分享文章到微信
扫一扫
关注官方公众号
至顶头条
数据备份的技术是计算机应用中传统的技术,从早期的计算机操作系统,到各种应用软件都具备备份的功能,即便在各主流厂家、集成商,用户都在热烈的讨论LAN FREE、SERVER FREE的趋势下,数据备份也不是什么新技术。笔者这里有一个非常生动的例子能够形象的说明这点:很多人在开始学习计算机知识之初同时开始了电子游戏的生涯,如果你玩过中大型的游戏你就会很清楚,你在进行游戏的时候可以在任意的时间把当前的游戏状态保存下来,这样你在下次玩的时候能够很容易的把游戏恢复到你上次玩的状态。这就是备份要解决的问题,数据状态的保存和恢复——通过备份把你的应用快速恢复到你需要的时间点状态。
回顾备份技技发展的过程,从最早的操作系统备份命令,到应用软件系统的备份功能,再到专用的备份软件、硬件和备份系统,数据量从几十、几百字节到今天的几百TB甚至几十PB,用户对备份的要求越来越高。时过多年笔者依然记得在DOS手册中对软盘的备份要求,每天备份一次,得到原盘和备份盘二张数据盘;第二天要把昨天的数据盘和备份盘再备份,这样备份数据依次需要1张、2张、4张、8张、16张、32张,直到保存好64张软盘为止,现在的用户也许不能想象在那样的技术条件下对一份数据进行大量的手工操作和耗费的资源,但这是当时的真实情况,而且更是当时技术条件下能够实现的最高的安全保准,到今天依然有很多用户保持着多份磁带备份并异地保存而达到异地容灾目的的备份策略。从长期的应用中得到的经验证明,这是最安全、经济的数据保护方法。
可是即使在备份技术经过长期发展的今天,我们国内的很多用户出于种种原因,对备份技术、产品、策略和系统的应用存在很大的误解,先是认为备份工作因为投入大,成效低而忽略,不能正确的采用备份措施,甚至很多用户只有在遭受了数据丢失带来的巨大损失后才意识到要采用数据备份来保证安全,可恰恰在这样的条件下,又犯了所谓病急乱投医的错误,迷信个别产品或技术,不能正确选择备份技术产品和方案,更不能有效的组织自身的技术力量和资源。
如何选择符合应用条件的备份产品?如何部署恰当的备份方案?这首先要对备份技术和产品,对数据安全和系统的安全性有正确的认识。片面的听从个别厂家的宣传,片面的追求备份的高数据量和高性能都是选择备份技术的误区。
数据备份的技术是计算机应用中传统的技术,从早期的计算机操作系统,到各种应用软件都具备备份的功能,即便在各主流厂家、集成商,用户都在热烈的讨论LAN FREE、SERVER FREE的趋势下,数据备份也不是什么新技术。笔者这里有一个非常生动的例子能够形象的说明这点:很多人在开始学习计算机知识之初同时开始了电子游戏的生涯,如果你玩过中大型的游戏你就会很清楚,你在进行游戏的时候可以在任意的时间把当前的游戏状态保存下来,这样你在下次玩的时候能够很容易的把游戏恢复到你上次玩的状态。这就是备份要解决的问题,数据状态的保存和恢复——通过备份把你的应用快速恢复到你需要的时间点状态。
文件系统备份——专用备份软件
还是以电子游戏为例,当玩家保存游戏进度时实际上是利用游戏本身的备份功能生成一个文件,这个文件包含了当前游戏进度中所有参数的指针,如时间,环境,角色,角色的各种属性,图像,音效,显示动画等等。熟悉操作系统的玩家可以自由的在本地的文件系统中找到这个文件。但仅有这个进度文件,没有游戏软件的运行,并不能够对游戏进行恢复。如果玩家把这个文件拷贝出来,必须复制到另一台计算机中的同样、同版本的游戏的相应目录中,那他就才可以在这第二台计算机中从这个备份文件定义的游戏状态开始继续他的人机大战。如果另一台计算机中没有同样、同版本的游戏,那这个进度文件就不能恢复。
我们知道一个游戏安装在一台计算机中实际上是一系列文件的复制过程,针对游戏这个应用的数据备份必须将游戏软件的全部文件进行备份。在游戏安装在计算机时,安装好的游戏软件相当于一个应用的初始化状态,而这个游戏并没有启动,所以这个状态完全是一系列的游戏文件保存在计算机的文件系统中,如果加上计算机操作系统的文件全部复制出来,相当于将这台游戏计算机的全部数据进行了备份。在之后的游戏过程中,一个游戏的进度文件,对于游戏这个应用相当于一个增量的备份,一个玩家可以以一个或多个角色开始游戏,他每次的开始都可以在他人机对话的任意时间点生成一个游戏记录文件,同理,多个玩家也可以在这台计算机上进行这个游戏,生成更多的记录文件。这些记录文件相当于应用数据的增量,将这些记录文件全部复制后,再加上这台计算机的初始状态的文件复制数据,就能够在本地或其他的计算机上完全恢复这个游戏的应用。这就是文件数据备份的原理。
操作系统,应用程序(包括数据库等)的备份原理都是如此,即使是现在功能强大的专业备份软件也是一样:把备份目标计算机的目标文件复制到其他计算机的存储介质中,并在需要是从备份介质向应用系统的存储设备恢复。目标文件可以选择或者包括该计算机操作系统的全部配置文件,这样在需要的情况下恢复文件,应用,直至该计算机的操作系统。
这样的备份工作一直延续到今天,当然手工的操作变成了由专业备份软件承担并且能够实现无人值守的备份系统;单一的磁带保存更发展出离线和近线备份并结合了远程网络;存储介质除了传统的磁带更有DVD光盘库、虚拟磁带库等存储介质;一代又一代升级、发展的应用技术使数据量和性能达到了令人瞠目结舌的地步。但传统的备份原理始终保持到今天,即文件备份。
数据备份的目的就在于恢复。能够在多种数据损坏的情况下恢复应用数据才是数据安全性的保证。这样我们都能够理解数据备份份数越多,保存地点越分散,那数据的安全性就越高。在这样的情况下,传统的磁带备份和光介质备份具备无可替代的优势,他们能够以低廉的成本(仅限于存储介质)实现多份的备份,并可以不需要任何计算机设备而仅仅把这些介质保存到任意的地点。当然他们的缺点也很突出:备份时间长,恢复时间长,特别是依靠异地保存的数据进行恢复时,用户还必须承受数据介质运输的往来时间。虽然听过LAN FREE方方式可以不消耗局域网的资源而进行数据的传输,但在备份和恢复时必须通过目标计算机的文件系统,这样会耗费甚至全部占用目标计算机的资源而使目标计算机应用停顿,所以也把这种备份方式称为离线备份。
随着磁盘阵列技术的发展,很多厂家退出了虚拟磁带库产品,它是利用磁盘阵列提供存储空间,并将这些存储空间虚拟成磁带空间,这样提供给备份软件中生成的虚拟磁带驱动器使用,把磁盘阵列的磁盘空间转化为磁带方式来进行访问,从而进行数据备份所需要的数据存储和读取。众所周知磁盘阵列在数据量,特别是在数据吞吐量上具备很高的性能,这样的应用使在进行备份工作时可以大大缩短数据复制和恢复过程所消耗的时间,这种方式为近线备份。这样的应用在虚拟化上更具备配置灵活,功能强大的特点,结合磁盘阵列技术不仅提高了数据的检索和读写速度,更可以为这份数据提供RAID等基于磁盘阵列技术的安全保障。但我们也知道磁盘阵列必须被主机连接(作为虚拟磁带库的磁盘阵列与备份服务器直连),所以这种方式必须部署在用户的备份系统中,如果需要2次备份则需要再投资,更不能离线保存,同时它也存在离线备份对目标计算机资源的消耗。
磁盘备份——块拷贝
以上讨论的备份方式都是基于文件系统的备份,而基于块拷贝的备份方式则完全不同。随着磁盘阵列技术的发展,又诞生出了块拷贝技术,顾名思义,它是通过对block块的复制来实现的。简单来说,就是将一个逻辑卷中所有的数据块拷贝到另一个逻辑卷中,比如在一个游戏的应用中,虽然游戏的进程在CPU,CACHE中运行,但被游戏进程调用的文件和数据保存在磁盘中,在这样的状态下,如果完全相同的游戏文件和数据从被应用的磁盘保通过磁盘镜像的方式保存到另一个磁盘中,那当应用磁盘发生故障时,游戏还可以正常的进行。在磁盘阵列中应用这样的复制技术,由磁盘阵列的控制器完成,占用磁盘阵列的缓存,这样可以在复制和恢复的过程中不消耗任何的主机资源,同时获得最高的性能,在复制和恢复过程中消耗最少的时间。因为具备这样的高性能,主机在需要恢复数据时,甚至可以直接访问备份的数据,所以这是在线备份的备份方式。
块拷贝的备份有两种方式,首先是逻辑卷对逻辑卷的全备份,必须使用两个空间大小完全相等的逻辑卷进行,将目标卷中的每个block都完全拷贝到新的备份逻辑卷中,恢复也必须完全逆向拷贝,从而实现备份和恢复。另一种就是对目标逻辑卷历史状态的记录,在现有的技术条件下,块拷贝可以利用block的位图(Bit Map)生成位图文件,这个位图文件按时间点给每一个block定义一个指针,这样利用这些指针,指向每个block在该时间点的状态,从而生成一个时间点的历史备份文件。当利用这个文件进行恢复时,必须依靠原有的全部block,按照位图指针将每个block恢复到备份时间点的状态,从而将整个逻辑卷恢复到目标状态。
应用的需求
前文只是简单介绍了这些备份技术的原理和特点,他们的具体产品,应用方案,实际性能,功能优势等等细节都是当今的最高科技成果,这些高新技术为用户应用数据和应用服务的安全提供了多重保护。可令人遗憾的是,目前我国广大用户的安全意识还很淡泊,对备份的需求和认识也很不足。在越来越多的用户越来越依赖计算机系统开展其经营、工作业务的同时,他们对备份技术的认识、需求和实际应用远远不足,这才是本文要重点讨论的。
数据的安全
虽然很多用户对备份的认识并不正确,虽然普遍认识到确保数据的安全是他们经营、工作业务的基础。但他们总希望利用高可靠性的设备,自动的系统来保证他们数据的安全。这是目前国内用户普遍存在的误区,如果单纯考虑数据的安全性,那无疑要增加备份数据的份数,并在异地保存。
备份数据越多,保存地点越多,保存地点之间距离越大,那数据就越安全。
当然备份数据介质的储存和运输的环境和安全性也影响到整体的安全级别。所以即使在网络备份等等应用技术非常发达的今天,在计算机技术高度普及的西方,还是有很多用户选择专业的数据保安公司为他们提供备份数据介质的异地保存服务,这些数据保安公司在不同地点建设好介质仓库,仓库的环境最符合保存数据介质的要求,同时在运输,保存的全过程种由专业的武装人员执勤,保证数据介质的最高安全。这种高安全保准下异地保存的数据是用户数据的最终防线。
我国虽然还没有专业的数据保安服务,但用户依然可以利用自身和社会的资源实现多份数据介质和异地保存的安全措施来保护数据,毕竟这才是最有效的措施,是数据的安全底线。一个没有高业务连续性压力的用户完全可以采用离线备份的简单措施,以较低的成本获得最大的数据安全保证.
历史数据的恢复
用户在持续的应用中,他的应用数据不仅在时间的推移中增长,也因为业务变化而变化,所以在备份工作要记录下这些变化,必然造成大量的历史数据的积累。在离线、近线和在线备份方式中,都能够支持历史数据的备份和恢复,是不是说明他们对备份历史数据没有区别呢?首先离线和近线方式使用专业备份软件进行,他们在记录历史数据时可以采用增量备份的方式以压缩备份数据量,单随着用户应用数据的膨胀,还是要求存储空间的不断增加。而在线方式给历史记录生成了时间点指针文件,根据多点备份来记录不同时间点的数据状态,这些文件都要消耗磁盘空间,在总数上必须有数量的限制。这三种方式根据应用的存储介质的不同,决定了他们能够提供的存储空间不同限制。离线备份采用的时磁带或者光介质,决定了它没有存储的空间的限制,是公认的低成本的海量存储的方式,而近线和在线方式因为使用硬盘作为存储介质,它的存储空间必然受到磁盘阵列设备的容量限制。
应用的安全性和数据的安全性不可混淆,在一个应用系统中,各种计算机设备,网络,操作系统,数据库,应用软件都影响到这个应用系统是否能够提供7*24的持续服务。当然如果一个用户的业务需要它的计算机系统提供7*24的连续性服务,那他在考虑备份策略时必须以快速恢复为出发点,从而部署他的备份系统。备份的目的当然不是为了尘封着汗牛充栋的数据介质,用户花费了巨大的财力和人力就是为了在数据丢失时能够恢复。快速恢复在连续性应用发生数据丢失时则由为重要。一般来说,在线备份的恢复时间以分钟为计算单位,而近线备份以小时为单位,离线备份则需要更多的时间,如果是远距离的异地保存则可能需要几天。
如何选择备份策略时要从自己的业务连续性需求出发,没有业务连续性需求那选择离线备份就能够满足;而能够接受几个小时的业务中断则考虑部署近线备份;如果由更高的要求则只能选择在线备份的措施。在目前市场上已经存在了高可用的解决方案,它使用冗余的设备保证单台物理设备故障对应用没有任何影响;在线备份以达到以分钟为单位的数据快速恢复。同时为了保证数据的最大安全性结合使用离线备份和存储介质异地保存,当然这样的系统意味着巨大的投资和维护成本。
所以一个用户必须深入分析自己的需求,针对自己在业务连续性,历史数据保存,和数据安全性的具体需求选择在线,近线或是离线备份,也可以综合部署,实行应用安全与数据安全同等的最大安全措施,针对性的满足用户的需求。而多种可选择的方案也为用户节约投资提供了最大的可能性。
用户对数据备份的认识不高是我国普遍存在的现象,它带来的附面影响非常大,不但影响整个计算机行业的发展,更给用户自身的数据安全带来极大的隐患。很多用户只看到在投资备份系统,进行备份工作需要财力和人力资源,而得到的却是 “使用不到的存储介质”,以为有了RAID技术和冗余的磁盘阵列等存储设备就可以高枕无忧,完全不去设想一旦数据丢失造成的灾难性损失。而在计算机系统越来越复杂的今天,简单的安全措施以远远不能保证整个系统的安全,数据备份是保证应用数据的最后防线。有经验的玩家都会有因为游戏记录文件的丢失而使自己恼羞成怒的经历,那对于比娱乐关键千万倍的业务应用来说,对于相当于一个企业的生命的应用数据来说,周密而安全的备份工作不应该得到各级领导的最高重视吗?
如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。