首页 > 范文大全 > 正文

数字图书馆数据备份系统方案的规划

开篇:润墨网以专业的文秘视角,为您筛选了一篇数字图书馆数据备份系统方案的规划范文,如需获取更多写作素材,在线客服老师一对一协助。欢迎您的阅读与分享!

[摘要]本文针对当前数字图书馆对于数据备份的认识不足和技术缺陷,分析了数字图书馆对数据备份的需求,提出了数据备份系统的建设原则。在该原则的指导下分别对数据备份设备的选择、数据备份软件的选择、数据备份策略的制定以及在数据备份方案实施过程中应该注意的问题及数字图书馆数据备份系统方案的规划进行了论述。

[关键词]数字图书馆;数据备份;信息资源

[中图分类号]G258.93 [文献标识码]A [文章编号]1005-3115(2009)12-0094-03

数字图书馆在互联网技术、计算机技术、现代存贮技术的支持下以内容管理为核心。以海量信息处理、知识发现与技术加工为主要手段。以基于数据库和信息库的形式给大家提供了一个方便快捷的检索平台和信息中心。

数字图书馆作为网络信息资源的先进管理模式,核心是海量数据资源的管理和提供利用。数据资源是数字图书馆的基础,数据一旦破坏和丢失都将使数字图书馆的业务遭受致命性的损害。同时。计算机系统故障的发生也是多方面的,从计算机数据管理的角度看。小到误操作导致系统的破坏及丢失,中到硬件的损坏、存储介质的损坏,大到自然因素导致的火灾、地震、水灾等其他突发事件,都使数字图书馆的数据安全受到威胁。因此,建立可靠的数据备份系统保护数据安全。是数字图书馆建设的一项重要内容。

一、数据备份需求分析

计算机技术和通信技术作为数字图书馆的支撑技术,在信息的收集、处理、存储、传输和分发中扮演着极其重要的角色,大大提高了工作效率。但是。数字图书馆也面临一些问题,如系统失效、数据丢失或遭到破坏都时刻威胁着数字图书馆数据资源的安全。

(一)计算机硬件或软件故障

硬件故障主要指硬盘驱动器损坏,由于机器的物理损坏导致文件、数据的丢失;软件故障指系统参数设置不当,或由于应用程序没有优化造成运行时系统资源没有合理分配,或数据库参数设置不当等。

(二)外部人为破坏或自然灾害的破坏

这方面的破坏主要包括计算机被盗造成数据丢失;黑客侵入计算机系统,破坏计算机系统,造成数据丢失;病毒使计算机系统感染,损坏数据;自然灾害,如水灾、火灾、地震等毁灭整个计算机系统;电源浪涌,即一个瞬间过载电功率损害计算机磁盘驱动器上的文件;磁干扰,生活、工作中常见的磁场可能破坏磁盘中的文件。

(三)操作错误或对数据备份认识不足

在现实生活中,常见的操作错误包括人为删除文件或格式化磁盘等,这类问题的比例大约为80%。另外,管理人员对数据备份重要性认识的不足也是导致数字图书馆数据灾难的一个重要原因,廖利娟、杨应全在《高校图书馆数据备份调查分析》一文中指出:“在对当前部分高校(包括高等专科学校、学院、大学)图书馆的调查中得知备份意识淡薄的占12%,备份管理松散的占17%,存在侥幸心理的占24%。部分图书馆数据备份操作员无制度约束,对数据备份操作感到麻烦,存在侥幸心理,对备份媒体管理责任心不强,备份手段落后,这些都是造成数字图书馆数据灾难的隐患。

(四)备份媒体管理失控

在实际工作中,有的数字图书馆的数据备份工作做得很完美,但是,由于备份媒体得不到妥善管理也会造成数据灾难。以磁带备份设备为例。已经写入了备份数据的磁带应该归档存放,如果已经写入了数据的磁带继续放在磁带机里面,下次备份时新写入的数据就可能覆盖原来的数据,由此造成数据丢失。

二、数据备份的原则

对数据进行备份是为了保证数据的安全性,以达到数字图书馆的容载目的,最大限度地减轻数据丢失和毁损带来的灾难性后果,不同的应用环境要求不同的解决方案来适应。一般来说,数字图书馆的数据备份系统方案规划要满足以下原则。

(一)稳定性

数据备份的主要作用是为数字图书馆提供一个数据保护的方法,稳定性是其最重要的一个方面。数据备份一定要做到与操作系统的完全兼容,以达到备份系统的稳定性。

(二)全面性

在复杂的计算机网络环境中,可能包括了各种操作平台,如NetWare、Windows、Unix等,并安装了各种应用系统,选用的备份系统要能支持各种操作系统、数据库及各种典型应用。

(三)自动化

数据备份方案应能提供定时的自动备份,在自动备份过程中,还要有日志记录功能,并在出现异常情况时自动报警,这样就能减轻管理员的工作量,实现智能化的数据备份。

(四)安全性

计算机网络是计算机病毒传播的高速通道,给数据安全带来极大威胁。如果在备份的时候把计算机病毒也完整地备份下来,将会形成一种恶性循环。因此,在备份过程中要注意查毒、防毒、杀毒,确保无毒备份。

(五)简单性

数字图书馆的数据备份系统应用于不同的领域和应用程序中,进行数据备份的操作人员也处于不同的层次,这就需要一个直观的、操作简单的用户界面,以缩短操作人员的学习时间,减轻操作人员的工作压力,使备份工作得以轻松地设置和完成。同时,为了适应数字图书馆内部局域网的有效扩展,应该以备份服务器形成备份中心,对各种平台的应用系统及其他信息数据进行集中式的备份,系统管理员可以在任意一台工作站上管理、监控、配置备份系统,实现分布式处理、集中管理的特点。

三、数据备份方案的制定

一套完整的数字图书馆数据备份系统方案的规划包括硬件选择、容量确定、软件选择、策略的制定等,下面分别来介绍这几个方面。

(一)数据备份硬件的选择

数字图书馆的数据备份,就是使用较低廉的存储介质,定期将系统内部数据备份下来,以保证数据意外丢失时能尽快恢复,将用户的损失降到最低点。常用的存储介质有磁盘、磁带、光盘和磁光盘等,其中磁带的容量大,操作方便,易于保管,在大容量的数据备份方面应用得比较普遍,适合于数字图书馆的数据备份。

目前,磁带技术与产品主要分DLT和LTO几种。8mm采用螺旋扫描技术,是Exabyte公司的独立技术,但由于技术不开放,使得产品的市场占有率较低。HDLT原为Quantum公司的专利技术,现以OEM方式向多厂家开放,在大容量磁带存储市场上DLT技术占据了主导地位。目前,市场上使用的DLT8000磁带机是技术最成熟的磁带设备,它的读写速率压缩后可达12M/S,最新由HP,Seagate及IBM等厂商推出的ultrium磁带机采用LTO技术,这是一项开放的标准磁带技术,可确保来自不同厂商的ultrium磁带机实现数据的互换性。该磁带机可在两小时之内。将200GB压缩数据备份到单盘磁带上,从而将备份性能提升到新高,高达30MB/S的传输速率可实现更快速的数据备份和恢复。因此,在选择大容量磁带备份设备时,DLT和LTO磁带库应该是首选。在数字图书馆的建设中,磁带库通过SANl6J(Storage Area Network一存储局域网 络)系统可形成网络备份系统,实现数据的远程备份,”达到数字图书馆数据备份系统简单化、智能化的要求和分布式处理、集中管理的特点。

(二)数据备份容量的确定

确定数据备份容量的大小通常考虑以下几个因素:

数字图书馆内部网络中的总数据量,假定为01。

数据备份时间表(即增量备份的天数),假设用户每天作一个增量备份,周末作一个全备份,则d=6天。

每日数据改变量,假定为Q2。

期望无人干涉的时间,假定为3个月,则m=3。

数据增长量的估计,假定每年以20%递增,则i=20%。

考虑坏带,不可预见因素,一般为30%,则u=30%。

通过以上各因素考虑,可以较推算出备份设备的大概容量为:c=[(Ql+Q2*d)*4*m(1+i)]。(1+u)。

根据C的大小和单盘磁带的容量,再考虑一定容量的冗余,就可以选择需要多少槽位的磁带库。

(三)数据备份软件的选择

目前流行的数据库如Oracle,Sybase,MS-SQL等,均有自己的数据库备份工具,它们不能实现自动备份,只能将数据备份到磁带或硬盘上,不能驱动磁带库等自动加载设备,因此,必须采用具有自动加载功能的磁带库硬件产品与数据库在线备份功能的自动备份软件。

目前流行的备份软件有多种。如Legato NetWorker、CA ARCserve、HP OpenView OmnibackII、IBM ADSM及Veritas公司的NetBackup等。它们都具有自动定时备份管理、备份介质自动管理。数据库在线备份管理等功能。其中,Legato、Veritas和CA是独立软件开发商,注重于对各种操作系统和数据库平台的支持,而HP和IBM等更注重于对本公司软硬件产品的支持。

在小型机或工作站设备占主流的应用环境中以及在多平台操作系统和拥有多不同数据库的环境中,HP?Omnibackll拥有绝大部分的用户市场。在微软操作系统平台上,CA公司的ARCServerlT备份软件具有一定的竞争优势,但其只适合于单一平台下的数据在线备份。而无法实现异构平台上的数据库在线备份。Legato和Veritas是美国专业从事企业数据安全管理软件开发的公司。他们均能够提供跨平台网络数据的自动备份管理,可实现备份系统的分布处理,集中管理,备份机器分组管理、备份介质分组管理、备份数据分类、分组管理及备分介质自动重复使用等多项功能,备份的数据可在每个备份客户机上按需恢复,也可在同平台上按用户权限交叉恢复,而备份操作可采用集中自动执行或手动执行。因此,对于跨多平台多业务的数字图书馆系统,可以考虑选择Legato或Veritas。

(四)数据备份策略的制定

备份策略指确定需备份的内容、备份时间及备份方式。目前被采用最多的备份策略主要有以下三种,完全备份:就是每天都进行完全备份。这种策略的好处是:当发生数据丢失的灾难时,只要用一盘磁带(即灾难发生前一天的备份磁带),就可以恢复丢失的数据。然而它亦有不足之处:首先,由于每天都对整个系统进行完全备份,造成备份的数据大量重复,占用了大量的磁带空间,增加成本;其次,由于需要备份的数据量较大,备份所需的时间也就较长。

增量备份:就是在星期天进行一次完全备份,然后在接下来的六天里只对当天新的或被修改过的数据进行备份。这种备份策略的优点是:节省了磁带空间,缩短了备份时间。但它的缺点是:当灾难发生时,数据的恢复比较麻烦。例如,系统在星期三的早晨发生故障,丢失了大量的数据,就要将系统恢复到星期二晚上时的状态。这时系统管理员首先就要找出星期天的那盘完全备份磁带进行系统恢复,然后再找出星期一的磁带来恢复星期一的数据,找出星期二的磁带来恢复星期二的数据。很明显。这种方式很繁琐。另外,这种备份的可靠性也很差。在这种备份方式下,各盘磁带间的关系就像链子一样,一环套一环,其中任何一盘磁带出了问题都会导致整条链子脱节。比如在上例中,若星期二的磁带出了故障,那么管理员最多只能将系统恢复到星期一晚上时的状态。

差分备份:管理员先在星期天进行一次系统完全备份,然后在接下来的几天里,再将当天所有与星期天不同的数据(新的或修改过的)备份到磁带上。差分备份策略在避免了以上两种策略的缺陷的同时,又具有了它们的所有优点:首先。它无需每天都对系统做完全备份,备份所需时间短,并节省了磁带空间;其次,它的灾难恢复也很方便,系统管理员只需两盘磁带,即星期一磁带与灾难发生前一天的磁带,就可以将系统恢复。

在实际应用中。备份策略通常是以上三种的结合。例如每周一至周六进行一次增量备份或差分备份。每周日、每月底、每年底进行一次全备份。

根据以上分析。数字图书馆备份系统可以根据需求以及应用环境的不同进行灵活配置。一般来说可以选用DLT或LTO,磁带库应来组建SAN系统,软件选用美国CA公司的ARCservelT,以此来形成数字图书馆内部局域网的网络数据备份系统,在实际过程中每天进行增量备份或差量备份,每月进行完全备份,确保数据的安全,这样就可以保证数字图书馆在发生数据灾难后能最大限度地降低损失。