首页 > 范文大全 > 正文

政企行业容灾系统解决方案

开篇:润墨网以专业的文秘视角,为您筛选了一篇政企行业容灾系统解决方案范文,如需获取更多写作素材,在线客服老师一对一协助。欢迎您的阅读与分享!

【 摘 要 】 对政企客户容灾系统建设的意义及方针进行了总结,对信息系统灾难恢复规范标准的六级体系进行了概括,对容灾系统建设的方法论及由此衍生的系统实施步骤进行了阐述;针对国标的六级灾备体系,提出了不同容灾级别实现的技术方案,并对技术方案中的关键技术进行了分析;最后对政企客户的容灾系统的建设提出了建议。

【 关键词 】 容灾系统;灾备中心;数据复制;方案

The Solution of Disaster Recovery for Government and Enterprise Industry

Zhao Lei-ting

(China Unicom System Integration Limited Corporation Beijing 100032)

【 Abstract 】 The guidelines of .building disaster recovery system for government and enterprise Industry were summarized. The six level system of information system disaster recovery standard was discussed. The methodology and system implementation procedure for building disaster recovery system were interpreted. In accordance with the six level system of disaster recovery, technical solutions for different level of disaster recovery and their key technology were analyzed. At last, the suggestion for building disaster recovery system for government and enterprise Industry was provided.

【 Keywords 】 disaster recovery system; disaster backup center; data replication; solution

1 容灾建设意义及方针

现代企业对信息系统的依赖性越来越强,并逐步成为其生存运转的命脉。而火灾、水灾、爆炸、地震、雷击或设备线路故障等自然原因,以及黑客破坏、人为破坏等非自然原因引起的各种灾难,时刻萦绕在企业周围,使企业无法做到高枕无忧。尤其是对政府、金融、电信、电力、交通等重点行业,企业的关键应用系统与核心业务息息相关,加之目前数据、业务大集中的趋势使得企业IT系统的风险高度集中化,因此系统的安全性和持续性尤为重要,容灾系统的建设成为一项紧迫的工作。

容灾系统的建设是一项复杂的系统工程,需要从组织保障、管理机制建设、技术支撑、工程实施、运营维护等多个方面着手进行,这些方面相辅相成,共同构造企业的完整的容灾备份体系。在容灾备份体系的建设过程中,我们需要本着如下的建设方针:

预防为主:政企客户应建立和完善信息系统突发事件风险防范体系,对可能导致突发事件的风险进行有效地识别、分析和控制,并对风险指标动态、持续监测,建立有效的技术支撑与保障体系,减少重大突发事件发生的可能性。

明确职责:政企客户应加强容灾应急处置队伍建设,明确相关部门与个人在容灾备份管理工作中的职责,制定有效的问责制度,确保突发事件发生时反应快速、报告及时、措施得力、操作准确,降低突发事件可能造成的损失。

持续改善:政企客户应建立统一指挥、协调有序的容灾应急管理机制,主动开展应急管理工作,定期演练和评价应急预案,持续改进本机构的容灾应急预案和相关协调机制。

2 容灾标准

国家标准化管理委员会于2007年11月1日正式实施了《信息系统灾难恢复规范》――GB/T 20988-2007(以下简称“国标”),在此国标中,规定了一个灾难恢复的六级体系,灾备级别按照从第一级到第六级的顺序依次升高,如表1。

容灾系统的建设需要规划先行,政企客户应结合自身的业务需求和信息系统的发展状况制定自己的容灾系统的发展规划与规范,根据国标的灾难恢复的六级体系,规划建立与企业相适应的灾备保护等级,并以业务持续性计划(BCP)作为容灾系统建设的方法论。

3 容灾建设方法论

目前在容灾系统建设方面业界普遍采取如下原则:遵循业务持续性管理(BCM)要求,制定企业的业务持续性计划(BCP),分步骤的实施容灾系统建设,并不断完善企业的BCP,以企业的BCP为基础指导企业的容灾系统运行维护和灾难恢复。

企业的BCP的制定要求有周详的规划,尤其是灾难所引起的对业务的冲击程度的分析,并制定相应的灾难恢复策略,分析目前最新的、最成熟的信息技术,提出最佳的灾难恢复方案。在企业的BCP建立以后,还必须事后反复测试,并随时调整、加以改进,完整的企业BCP才能得以建立。

企业应根据业务连续性管理标准,结合自身在容灾领域建设和维护的特定需求,形成自己的容灾建设标准规范和实施步骤,图1给出了中国联通在容灾系统建设方面所采用的一个信息系统容灾建设总体方法论的参考模型。

该参考模型将容灾系统建设划分为分析评估、设计实施和维护管理三个主要阶段,并制定了七个主要实施步骤。

1)项目启动:其主要工作是就灾难恢复与管理层及相关的业务部门达成共识,认可业务连续性对企业的价值,以获得最大的支持,因此本阶段的主要工作重在沟通。需要管理层接受业务连续性项目的相关成本,对容灾建设的策略、范围、组织架构调整及项目计划进行批准。

2)灾难类型分析:也称为风险分析,本阶段的目的是针对当前企业核心业务流程、企业IT系统环境所存在的潜在风险确定系统可恢复能力级别,最终要得到带有优先级别的需要防护的灾难列表,并制定可能的处理方法或转嫁策略。本阶段需要做的工作是:确定当前业务环境中的客观存在的威胁和薄弱环节;评估灾难发生的可能性;进行定性(业务中断与数据丢失)的分析,评估风险的影响;提供在现有条件下,降低风险和改进薄弱环节的建议;形成需要防护的灾难列表或象限图。

3)业务冲击分析:业务冲击分析的目的是定量或定性地分析由于业务中断和预期灾难可能对企业业务造成的影响(经济上和业务操作上),并由此确定关键功能、恢复顺序和相关性,以便确定灾难发生后的容灾系统的恢复时间目标(RTO)和恢复点目标(RPO)。本阶段需要做的工作是:识别关键业务功能和应用系统;识别应用系统之间的相互关联和支持关系(相关性);确定当在预定的时间内无法正常运行时,对关键业务造成的损失及影响(定性和定量);确定灾难恢复和业务连续需求(恢复时间目标RTO和恢复点目标RPO);确定恢复顺序;识别关键的服务时间段和可容忍的性能下降程度。

4)容灾策略制定:结合以上各阶段的分析结果,以及本企业自身在容灾上的投入能力,制定本企业自己的短期、长期范围内的容灾策略和目标,并有意识地对企业组织架构和人员职责进行调整以适应策略要求,其中,最重要的是制定出容灾实施的步骤,优先解决最为重点的问题。在制定容灾策略时,需要考虑以下几方面的因素:需要考虑企业现有的容灾环境;需要考虑企业容灾中心建设的选址;需要考虑企业的短期、长期目标;需要考虑容灾模式的选择,如容灾层次、容灾范围、运营方式、容灾规模等。通过以上方面的综合考虑,形成本企业自身的信息系统容灾建设演进路线。

5)方案设计实施:容灾方案可供选择的范围很大,但所有的容灾方案都必须考虑的因素包括恢复时间、实施和维护容灾策略所需的投入等。容灾恢复时间的需求越短,所需的实施成本就越大,实施难度也就越高。目前,业界存在的各种方案可以分别满足不同的数据恢复点目标(RPO)和恢复时间目标(RTO),需要根据业务冲击分析的结果,针对每一种业务流程,综合选择能够满足容灾目标的方案。

6)测试、培训、演练:制定的灾备计划,需要经过不断的测试和演练,满足企业不断发展的需求。同时,通过测试过程,使企业内部各部门及人员熟悉自己在业务连续性计划中所扮演的角色,做到胸有成竹,在灾难真正发生的时刻有条不紊地开展恢复的过程。

7)计划审核维护:随着新技术的不断升级以及新的内部和外部的需求变化,IT系统也将随之变化。要确保业务连续性计划的有效性就需要定期进行检查;每当计划涉及到有重大改变的时候,需要对业务连续性计划做相应的修改。

4 容灾系统技术方案选型

根据国标不同的灾备级别,容灾方案分为数据级和应用级两大类灾备解决方案,数据级灾备解决方案是针对国标1~4级的技术方案,而应用级灾备解决方案可以涵盖国标第5级和第6级的灾备技术内容。

4.1 数据级灾备解决方案

数据级灾备解决方案又分为两种。

1)运输介质模式:此灾备方案是数据级灾备方案中的低端方案,可以满足国标1~2级中的技术需求。该模式需实现:a) 本地数据备份 b) 备份介质出仓 c) 远程运输备份介质,并进行介质管理。该模式下的技术方案利用备份软件以及相应选项功能,将客户生产中心的业务数据和应用系统数据定时备份到本地,再人工运送至灾备中心。该方案是一种非实时的离线方式,技术难度不大,但不能保证生产中心与备份中心间数据的实时一致性。

2)链路传输模式:此灾备方案是数据级灾备方案中的高端方案,可以达到国标3~4级中的技术要求。该模式需实现:a) 本地数据备份 b)定时数据传输,通过数据链路批量将备份数据传输到灾备中心。该模式下的技术方案需要生产中心和灾备中心之间有电子通讯链路连接,利用备份或复制软件将生产中心的业务数据和应用系统数据定时备份或复制到灾备中心。

4.2 应用级灾备解决方案

应用级灾备解决方案也可分为两种。

1)实时数据复制模式:此灾备方案是应用级灾备方案中的常用解决方案,可以满足国标5级中的技术需求。该模式需实现:a) 数据远程实时复制 b) 通信网络自动或集中切换功能。该模式下的技术方案需生产中心和灾备中心之间有电子通讯链路连接,将生产中心的业务数据和应用系统数据实时传送到灾备中心,并提供网络的自动或集中切换能力。换而言之,本方案应具备数据远程实时复制和通信网络的自动(或集中)切换的核心功能。数据远程实时复制分为磁盘复制和软件复制的两种实现方式。磁盘复制由分别处于主生产中心和灾备中心的磁盘阵列之间通过磁盘阵列的控制器以数据同步或异步的方式在专有数据链路上进行数据复制。磁盘阵列的异步数据复制方式对应用系统性能的影响较小,但是灾难发生时,数据损失较同步数据复制的方式大。生产中心与灾备中心的通信线路的物理距离所产生的数据传输时间会对写操作造成影响,这和光或电波的传播速度有关,例如,光或电波在150公里距离上的一个来回需要1ms,因此对数据延迟较敏感的同步数据复制一般用于100公里内的同城容灾,而异步数据复制方式对数据在异地之间的复制延迟不敏感,因此可以用于不受物理距离限制的异地容灾。磁盘复制具有不占用主机的计算资源,可靠性高,性能好等特点,由于使用专用的数据复制通路,例如在同城域内一般用光纤通道(FC),因此可以进行大容量的数据实时复制。但是磁盘复制对进行数据复制的位于生产中心和备份中心的对等磁盘阵列的型号有严格要求,一般必须是同一厂商的特定型号,因此异构的兼容性较差。而软件方式的数据复制可以规避这一缺点,其具有可以跨异构存储系统的特点,但是软件复制需要占用少量的主机系统计算资源。

2)零丢失模式:此灾备方案是应用级灾备方案中的最高端方案,可以达到国标第6级灾备的技术要求。该模式需实现:a) 数据远程实时复制且实现数据零丢失 b) 系统自动或集中切换功能 c) 支持远程集群系统的实时监控和自动切换能力。该模式下的技术方案需生产中心和灾备中心之间有电子通讯链路连接,生产中心和灾备中心之间进行磁盘数据的同步复制,或者利用灾备软件相应套件,进行远程磁盘逻辑卷镜像,实现生产中心和灾备中心之间磁盘数据实时一致的功能,从而保证客户数据零丢失,并提供系统自动切换能力和实时监控的功能。由于通信物理距离对数据远程同步复制的数据写操作的延迟影响,零丢失模式应用级容灾一般用于100公里内的同城容灾。同时,组建可实时无缝切换的高级集群系统,也是实现该模式的必备条件,如图2展示了零丢失模式应用级容灾的一个实现示意图。

5 结束语

政企客户的容灾系统的建设要有条不紊地分步进行,即要立足长远,具有优良的发展路线图;又要做到因地制宜,不因系统过度超前而造成投资浪费。我们需要在企业整体IT发展战略下,为不同类型的企业应用量身定做不同级别的灾备,将企业IT投资的效用最大化。

参考文献

[1] 全国信息安全标准化技术委员会.信息安全技术 信息系统灾难恢复规范[S] .中华人民共和国国家质量监督检验检疫总局、中国国家标准化管理委员会.

[2] 中国网通集团. 容灾建设指南[R] .2006(8).

[3] IBM中国信息支持中心. IBM容灾白皮书[R].

作者简介:

赵雷霆(1970-),男,工学硕士,现就职于联通系统集成有限公司解决方案部;研究方向:信息化、ICT新技术在政企客户中的推广应用。