首页 > 范文大全 > 正文

集群方案分析

开篇:润墨网以专业的文秘视角,为您筛选了一篇集群方案分析范文,如需获取更多写作素材,在线客服老师一对一协助。欢迎您的阅读与分享!

摘要 在部分项目实施过程中,用户提出了要求采用“双机”的方案。目前业内双机技术方案比较多,能解决的问题、达到的目标、用户拥有成本也不相同。本文试图给出主要技术方案的比较,供项目选型参考。

关键词 计算机技术;集群方案;双机技术

中图分类号TP3 文献标识码A 文章编号 1674-6708(2013)84-0183-02

1 集群的概念

计算机集群简称集群是一种计算机系统,它通过一组松散集成的计算机软件和/或硬件连接起来高度紧密地协作完成计算工作。在某种意义上,他们可以被看作是一台计算机。集群系统中的单个计算机通常称为节点,通常通过局域网连接,但也有其它的可能连接方式。集群计算机通常用来改进单个计算机的计算速度和/或可靠性。一般情况下集群计算机比单个计算机,比如工作站或超级计算机性能价格比要高得多。

按功效,可将集群分为:

1)高可用性集群 High-availability (HA) clusters;

2)负载均衡集群 Load balancing clusters;

3)高性能计算集群 High-performance (HPC) clusters;

4)网格计算 Grid computing。

高可用性集群提供了尽可能大的平均无故障时间时间、尽可能小的平均故障恢复时间。在集群内部署冗余设备,当系统中某台机器发生故障时,备用机器立刻启动接管任务。我们通常说的双机热备就是一种高可用性集群。

负载均衡集群提供了根据各个节点的闲置能力情况,将并发访问分散到各个节点上的功能,以使得集群整体的处理能力最大化,或当个任务的等待时间最小。

高性能集群、网格计算着眼点在于如何将一个大型任务分解到集群的各个节点中协同处理。主要应用领域包括天气预报、核试验仿真等。在我司目前及未来的主要项目中,一般不包含此类大型任务处理的需求,而主要处理多用户并发的小任务。这些并发小任务处理的性能问题特别适合使用负载均衡集群予以解决。

按照各种集群产品的技术路线,可将集群分为:

1)系统层集群

系统层集群是集群平台。在这个平台之上可以部署各个应用。由集群负责管理、监控应用,当节点发生故障时,集群将各种应用转移到后备节点上。Windows故障转移群集就是其典型代表。

2)应用层集群

特定应用所构成的集群。例如,数据库应用集群,web服务器集群。相应的集群只能实现特定应用的故障转移。

2 集群产品分析

2.1 Windows server故障转移群集(MSCS->WSFC)

2.1.1 概述

Windows Server 故障转移群集提供了各种基础结构功能来支持所承载的服务器应用程序(如 Microsoft SQL Server和 Microsoft Exchange)的高可用性和灾难恢复方案。如果一个群集节点或服务失败,则该节点上承载的服务可在一个称为“故障转移”的过程中自动或手动转移到另一个可用节点。

Windows故障转移群集是windowsserver的一个组件。通过该组件将多个计算机构成基于共享存储的集群。WSFC可以管理windows系统中的各种资源、应用程序和服务,为其提供系统层面的故障转移能力。

Windows故障转移群集是一个应用层集群、故障转移集群。

在windows server 2003中称为MSCS,在2008中称为WSFC。

2.1.2 系统结构图

2.1.3 功效

1)故障转移

故障转移功能是通过群集中连接的多个计算机中的冗余实现的,每台计算机都具有独立的故障状态。为了实现冗余,需要在群集中的多个服务器上安装应用程序。但在任一时刻,应用程序只在一个节点上处于联机状态。当该应用程序出现故障或该服务器停机时,此应用程序将在另一个节点上重新启动。

2)可以实现多节点互备功能。

在集群中部署多个应用(例如数据库、webserver等),正常情况下。各个应用分别在不同节点上运行。当任何一个节点故障时,该节点上运行的应用自动转移到其他节点上,从而实现双机互备。

3)可扩展性

可在线增加新节点

2.2 Oracle clusterware

概述:

Clusterware是oracle提供的集群软件。提供系统级的故障转移能力。类似于windows故障转移群集。在其之上可以安装各种应用(如数据库、webserver),可实现各种应用的故障转移。但实际情况是,clusterware往往只被用于oracle RAC方案中。

2.3 Oracle RAC

2.3.1 概述

Oracle RAC是oracle数据库提供的数据库集群功能组件。RAC支持一台或多台机器建立数据库集群,可将多个性能一般的设备组成集群,从而提高集群整体的并发处理能力。RAC中的多个节点不分主、备,同时在线,同时对外提供服务。

Oracle标准版包含此组件。Oracle企业版可选择此组件。

2.3.2 系统结构图

2.3.3 功效

1)故障转移 (failover)

实现了对客户端透明(TAF)的故障转移。所谓TAF,就是连接建立以后,应用系统运行过程中,如果某个实例发生故障,连接到这个实例上的用户会被自动迁移到其他的健康实例上。对于应用程序而言,这个迁移过程是透明的,不需要用户的介入,当然,这种透明要是有引导的,因为用户的未提交事务会回滚。相对与Client-SideConnect Time Failover的用户程序中断,抛出连接错误,用户必须重启应用程序,TAF这种方式在提高HA上有了很大的进步。

ORACLERAC故障转移的特点:

(1)访问时应用透明(注意不是对oracle客户端的透明),程序通过oracle端访问rac,访问程序无需了解数据库是双机还是单双机,只通过本地服务名即可访问;

(2)故障时应用透明,一些情况下,应用感受不到某个节点发生了失败,不会收到异常。一些情况下,应用收到异常,但不需要再次连接,即可继续执行访问。一些情况下,应用程序收到异常,并需要重新连接。

2)负载平衡(load balance)

服务器端的负载均衡可以根据RAC中各节点的负荷及连接数情况,而判定将新的客户端连接分配到负荷最小的节点上去。

3)可扩展性

在不中断服务的情况下,在线增加节点。满足业务扩展带来的性能要求。减少首次投资,降低风险。

3 结论

3.1 集群总结

1)群集分两个层面:系统层群集和应用层群集;

2)Oracel rac属于应用群集;

3)Windows故障转移群集是系统层群集;

4)群集能够实现一部分高可用性的要求;

5)Rac能实现负载平衡的需求;

6)Windows群集能实现多种应用程序环境下的互备方案;

7)高可用性的需求和场景很多,还需要群集之外的方案来实现;

8)除了高可用性的需求外,用户可能还要有其他需求,例如数据冗余、灾备,需要用集群以外的方案来实现。

3.2 集群选型的一般步骤

1)确定用户需求

技术方案与需求矩阵

需求

方案 高可用性 性能 数据冗余 灾备

节点 网络 存储 负载均衡 IO

集群 RAC √ √

Windows WSFC √

DATA GUARD √ √

ASM √

RAID √ √

网卡驱动中间件 √

2)确定用户价格偏好

3)确定用户使用习惯

4)确定用户现有的资源

5)根据产品的技术、价格现状确定方案