配色: 字号:
集群服务器
2022-02-10 | 阅:  转:  |  分享 
  
集群服务器

胡经国

通俗地说来,集群Cluster)是这样一种技术它将多连接在一起,使多台服务器能够像一台机器那样工作或者看起来好像一台机器。

采用集群通常是为了提高系统的稳定性网络中心的数据处理能力和服务能力。

举个例子来说,我们架设了一台W服务器,在其上面构建了一个电子商务网站然而随着时间的推移,名声越来越大,点击率越来越高,W服务器的负载也就越来越高。这种情况下,我们就必须提升W服务器的能力,以满足日益增长的服务请求。这时,我们就面临两种选择升级W服务器

采用更快的CPU,增加更多的内存,使服务器具有更强的性能但日益增长的服务请求又会使服务器再次过载,需要再次升级这样就陷入了服务器升级的怪圈。还有,升级时还得考虑到服务如何接续,能否中止。集群服务器

第二种方法就是集群服务器增加W服务器,让多台服务器来完成相同的服务。

简而言之,就是一组相互独立的服务器在网络中表现为单一的系统,并且以单一系统的模式来管理。此单一系统能为客户工作站提供高可靠性的服务。

一个服务器集群包含多台拥有共享数据存储空间的服务器各台服务器之间通过内部局域网进行相互通信当其中一台服务器发生故障时,它所运行的应用程序将由其他的服务器自动接管

在大多数情况下,集群中所有的都拥有一个共同的名称集群系统内任意一台服务器都可被所有的网络用户所使用。

在集群系统中运行的服务器并不一定是高档产品,但服务器集群却可以提供相当高性能的不停机服务

每一台服务器都可以承担部分计算任务并且由于群集了多台服务器的性能,因整体系统的计算能力将有所提高

同时,每台服务器还能够承担一定的容错任务当其中某台服务器出现故障时,系统可以在专用软件的支持下将这台服务器与系统隔离,并通过各服务器之间的负载转移机制实现新的负载平衡同时向系统管理员发出报警信号。

二、两种集群方法

目前,有两种常用的服务器集群方法

一种是将备份服务器连接在主服务器上当主服务器发生故障时备份服务器才投入运行把主服务器上所有任务接管过来。

另一种方法是,将多台服务器连接这些服务器一起分担同样的应用和数据库计算任务改善关键大型应用的响应时间。同时每台服务器还承担一些容错任务一旦某台服务器出现故障时系统可以在系统软件的支持下将这台服务器与系统隔离并通过各服务器的负载转移机制完成新的负载分配。

PC服务器中较为常见的是两台服务器的集群UNIX系统可支持8台服务器的集群系统康柏的专用系统OpenVMS可支持多达96台服务器的集群系统。OpenVMS

OpenVMS是VAX计算机的早期操作系统,是数码设备公司DigitalEquipmentCorporation,DEC)为其VAX以及Alpha计算机开发的操作系统。在集群系统中,所有的计算机拥有一个共同的名称集群内任一系统上运行的服务可被所有的网络客户所使用。集群必须可以协调管理各分离组件的错误和失败,并且可以透明向集群中加入组件。用户的公共数据被放置到了共享的磁盘柜中应用程序被安装到了所有的服务器上,也就是说,在集群上运行的应用需要在所有的服务器上安装一遍。当集群系统在正常运转时,应用只在一台服务器上运行,并且只有这台服务器才能操纵该应用在共享磁盘柜上的数据区,其它的服务器监控这台服务器只要这台服务器上的应用停止运行无论是硬件损坏、操作系统死机、应用软件故障,还是人为误操作造成的应用停止运行,其它的服务器就会接管这台服务器所运行的应用,并将共享磁盘柜上的相应数据区接管过来。其接管过程如下所示以应用A为例应用A正常工作时应用A停止工作后,其它的备用服务器将该应用接管过来。具体接管过程分三执行系统接管加载应用客户端连接。

1、优势

集群系统的优势在于以下几点解决所有的服务器硬件故障

当某一台服务器出现任何故障,如硬盘、内存、CPU、主板、I/O板以及电源故障,运行在这台服务器上的应用以及其他计算资源通过网络将任务分配到集群的其他正常的节点上而不影响正常应用或者计算解决软件系统问题

我们知道,在计算机系统中,用户所使用的是应用程序和数据而应用运行在操作系统之上,操作系统又运行在服务器上。这样,只要应用、操作系统、服务器三者中的任何一个出现故障,系统实际上就停止了向客户端提供服务比如我们常见的软件死机,就是这种情况之一尽管服务器硬件完好,但服务器仍旧不能向客户端提供服务。而集群的最大优势在于对故障服务器的监控是基于应用的也就是说,只要服务器的应用停止运行,其它的相关服务器就会接管这个应用,而不必理会应用停止运行的原因是什么。解决人为失误造成的应用停止工作

例如,当管理员对某台服务器操作不当导致该服务器停机,因此运行在这台服务器上的应用也就停止了运行。由于集群是对应用进行监控,因此其它的相关服务器就会接管这个应用。

集群系统的不足之处在于

集群中的应用只在一台服务器上运行,如果这个应用出现故障,其它的某台服务器会重新启动这个应用,接管位于共享磁盘柜上的数据区,进而使应用重新正常运转。我们知道整个应用的接管过程大体需要三个步骤侦测并确认故障、后备服务器重新启动该应用、接管共享的数据区。因此在切换的过程中需要花费一定的时间原则上根据应用的大小不同切换的时间也会不同,越大的应用切换的时间越长。

四、集群技术

1、集群技术概述

集群技术的出现和IA服务器的快速发展为社会需求提供了新的选择。它价格低廉,易于使用和维护而且采用集群技术可以构造超级计算机,其超强的处理能力可以取代价格昂贵的中大型机,为行业的高端应用开辟了新的途径。IA架构服务器

通常将采用英特尔处理器的服务器称为IAIntelArchitecture,因特尔架构)服务器由于该架构服务器采用了开放式体系,并且实现了工业标准化技术和得到国内外大量软硬件供应商的支持,在大批量生产的基础上,以其极高的性能价格比而在全球范围内,尤其在国得到广泛应用。集群技术是一种相对较新的技术通过集群技术,可以在付出较低成本的情况下获得在性能、可靠性、灵活性方面的相对较高的收益。

目前,在世界各地正在运行的超级计算机中,有许多都是采用集群技术来实现的。

集群是由一些互相连接在一起的计算机构成的一个并行或分布式系统。这些计算机一起工作并运行一系列共同的应用程序同时,为用户和应用程序提供单一的系统映射。从外部来看,它们仅仅是一个系统,对外提供统一的服务。集群内的计算机物理上通过电缆连接,程序上则通过集群软件连接。这些连接允许计算机使用故障应急与负载平衡功能,而故障应急与负载平衡功能在单机上是不可能实现的。

服务器集群系统通俗地讲就是把多台服务器通过快速通信链路连接起来从外部看来,这些服务器就像一台服务器在工作而对内来说,外面来的负载通过一定的机制动态地分配到这些节点机中去,从而达到超级服务器才有的高性能、高可用。集群的优点高可伸缩性

服务器集群具有很强的可伸缩性。随着需求和负荷的增长,可以向集群系统添加更多的服务器。在这样的配置中,可以有多台服务器执行相同的应用和数据库操作。高可用性

高可用性是指在不需要操作者干预的情况下,防止系统发生故障或从故障中自动恢复的能力。通过把故障服务器上的应用程序转移到备份服务器上运行,集群系统能够把正常运行时间提高到大于99.9%,大大减少服务器和应用程序的停机时间。高可管理性

系统管理员可从远程管理一个、甚至一组集群,就好象在单机系统中一样。







5







献花(0)
+1
(本文系胡经国图书...原创)