分享

HP-UX 双机工作原理

 Stefen 2010-12-13

故障处理过程

MC/SG 是HP 实现高可用性系统的一套软件的名字。实现高可用性的基本原则是消灭单点故障。如同在一台主机内部可以采用Mirror Disk 来消除单个硬盘的单点故障,用多台主机组成一套集群系统,在合理的配置下,可以在单块网卡、单块HBA、单个硬盘、单台主机等发生故障时,应用程序都能维持运行,从而提高系统的可用性。所以,一套集群(Cluster)要保证高可用性,在配置过程中,要保证网络、存储、主机等都不存在单点故障。

Cluster 的基本结构是:由两至多台主机(节点),配合冗余的网络及存储设备(共享存储),组成一个集群(Cluster)。每一个应用被打包成一个package,其中包括一些资源如IP 地址、卷组等。一个package 在一台主机上运行,当应用需要切换时,相关的资源被切换到另一台备份的主机上,同时自动运行预选定义好的应用启动、停止的脚本,从而在另一台主机以原来的IP 地址运行相关的应用。当一块HBA 卡发生故障时,LVM会自动通过alternative path 继续IO 访问;当一块网卡发生故障时,MC/SG 会自动将IP 地址切换到预选定义的备份网卡上;当一台主机发生故障时,package 会自动切换到预选定义的备份节点上。

原理

1.HP MC/ServiceGuard 背景知识 


HP MC/ServiceGuard 服务器应用软件可以帮助你使用800系列的HP9000服务器建立一个高可靠性的集群服务器系统。一个高可靠的系统是指即使计算机系统出现硬件和软件的故障,运行在该系统上的服务仍然可以继续使用,在一个环节(可能是一个系统处理单元、硬盘、LAN,软件系统等等)出了问题的时候,系统中的臃余部件可以接管错误部位的运行任务。 MC/ServiceGuard和其他高可靠部件一起实现并且协调这种发生错误时候的转换。

一个 MC/ServiceGuard 集群系统就是利用网络把一些800系列的HP9000服务器(称为节点)连接起来并且在系统中有足够的臃余硬件和软件来保证任何一个单独的错误并不显著的影响整个系统所提供的服务。

2.   MC/ServiceGuard Network Manager 的工作原理

network manager的主要目的是监控和恢复网络设备(网卡等)的错误,保证用户服务的高可靠性。实际上就是对主网络接口为每个服务分配IP地址,同时监控网络设备的健康状况,在必要的时候转移服务的运行。

MC环境中的每个节点都会分配有三种类型的IP地址(静态IP、心跳IP、浮动IP)。

心跳IP地址主要用户2个节点间的通讯,与程序包并不关联,主要用来传送心跳信息。

静态的IP地址是主网卡绑定的主机地址,与程序包并不关联,它被用来在网络中定义主机信息的。静态的IP地址不可以转移到另外一个节点去,但是当主网卡有问题时,静态IP地址可以转移到备份网卡上。

除了静态的IP和心跳IP地址以外,可以为每一个程序包分配一个或者多个唯一的IP地址。这种IP地址叫住可重分配的IP地址(也叫浮动IP地址),浮动IP地址须同静态IP处于同一网段。因为这种IP地址可以动态从一个节点转移到另外一个节点。在一个集群系统中,你最多可以为30个程序包分配255个这种可重分配的IP地址。静态和浮动的IP地址在LAN出问题的时候都会被转移到备用LAN设备上去,如果程序包控制被转移到备用节点,浮动的IP地址还可以被备用节点使用,从而使得程序仍然可以访问这些包而并不需要知道它在哪个节点上。

IP访问机制(防火墙设置建议)

1、在HP主机作为客户端时,MC环境下,TCP和UDP数据的流向缺省从静态IP地址访问。源地址为静态IP地址。

2、当HP主机作为服务端时,MC环境下,UDP通讯方式,客户端可通过浮动IP地址或静态地址连接到服务端,但是服务端应答包中给出的源IP一直是静态IP地址,而不是浮动的IP地址。

3、当HP主机作为服务端时,MC环境下,TCP通讯方式,客户端通过浮动IP连接到服务端,也就是说,对于客户端来说一直访问的是服务器浮动IP地址,所以服务器应答包中给出的源地址一直是浮动IP地址。

所以在HP MC环境下,对静态IP和浮动IP地址均不能进行访问限制,在防火墙上需要同时开通对静态IP地址和浮动IP地址的访问权限,这样才可以进行正常访问。


    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多