本指南提供了创建和配置服务器群集的步骤指南,可帮助您在运行 Microsoft Windows Server 2003 Enterprise Edition 和 Windows Server 2003 Datacenter Edition 操作系统的服务器上创建和配置使用共享磁盘的典型单一仲裁设备多节点服务器群集。 ![]() 本页内容
简介服务器群集是一组协同工作并运行 Microsoft Cluster Service (MSCS) 的独立服务器。服务器群集为资源和应用程序提供了高可用性、故障恢复能力、伸缩性和可管理性。 服务器群集允许客户端在出现故障和计划中的暂停时,依然能够访问应用程序和资源。如果群集中的某一台服务器由于故障或维护需要而无法使用,资源和应用程序将转移到可用的群集节点上。 对于“Windows 群集”解决方案,使用“高可用性”这个术语要比使用“容错”更为合适。容错技术提供更高层次的弹性和恢复能力。容错服务器通常使用深层硬件冗余,加上专门的软件,几乎可以即时地恢复任何单一的硬件或软件错误。这些解决方案要比“Windows 群集”解决方案昂贵得多,因为企业必须为处于闲置状态等待错误的冗余硬件支付费用。 服务器群集无法保证无间断运作,但是确实能够为多数关键任务应用程序提供足够的可用性。群集服务可以对应用程序和资源进行监控,并能够自动识别和恢复众多故障状况。这为在群集中管理工作负荷提供了灵活性。另外,还提高了整个系统的可用性。 群集服务的优点包括:
本文档提供了创建和配置服务器群集的分步操作指南,可以帮助您在连接到共享群集存储设备且运行 Windows Server 2003 Enterprise Edition 或 Windows Server 2003 的服务器上创建和配置服务器群集。本文档的目的是为了指引您完成安装典型群集的步骤,并未解释如何安装群集应用程序。而对于实施非传统仲裁模型的“Windows 群集”解决方案 (如多数节点集 [MNS] 群集和地理位置分散的群集) 也不予以讨论。有关服务器群集概念以及安装和配置步骤的其他信息,请参见“Windows Server 2003 联机帮助”。 服务器群集配置清单:本清单可帮助您准备安装过程。清单后面是具体的步骤指南。 软件要求
硬件要求
网络要求
共享磁盘要求:
群集安装安装概述在安装过程中,安装某些节点时将关闭其他节点。这个步骤有助于保证附加到共享总线的磁盘上的数据不会丢失或遭到破坏。当多个节点同时尝试写入一个未受到群集软件保护的磁盘时,可能会出现数据丢失或遭到破坏的情况。与 Microsoft Windows 2000 系统不同,Windows 2003 Server 中新磁盘的默认装载方式有所变化。在 Windows 2003 中,系统不会自动装载那些引导分区不在同一总线的逻辑磁盘,也不会为其分配驱动器盘符。这有助于确保在复杂的 SAN 环境中,服务器不会装载可能属于另一台服务器的驱动器。虽然服务器不会自动装载驱动器,但是仍然建议您按照下列步骤,以确保共享磁盘不会遭到破坏。 使用下表确定在每一个步骤必须关闭的节点和存储设备。 本指南中的步骤适用于双节点群集。如果您正在安装节点数多于两个的群集,则“节点 2”列将列出其他所有节点所需的状态。
在配置“群集”服务软件前,必须先执行几个步骤。这些步骤是:
在第一个节点上开始安装群集服务前,必须先在每一个群集节点上执行这些步骤。 要配置群集服务,您必须以一个具有所有节点管理权限的帐户登录。每个节点都必须是同一个域的成员。如果您选择将其中一个节点作为域控制器,则应在相同的子网上再设置一个域控制器,以便消除单点故障,并对该节点进行维护。 安装 Windows Server 2003 操作系统请参见您从 Windows Server 2003 操作系统软件包中得到的文档,以在群集的每个节点上安装该系统。 配置群集服务之前,您必须在本地使用一个本地管理员组成员的域帐户登录。 请注意:如果您试图将一个节点加入一个本地管理员帐户密码为空的群集,安装将会失败。基于安全原因,Windows Server 2003 禁止使用空白的管理员密码。 设置网络每个群集节点要求至少要有两个网络适配器用于两个或多个独立网络,以避免单点故障。其中一个网络适配器用于连接到公用网络,而另一个则用于连接到仅由群集节点组成的专用网络。拥有多个网络适配器的服务器被称为“多宿主”。由于多宿主服务器容易发生问题,因此请您务必按照本文档中描述的网络配置建议进行操作,这十分重要。 Microsoft 要求您在每个节点上具有两个经“硬件兼容性列表”(HCL) 认证并得到“Microsoft 产品支持服务”支持的“外围组件互连”(PCI) 网络适配器。通过一个静态 IP 地址,在您的生产网络上配置其中一个网络适配器,并在另一个用于进行专用群集通信的子网上,通过另一个静态 IP 地址,在一个独立的网络上配置另一个网络适配器。 服务器群集节点间的通信对于群集的顺畅运转至关重要。因此,您必须对用于群集通信的网络执行最佳配置,并遵从硬件兼容性列表上的所有要求。 专用网络适配器用于节点对节点的通信、群集状态信息和群集管理。每个节点的公用网络适配器都将群集连接到客户端所在的公用网络,并应配置为内部群集通信的后备路由。要实现这些操作,应该将群集服务的这些网络角色配置为“只用于内部群集通信”或“所有通信”。 此外,每个群集网络之间必须是独立的,如果一个网络发生故障,不会对其他网络造成影响。这意味着,两个群集网络不能具有可能导致两者同时出现故障的公用组件。例如,使用一个多端口网络适配器将节点附加到两个群集网络时,大多不能满足此要求,因为端口不是独立的。 要消除可能的流量问题,应从设置为只用于内部群集通信的网络适配器 (这种适配器也被称为核心或专用网络适配器) 中删除所有不必要的网络通信。 要验证所有的网络连接均准确无误,专用网络适配器必须位于另一个来自公用网络适配器的逻辑网络上的网络。这可以通过在双节点配置中使用跨接电缆,或者在多节点配置中使用专门的哑集线器来实现。不要对核心网络使用交换机、智能集线器或其他任何路由设备。 请注意:群集心跳不能通过路由设备进行传递,因为它们的“生存时间”(TTL) 被设定为 1。公共网络适配器只能连接到公用网络。如果您具有一个虚拟局域网 (LAN),那么节点间的等待时间必须少于 500 毫秒 (ms)。另外,在 Windows Server 2003 中,“服务器群集”中的心跳被改为多播的形式;所以,您可能需要提供一台 Madcap 服务器,以分配多播地址。其他相关信息,请参见“Microsoft 知识库”中的下列文章:307962 针对群集心跳启用多播支持 下面的图 1 简要描绘了一个四节点群集的配置。 常规网络配置:请注意:本指南假定您正在运行默认的开始菜单。如果您使用传统的开始菜单,那么具体步骤可能稍有不同。同样,哪个网络专用哪个网络公用要依您的配线而定。在本白皮书中,第一个网络适配器 (本地连接) 被连接到公用网络,而第二个网络适配器 (本地连接 2) 被连接到专用群集网络。您的网络可能有所不同。 重命名局域网图标 建议您更改网络连接的名称,以便清楚地进行识别。例如:您可能想把本地连接 2 的名称更改为 Private。重命名将有助于您识别网络并对其正确地分配角色。
在所有节点上配置绑定顺序网络
配置专用网络适配器
配置公用网络适配器请注意:如果 IP 地址是通过 DHCP 获取的,那么如果不能访问 DHCP 服务器,则可能无法接入群集节点。由于这个原因,服务器群集上的所有接口均要求静态 IP 地址。请记住,群集服务只能识别每个子网上的一个网络接口。如果您需要 Windows Server 2003 中 TCP/IP 寻址的协助,请参见“联机帮助”。 验证连通性和名称解析 要验证专用和公用网络是否能够正确地通信,请自每个节点 ping 所有的 IP 地址。您应当能够在本地和远程节点上 ping 通所有的 IP 地址。 要验证名称解析,从客户端 ping 每一个节点的机器名称 (非 IP 地址)。应当只能返回公用网络的 IP 地址。您也许还想尝试通过 PING a 命令,反向查询 IP 地址。 验证域成员 群集中的所有节点必须是同一个域的成员,并可以访问域控制器和 DNS 服务器。可以将其配置为成员服务器或域控制器。与群集一样,您至少应该在相同的网络区域具有一个域控制器。基于高可用性。另一个域控制器也应该可用于消除单点故障。在本指南中,所有的节点都被设定为成员服务器。 在某些实例中,节点可能部署于并未预先配置 Microsoft Windows NT 4.0 域控制器或 Windows Server 2003 域控制器的环境中。在这种情况下至少要求其中有一个群集节点被设定为域控制器。但是,在双节点服务器群集中,如果其中有一个节点是域控制器,那么另一个节点也必须是一个域控制器。在四节点群集实施过程中,没有必要将全部四个节点都设定为域控制器。然而,当遵循一个“最佳实践”模型并至少具有一个后备域控制器时,余下的三个节点中至少应该有一个被设定为域控制器。在设定群集服务之前,必须使用 DCPromo 工具将其中一个节点提升为域控制器。 如果另一个支持动态更新和/或 SRV 记录的 DNS 服务器不可用,则 Windows Server 2003 中的 DNS 相关设置还要求每一个域控制器节点同时必须是 DNS 服务器 (建议采用 Active directory 集成区域)。 在将群集节点部署为域控制器时,应该考虑以下问题:
由于创建群集节点域控制器所涉及的复杂性和开销,建议所有节点都应作为成员服务器。 设置群集用户帐户 群集服务需要一个域用户帐户,该帐户应为每个可运行群集服务的节点上的“本地管理员”组成员。因为安装需要用户名和密码,所以该用户帐户必须在配置群集服务前予以创建。该用户帐户只能专门用于运行群集服务,而不能属于个人。 请注意:群集服务帐户不必是“域管理员”组的成员。基于安全原因,建议不要授予群集服务帐户域管理员的权利。 群集服务帐户需要下列权利,以在群集的所有节点上正常工作。“群集配置向导”自动授予以下权利:
其他相关信息,请参见“Microsoft知识库”中的以下文章: 269229 如何手动重新创建群集服务帐户 设置群集用户帐户
设置共享磁盘警告:为了避免破坏群集磁盘,在其他节点上启动操作系统前,确认至少在一个节点上安装、配置并运行了 Windows Server 2003 和群集服务。在完成群集服务配置之前,所开启的节点数不要超过一个,这一点至关重要。 在继续操作前,关闭所有节点。开启共享存储设备,然后开启节点 1。 关于仲裁磁盘 仲裁磁盘用于存储群集配置数据库检查点和日志文件,日志文件可协助管理群集和维护一致性。建议您按照以下仲裁磁盘步骤进行设置:
重要:仲裁磁盘故障可能导致整个群集失效;所以,强烈建议您使用硬件 RAID 阵列上的一个卷。除了进行群集管理外,不要使用仲裁磁盘执行其他任务。 仲裁资源在群集运作中扮演着关键的角色。在每个群集中,都有一个单一资源被指定为仲裁资源。仲裁资源可以是具备下列功能的任何“物理磁盘”资源:
在群集服务安装过程中,您必须为仲裁磁盘提供驱动器盘符。常用的标准盘符为 Q,本例中亦采用 Q 盘符。 配置共享磁盘
如果您正在安装 64 位版本的 Windows Server 2003,确认所有的磁盘均格式化为 MBR。不支持将“全局分区表”(GPT) 作为群集磁盘。其他相关信息,请参见“Microsoft 知识库”中的下列文章: 284134 服务器群集不支持 GPT 共享磁盘 确认所有的共享磁盘均格式化为 NTFS 并指定为 MBR Basic。 验证磁盘访问与功能
配置群集服务您必须在安装的第一个阶段提供所有初始配置信息。该步骤可通过“群集配置向导”来完成。 如下方流程图所示,Form (创建一个新群集) 和 Join (添加节点) 所采取的路径有所不同,但是它们共有一些相同的设置页面。即“凭证登录”、“分析”以及“重新分析并启动服务”。而在下列页面上则有少许不同:“欢迎”、“选择计算机”和“群集服务帐户”。在本课的下面两个部分中,您将分步完成反映所有这些配置路径的向导页面。当您完成了所有的步骤,本白皮书将在第三部分中详细描述“分析”和“重新分析并启动服务”页面,以及这些屏幕所提供的信息的具体含义。 请注意:在节点 1 上进行群集服务配置的过程中,您必须关闭所有其他节点。开启所有共享存储设备。 配置第一个节点
验证群集安装使用“群集管理器”(CluAdmin.exe),在节点 1 上验证群集服务安装。 验证群集安装
请注意: 原则上,不要将任何东西放到群集组中,不要从群集组中取出任何东西,也不要使用群集组中的任何东西执行群集管理以外的操作。 配置第二个节点在第二个节点上安装群集服务所需的时间要比在第一个节点上安装所需的时间少。“安装”程序基于第一个节点的配置,在第二个节点上配置群集服务网络设置。与此同时,您还可以通过远程操作为群集添加多个节点。 请注意:在这部分的练习中,开启节点 1 和所有的共享磁盘。然后开启所有其他节点。这时,群集服务将控制对共享磁盘的访问权限,以便杜绝任何可能破坏卷的机会。
安装后配置心跳配置现在,每个节点上的网络都已得到了正确的配置,而且群集服务也已配置完毕,这时您需要配置网络角色,以定义其在群集中的功能。此处是一份“群集管理器”中网络配置选项的列表:
本白皮书假定仅使用两个网络。它解释如何将这两个网络分别作为混合网络和专用网络进行配置。这是最常见的配置。如果您具有可用的资源,建议使用两个专门的冗余网络用于内部群集通信。 配置心跳
心跳适配器优先化 配置完群集服务如何应用网络适配器的角色后,下一步是对内部群集通信应用进行优先排序。这仅适用于两个或多个被配置为节点对节点通信的网络。屏幕右边的优先级箭头指定了群集服务使用各个网络适配器在节点间进行通信的先后顺序。群集服务总是尝试使用列于首位的网络适配器进行节点间的远程过程调用 (RPC) 通信。只有当群集服务无法使用第一个网络适配器进行通信时,才会使用列表上的下一个网络适配器。
配置群集磁盘
请注意:默认状态下,所有磁盘并不在相同的总线上,因为系统磁盘将为它们创建“物理磁盘资源”,并将其群集。因此,如果节点具有多条总线,可能列出的某些磁盘将无法用作共享存储,例如,内部 SCSI 驱动器。应该从群集配置中删除这些磁盘。如果您计划对某些磁盘实施“卷装载”点,则可能要删除这些磁盘的当前磁盘资源,删除驱动器盘符,然后创建一个未分配驱动器盘符的新的磁盘资源。 仲裁磁盘配置“群集配置向导”自动选择将作为仲裁设备的驱动器。并将使用 50 MB 以上的最小分区。您可能要把自动选择的磁盘更改为您自己指定的仲裁磁盘。 配置仲裁磁盘
其他相关信息,请参见“Microsoft 知识库”中的下列文章: 280353 如何更改仲裁磁盘指定 创建一个延迟启动当所有的群集节点均同时启动并尝试附加到仲裁资源时,群集服务可能无法启动。例如,在发生电源故障后,同时对所有节点恢复电力时,可能出现这种情况。要避免这类情况的发生,可以增加或减少显示操作系统列表的时间设置。要找到该设置,单击开始,指向我的电脑并右击我的电脑,然后单击属性。单击高级选项卡,然后在启动和故障恢复框中,单击设置。 测试安装在“安装”程序结束后,有几种可供验证群集服务安装的方法。其中包括:
测试故障转移验证资源可以执行故障转移
恭喜!您已经完成了所有节点上的群集服务配置。服务器群集已经可以完全正常地运作了。您现在可以准备安装群集资源,如,文件共享、打印机后台处理程序、诸如分布式事务协调器、DHCP、WINS 等群集敏感服务、或者诸如 Exchange Server 或 SQL Server 等群集敏感程序。 附录高级测试现在,您已经配置好了您的群集并验证了基本的功能和故障转移,您可能想执行一系列的故障情境测试,来演示预期的结果,并确保群集在发生故障时会正确地进行响应。并不是在每一次实施时都需要进行这种程度的测试,但是如果您刚开始接触群集技术,而且不熟悉群集的响应方式,或者您正在自己的环境中实施一个新的硬件平台,这将有助于深入了解集群管理。所列出的预期结果是针对结合默认设置的干净群集配置,并未考虑任何用户自定义的故障转移逻辑。这不是一个包含所有测试的完整列表,而顺利完成这些测试并不能认为已经得到了“许可”或准备好进行生产运作。这只是一个关于某些可执行的测试的示范列表。其他相关信息,请参见“Microsoft 知识库”中的下列文章: 197047 Microsoft 群集服务器上的故障转移/故障恢复策略 测试:启动“群集管理器”,右击一个资源,然后单击启动故障。该资源将进入故障状态,然后将重新启动并在同一节点上回到联机状态。 预期结果:资源将在相同的节点上返回联机状态 测试:在相同的资源上,再执行三次上述启动故障测试。在第四次故障时,资源将对群集中的另一个节点执行故障转移。 预期结果:资源将针对群集中的另一个节点实施故障转移 测试:将所有资源转移到一个节点上。启动“计算机管理”,然后单击服务和应用程序下方的服务。停止群集服务。在另一个节点上启动“群集管理器”,确认所有资源均在该节点上正确地执行了故障转移并返回联机状态。 预期结果:资源将针对群集中的另一个节点实施故障转移 测试:将所有资源转移到一个节点上。在该节点上,单击启动,然后单击关闭。这将关闭该节点。在另一个节点上启动“群集管理器”,然后确认所有资源均在该节点上正确地执行了故障转移并返回联机状态。 预期结果:资源将针对群集中的另一个节点实施故障转移 测试:将所有资源转移到一个节点上,然后按服务器前方的电源按钮将其关闭。如果您有一台符合 ACPI (高级配置和电源接口) 标准的服务器,该服务器将执行“紧急关闭”功能进行关闭。在另一个节点上启动“群集管理器”,确认所有资源均在该节点上正确地执行了故障转移并返回联机状态。有关“紧急关闭”的其他信息,请参见“Microsoft 知识库”中的下列文章: 325343 操作指南:在 Windows Server 2003 中执行紧急关闭 297150 ACPI 计算机上的电源按钮可能强制执行紧急关闭 预期结果:资源将针对群集中的另一个节点实施故障转移 警告:执行“紧急关闭”测试可能导致数据遭破坏和丢失。不要在生产服务器上执行该测试 测试:将所有资源转移到一个节点上,然后拔掉服务器的电源线模仿一个硬故障。在另一个节点上启动“群集管理器”,然后确认所有资源均在该节点上正确地执行了故障转移并返回联机状态 预期结果:资源将针对群集中的另一个节点实施故障转移 警告:执行硬故障测试测试可能导致数据遭破坏和丢失。这是一个极端测试。确认您已备份了所有关键数据,然后在您自己的磁盘上执行该测试。不要在生产服务器上执行该测试 测试:将所有资源转移到一个节点上,然后拔掉该节点的公用网络电缆。IP 地址资源将失效,组将针对群集中的另一个节点执行故障转移。其他相关信息,请参见“Microsoft 知识库”中的下列文章: 286342 Windows Server 2003 群集中的网络故障检测与恢复 预期结果:资源将针对群集中的另一个节点实施故障转移 测试:拔掉专用心跳网络的网络电缆。心跳流量将针对公用网络执行故障转移,同时不会执行其他故障转移。如果发生了其他故障转移,请参见本文档前面有关“配置专用网络适配器”的部分 预期结果:不会进行其他任何故障转移或资源故障转移 SCSI 驱动器安装本附录提供一套针对 SCSI 驱动器安装的一般性指导说明。如果 SCSI 硬盘供应商的指导说明与此处的指导说明相冲突,请遵从供应商所提供的指导说明。 硬件要求中所列的 SCSI 总线必须在安装群集服务器之前予以配置。配置涉及:
除了以下几页信息外,请参见您的 SCSI 设备制造商的说明文档,或者可以向美国国家标准协会 (ANSI) 索取 SCSI 规格说明。 ANSI 网站 包含一个可用于搜索 SCSI 规格说明的目录。 配置 SCSI 设备 共享 SCSI 总线上的每个设备都必须有一个唯一的 SCSI 标识号 (ID)。由于多数 SCSI 控制器默认为 SCSI ID 7,因此配置共享 SCSI 总线包括将控制器上的 SCSI ID 号码更改为另一个号码,比如:SCSI ID 6。如果共享 SCSI 总线上的磁盘不止一个,每个磁盘都必须具有一个唯一的 SCSI ID 号码。 端接共享 SCSI 总线 有几种端接共享 SCSI 总线的方法,其中包括:
图 27 说明了 SCSI 群集的正确物理连接方式。 请注意:对于任何位于共享总线末端的设备,都必须禁用其内部端接。Y 电缆和活动端接连接器均是推荐的端接方法,因为即使节点未联机时,它们也能提供端接。 存储区域网络的考虑事项在 Windows Server 2003 服务器群集中,有两种基于光纤通道的存储支持方法:仲裁环和交换架构。 重要: 在对这两类光纤通道实施进行评估时,请先阅读供应商的文档,并确定您了解每种实施的指定特性和限制。 虽然光纤通道这一术语暗示了光纤技术的应用,但是也允许使用铜制同轴电缆进行互连。 仲裁环 (FC-AL) 光纤通道仲裁环 (FC-AL) 是一套相互连接形成一个单一环路的节点和设备集合。FC-AL 提供了一个能将多达 126 个设备连接形成为一个单一网络的经济方法。通过 SCSI,结合集线器配置的 FC-AL 服务器群集最多可支持两个节点。图 28 为 FC-AL 的示意图。 ![]() 图 28:FC-AL 连接 FC-AL 以相对静态的配置为双节点和少量设备提供解决方案。环路上的所有设备共享介质,而且从一个设备传输到另一个设备的任何数据包都必须通过所有中间设备。 如果一个双节点服务器群集可以满足您对可用性的需求,那么 FC-AL 部署将具有以下几个优点:
环路的缺点是难以在组织中进行部署。由于环路上的每个设备均共享同一个介质,因此群集中的整体带宽变窄了。有些组织还可能受到 126 个设备上限的限制。 交换架构 (FC-SW) 对于任何超过两个节点的群集,光纤通道交换架构 (FC-SW) 是唯一受支持的存储技术。在 FC-SW 中,设备在使用光纤通道交换器的多对多拓扑结构中进行连接 (如图 29 所示)。 当一个节点或设备同 FC-SW 中的另一个节点或设备进行通信时,通信源和通信目标对象建立起一个点对点连接 (类似一个虚拟电路),并直接进行相互通信。架构自身将通信源路由至通信目标对象。在 FC-SW 中,并不共享介质。任何设备都可以同其他任何设备进行通信,并以最高总线速度实现通信。这是一个完全可伸缩的企业解决方案,因此强烈建议与服务器群集一起部署。 FC-SW 是 SAN 中所采用的主要技术。FC-SW 的其他优点有易于部署、可支持数百万个设备,以及提供故障隔离和改换路由的交换机。另外,不存在像 FC-AL 中的共享介质,允许更快地进行通信。但是,要知道 FC-SW 对于供应商来说难以开发,而且交换机的价格很昂贵。供应商还必须考虑来自不同供应商或制造商的组件间的互操作性问题。 结合服务器群集使用 SAN 对于任何大型群集部署,建议您使用存储区域网络 (SAN) 进行数据存储。虽然较小的 SCSI 和独立光纤通道存储设备可以随服务器群集一起运作,但是 SAN 可以提供超强的容错能力。 SAN 是一套连接到常规通信和数据传输基础结构 (在 Windows Server 2003 群集中为 FC-SW) 的互连设备 (比如:磁盘和磁带) 和服务器。SAN 允许多个服务器接入存储池,同时任何服务器都可以在其中潜在地访问任何存储单元。 本部分中的信息提供了一个概述,可帮助您在 Windows Server 2003 群集中使用 SAN 技术。有关在 SAN 上部署服务器群集的其他信息,请参见 “Web 资源”页面 中的“Windows 群集:存储区域网络”链接 (位于http://www.microsoft.com/windows/reskits/webresources )。 请注意:提供 SAN 架构组件和软件管理工具的供应商具有一系列的工具,可用于构建、配置、监控和管理 SAN 架构。请联系您的 SAN 供应商,以了解您的特殊 SAN 解决方案的详细信息。 SCSI 复位 Windows 服务器群集的早期版本假定对于共享磁盘的所有通信应作为一个独立的 SCSI 总线。该做法略具破坏性,并且没有利用光纤通道的高级特性来提高仲裁性能和减少通信中断。 Windows Server 2003 中的一个关键改进是群集服务发出一个命令用以打断一个 RESERVATION,而 StorPort 驱动程序可以针对光纤通道拓扑结构上的磁盘执行目标或设备复位。在 Windows 2000 服务器群集中,整个总线范围的 SCSI RESET (复位) 得到了发布。这导致总线上的所有设备被断开连接。发布 SCSI RESET 时,很多时间被花在复位可能无需进行复位的设备上,比如,CHALLENGER 节点可能已经拥有的磁盘。 Windows 2003 中的复位按照以下顺序进行:
请注意: 目标复位需要主机总线适配器 (HBA) 驱动程序中的功能。驱动程序必须是针对 StorPort 而不是 SCSIPort 编写的。使用 SCSIPort 的驱动程序将如同在 Windows 2000 中使用 Challenge 和 Defense 一样。请联系 HBA 制造商,以确定其是否支持 StorPort。 SCSI 命令 群集服务使用下列 SCSI 命令:
相同的控制代码也可用于“光纤通道”。下同这篇合作伙伴的文章中定义了这些参数: 309186 群集服务如何获得共享总线上磁盘的所有权 317162 支持的光纤通道配置 以下部分概述一些直接影响服务器群集部署的 SAN 概念。 HBA 主机总线适配器 (HBA) 是将群集节点连接到 SAN 的接口卡,其连接方法类似于网络适配器将服务器连接到典型的 Ethernet 网络的方式。但是,HBA 并网络适配器更加不容易配置 (除非 HBA 由 SAN 供应商预配置)。所有节点中的 HBA 必须是完全一致的,而且必须采用相同的驱动程序和固件版本。 分区和 LUN 屏蔽 分区和 LUN 屏蔽是 SAN 部署的基础,尤其是当它们与 Windows Server 2003 群集部署相关时。 分区 许多设备和节点都可以附加到 SAN。由于数据存储在一个单一的 cloud 或存储实体中,控制哪些主机可以接入特定设备是很重要的。区域划分允许管理员在逻辑卷中对设备进行分区,从而将设备保留在一个卷中以便为服务器群集所用。这意味着,逻辑存储卷中群集节点和设备间的所有交互都被隔离在区域边界内;而其他 SAN 的非群集成员则不会受群集行为的影响。 图 30 对两个 SAN 区域进行了逻辑描述 (A 区域和 B 区域),每个区域均包含一个存储控制器 (分别为 S1 和 S2)。 在该实施中,节点 A 和节点 B 可以从存储控制器 S1 访问数据,但节点 C 不可以。节点 C 可以从存储控制器 S2 访问数据。 分区需要在硬件层次进行实施 (结合控制器或交换机),而不能通过软件来实现。主要的原因是:分区也是一个针对基于 SAN 的群集的安全机制,因为未经授权的服务器无法访问区域内的设备 (访问控制由架构中的交换机来执行,因此主机适配器无法访问未经配置的设备)。如果通过软件形式进行分区,如果软件组件出现故障,群集将无法得到安全保障。 除了提供群集安全性外,分区还对给定 SAN 环境中的流量进行了限制。端口间的流量只被路由到位于相同区域的架构段中。 LUN 屏蔽 LUN 是 SAN 中定义的逻辑磁盘。服务器群集发现 LUN 后会将其认作物理磁盘。LUN 屏蔽是在控制器层面执行的,它允许您定义 LUN 与群集节点间的关系。存储控制器通常提供创建 LUN 层次的访问控制的方法,这种访问控制允许为给定 LUN 接入一台或多台主机。通过在存储控制器上提供该访问控制,控制器本身可以对设备强制执行访问策略。 LUN 屏蔽提供了比分区更加细粒的安全性,因为 LUN 提供了端口层面的分区方法。例如,许多 SAN 交换机允许重叠的区域,从而可以使一个存储控制器位于多个区域中。多个区域中的多个群集可以共享这些区域中的控制器上的数据。图 31 说明了此类方案。 A 群集所用的 LUN 可以从 B 群集屏蔽或隐藏,从而只有授权用户才可以访问共享存储控制器上的数据。 Windows Server 2003 群集和 SAN 的综合部署要求 下面的列表重点列出了在综合部署服务器群集和 SAN 存储解决方案时,需要遵守的一些部署要求。有关结合服务器群集使用 SAN 的更完整信息,可从一份白皮书中获得,请参见 “Web 资源”页面 中的“Windows 群集:存储区域网络”链接 (位于http://www.microsoft.com/windows/reskits/webresources/)。 SAN 上的每个群集都必须在其自己的区域中进行部署。群集用以保护磁盘访问的机制可对相同区域内的其他群集造成负面影响。通过使用分区将群集流量从其他节点或非节点流量孤立出来,就不存在相互干扰的问题。 位于一个单一节点中的所有 HBA 必须是同一种类型,并且具有相同的固件版本。许多存储和交换机供应商要求所有 HBA 位于同一区域上 (有时必须是在相同架构中),且这些 HBA 必须共享这些特性。 群集中所有存储设备的驱动程序和 HBA 设备的驱动程序必须具有相同的软件版本。 不允许多个节点接入相同的存储设备,除非它们位于相同的群集中。 不要将磁带设备放在群集磁盘存储设备所在的同一个区域。磁带设备可能会误解总线休眠,并在不恰当的时候 (如在大型备份过程中) 进行倒带。 结合 Windows Server 2003 服务器群集部署 SAN 的指导方针 除了上面讨论的 SAN 要求外,强烈建议您在服务器群集部署中遵从下列实践: 在一个高度可用的存储架构中,您需要通过多个 HBA 部署群集的服务器。在这些情况下,始终载入多路径驱动程序软件。如果 I/O 子系统发现两个 HBA,会将其假定为不同的总线,并枚举所有的设备,将它们看作是每条总线上的不同设备。同时,主机将看到通向一个磁盘的多条路经。载入多路径驱动程序的失败将禁用第二个设备,因为操作系统将认为它们是具有相同签名的两个独立磁盘。 不要将群集磁盘的硬件快照在相同群集中的节点中公开。硬件快照必须进入服务器群集以外的服务器。许多控制器提供控制器层面的快照,这些快照可作为完全独立的 LUN 公开到群集。当多个设备具有相同的签名时,群集性能会下降。如果快照通过原始磁盘联机重新回到原始节点,I/O 子系统会尝试重写签名。然而,如果快照公开到群集中的另一个节点,群集服务不会将其识别为一个不同的磁盘,因此可能会造成数据遭破坏。虽然这不是一个特定的 SAN 问题,但是 SAN 环境中通常会部署提供该功能的控制器。 其他相关信息,请参见“Microsoft 知识库”中的下列文章: 301647 存储区域网络的群集服务改进 304415 对连接到相同 SAN 设备的多个群集的支持 280743 Windows 群集与地理位置分散的站点 相关链接更多信息,请参见下列资源:
有关 Windows Server 2003 的最新信息,请参见 Windows 2003 Server 网站:http://www.microsoft.com/windowsserver2003/default.mspx |
|