一、场地设施管理的意义1、场地设施(facility)。特指机电系统(facility),是为电子信息设备提供合理运行的物理环境的工程设施及保证数据中心正常运行的辅助系统,包括电力供应系统、电力输配系统、弱电系统、制冷空调系统、送排风(烟)系统、给排水系统、消防系统、自动控制系统、安防系统、火警系统等。数据中心基础设施的功能应满足数据中心的IT业务需求。 通常,我们把场地基础设施分为关键设施和非关键设施。 2、关键设施(Critical Facility)。场地设施系统中用于支持IT设备正常运行的必要设施,称为数据中心的关键设施。关键设施的故障将直接导致IT设备的宕机或故障。关键设施包括但不限于以下子系统:支持IT环境的制冷系统、支持IT环境的电气系统、支持IT环境的弱电系统、必要的连续制冷系统、与柴油发电及系统配套的柴油供应系统。 3、非关键设施(Non-Critical Facility)。数据中心场地设施中的辅助系统,称为非关键设施。非关键设施的故障不会直接导致IT设备的宕机或故障,非关键设施包括但不限于以下子系统:维持正压的新风系统、加湿系统、旁滤系统、加药系统、柴油过滤系统、自然冷却系统、支持区的舒适性空调系统、电池间的通风系统。 对于数据中心的运行而言,无论是关键设施还是非关键设施,一旦建设完成,都需要全年连续运行。这些设施包含电气、制冷、空调、通风、UPS不间断电源、安防、消防、火警、电力监控、环境监控、10kV侧电力投切、冷源群控等多个子系统,设备种类繁多、功能各异。这些子系统在建设过程中往往由不同的供应商完成,各个子系统之间缺乏信息的互联互通。在数据中心的运营管理中,经常会碰到如下的场景和问题: 例一:空调水泵的变频器发生故障,这样的故障可能会直接影响到冷机运行,但由于某些设计会把报警信息显示在在电力监控系统界面上,而电力监控系统通常不对空调运维人员开放,这可能导致空调运维人员不能在第一时间得到通知,因此无法做出快速的应急响应。如果存在一个统一的平台,能够把电力和制冷系统的控制结合到一个平台上,报警信息就可以出现在大平台上,提请相关人员第一时间开始处理故障,从而减少故障历时,避免事件升级。 例二:当一次市电故障导致冷机断电时,场地设施可以通过连续制冷系统(如蓄冷罐)放冷来维持数据中心的散热,同时启动柴油发电机,由柴油发电机带载冷机来维持数据中心的制冷。当市电复电时,电力监控系统将会提示我们可以选择将柴油机退出,我们一旦执行此项操作,即供电系统重新切回市电,这种场景有可能马上又发生市电的第二次中断,而此时蓄冷罐的冷量已经在第一次失电时耗尽,数据中心的制冷将承受重大风险。显然,延长柴油机的运行时间,待蓄冷罐充冷完成后,再切回市电是更安全的运行策略。那么,柴油机究竟需要带载冷机多长时间方允许切换回市电?运维人员应该凭借什么信息判断可以切换回市电呢?这就需要电力监控和冷源自控两个系统实现通讯关联,在条件具备时及时传递信号,从而做出正确的决策并执行。 例三:为了监控数据中心的机房环境,确保机房不出现局部热点,往往需要布置大量的传感器。随着科技的进步,很多IT设备内部自带监控装置,可以显示进风温度,用电量、风扇频率等参数。如果搭建统一平台,数据共享,环控系统就可以大大减少传感器的安装数量,为客户节约资金。 事实上,一个没有良好DCIM系统的数据中心,会存在以下问题: 1、数据中心需要大量运维人员,数据中心的运行效率和事故应对能力将依赖于运维人员的业务水平、管理协调能力。一方面会增加人力成本、另一方面也会加大运行风险。国外数据中心的运维经验表明:超过50%以上的故障原因直接与人为活动或者人力运维行动相关。 2、电力系统和空调系统的可靠性,及数据中心整体的可靠性大打折扣。正如前面例举的场景中,由于各子系统会发生相互影响,但缺乏可以沟通的平台,造成交流障碍,导致故障处理效率下降,从而影响了系统的可靠性。 3、后期扩展会影响到数据中心的运维。数据中心的生命周期超过10年,建设也是分期投入,分期实施的。在后期扩展过程中,既要保障已经运行机房模块能够不受干扰,也要保障扩展模块的施工需要。这更需要多个子系统的协调配合。 4、运维策略难以优化。真实的运维中,我们经常会发现,日常巡检、定期维护不一定能满足实际运维需要。但没有足够的数据,会缺乏依据,无法做出调整决策。比如DCIM可以对一段时间内所有故障进行分析和统计,当数据分析显示某一阶段空调水泵变频器的故障率有所提高,而水泵的例行保养时间尚未到达时,我们就应该组织分析一下故障是否属于同一批次产品的共同错误,是否需要提前保养。同时需要提醒运维人员格外关注暂时没有故障的水泵的运行,甚至提前检查水泵电机、变频器接线等设施,做到优化运维策略,实现事故预判断。 5、节能策略难以优化。一个数据中心的实际运维状态和设计参数往往有很多差异化,设计的参数、运行条件和切换时机是可以根据实际的运维经验进行调整,从而达到提高效率,节约能源的目的。但由于各子系统的分布式管理,很难对运维数据做出正确的分析,不利于正确决策。 鉴于此,数据中心场地设施的各个子系统迫切需要信息的互联互通,数据中心的运维也迫切需要一套集成化的场地设施智能化管理平台,对各子系统、子环节进行监视和控制,有了这样的一个大平台,可以避免一种数据多次采集的不必要投资、可以对一段时期的运行数据进行保存和分析,帮助运维人员实现智能化。通过多个关联子系统关联协调,可以获得更多的综合数据,用来分析故障概率、评判运维、预见问题、提前改造,警示重要事件等等,从而降低运维管理的难度、减少运维对“人”的依赖程度、方便管理层获取综合信息,做出正确决策。 关键系统需要完善的运维管理,确保IT环境不中断,非关键设施同样也需要有效的运维管理,才能形成有机的整体。有的时候电梯的状况、照明的状况,新风系统的状况都可能对IT运维和机房环境造成一定干扰。如果纳入统一的管理平台,就能对提升运维管控水平有明显帮助。 二、场地设施管理的功能与特点 场地设施管理是整个数据中心基础设施管理的神经中枢。“管理”的含义分为“管”和“理”,“理”是手段,“管”是目的。“理”的功能为数据处理,即对各个子系统的反馈数据进行收集、整理、运算、分析。“管”的功能为根据“理”的数据分析结果进行运维操作、运维评判、预见故障、远期决策。 使用传感器、电控装置、智能仪表、控制器、执行机构和网络通信技术,对基础设施的子系统和设施进行监测和控制,全面感知各子系统的运行状况、分析各子系统的关联、预见或及时感知直接故障和间接故障、提前决策,提高基础设施运行的稳定性、安全性、可靠性。 “理”的部分功能需求如下: 1、各子系统实时数据采集 数据的采集是场地设施管理系统的基础,数据来源包括电力监控子系统、暖通BA子系统、安全防范子系统、消防火警子系统、建筑辅助设施子系统等。数据处理要求如下: (1)能直观显示各子系统的实时数据。 (2)能动态刷新各子系统的实时测量参数,如温度、压力、水流量、冷负荷、电压、电流、功率、频率等;显示数据时需与各子系统的测量装置编号、位置相对应。 2、数据统计与分析 系统可对采集到的数据进行过滤、计算、分析等,并提供数据动向报表及分析报告,报表可为运维人员提供数据分析结果,如日、月、季、年的数据统计、对比,并提供数据查询界面,即: (1)可查询各测量的平均值、最大值、最小值。 (2)可实现数据连续显示和动向分析,如冷负荷数据显示及动向曲线、电负荷数据显示及动向曲线、电压等测量数据显示及动向曲线。 (3)可显示并打印可选时间段内各子系统的日、月运行数据报表。 (4)可分班次显示、打印数据报表。 (5)可对历史数据库中两年内的数据进行回顾显示和打印,可设定历史数据库的记录周期,如每15分钟(可调)保存一次全部测量值。 (6)可查询并显示重要事故的历史数据和操作记录,数据可转存至光碟长期保存。 3、数据画面显示和模拟仿真功能 (1)可画面显示各子系统整体架构、运行状态等。 (2)可实现模拟仿真,即可在运行图形界面上进行工况模拟、培训,模拟仿真可提供人机界面,方便运维人员体验操作管理。 (3)可实现远程WEB浏览功能,即各子系统的动态参数可通过广域网进行浏览。 4、报警功能 (1)管理平台监视、过滤、分级报警信息并将信息发送至操作终端,并自动关联相似告警信息,进行数据汇总、分析。 (2)可将所有告警信息写入历史数据库,可供操作人员查询。 5、各子系统数据互联、共享 管理系统须提供各子系统的开放通信接口,实现各子系统信息互联、共享。 6、系统访问安全管理 (1)系统软件可进行权限和密级设置,为系统管理员、运维工程师、值班人员等提供多级密码,实现不同权限管理,并对所有操作进行带时标记录。 (2)人员管理:包括账号管理、权限管理管理等。 同时,数据中心场地设施管理应具备如下特点,方能实现管理目标: (1)通信协议标准并开放
(2)可靠性、可维护性和安全性
(3)实时性
三、场地设施管理的范围 场地设施管理的管控范围主要包括楼宇自控系统BMS、、环控系统、电力监控系统、消防报警系统、门禁系统、视频监控系统、会议音频系统等,如下图所示: 场地设施管理的管控范围 从运营管理的角度来看,各专业子系统侧重实效性和自动化程度,比如电力系统监测秒级的运行参数与报警信息,同时在应急情况下,能够按照预案自动化的进行倒闸切换,来提高配电系统的可靠性。楼宇自控系统监测对于冷冻站和机房级制冷,通过实时反馈手动或者自动的进行策略的调控。而DCIM是数据中心基础设施一种全面管理方式和方法,处于各专业化子系统的上层,DCIM更加关注各专业子系统的模型标准化、业务逻辑等,根据提取的信息分析数据中心内基础设施运行的影响,提供从规划、调优、预测和变更等多个维度的数据支撑。 场地设施管理的管控范围和实现的颗粒度和数据中心的功能要求、资金状况、企业发展策略、运维管理水平等多因素相关。其中制冷系统和电气系统是关键设施的重要组成,需要优先纳入DCIM系统。下文将分别介绍DCIM系统在制冷系统和电气系统中的应用。 四、DCIM对电力系统的影响 对于电气监控系统而言,需要实现数据采集、设备控制、测量、参数调节以及各类信号报警等各项功能。在大型数据中心常用的的10kV配电系统侧,一般引入至少两路及以上10kV市电电源,并且配置了柴发机组作为备用电源来保证市电异常时的供电安全。当出现10kV市电失电或供电故障时,需根据系统预先设定的运行方式,来完成两路10kV市电之间、市电与备用电源之间的自动化切换,提高自动化程度减少运维工作量,避免人工倒闸操作带来的误判断、误操作以及时间上的紧迫性、保证供电系统持续可靠运行;同时集成柴油发电机系统的并机,运行状态。在低压电力监测层面需要监测400V配电系统、UPS配电系统、蓄电池状态、机房列头柜参数、重要开关的状态,集成智能配电设备。实现对高、低压配电系统的全面监测。 1、中压侧电力监控系统 中压侧电力监控系统监控的内容居多,,首先需要通过多功能智能仪表和综保装置监测所有进线、母联、馈出线各线路的运行状况,如三相电压、三相电流、功率、功率因数、系统频率以及断路器开关、手车、接地刀闸的分合状态等,包括高压保护装置各类的报警信息、PT断线监测等。当出现10kV市电失电或供电故障时,则需要根据供电系统的运行方式和故障情况来完成10kV两路市电与母联之间、以及10kV市电与应急电源之间的自动化切换控制。以如下系统图为例: 中压侧电力监控系统 其中: ① N1、N2为两路市电1#、2#电源;G1、G2为两路油机1#、2#应急电源; ② 1DL为10kV1#市电进线开关;2DL为10kV2#市电进线开关;5DL为市电母联开关; ③ 3DL为10kV1#油机电源进线开关;4DL为10kV2#油机电源进线开关; ④ 1DL、2DL、5DL需实现电气或机械互锁,最多允许两个开关在合位; ⑤ 3DL、4DL、5DL需实现电气或机械互锁,最多允许两个开关在合位; ⑥ 1DL、3DL需实现电气或机械互锁,两个开关不允许同时在合位; ⑦ 2DL、4DL需实现电气或机械互锁,两个开关不允许同时在合位。 初始状态正常运行时,两路市电正常分别给10kVI段、II段母线供电,市电母联断路器断开的运行方式:N1市电断路器1DL合闸位置,N2市电断路器2DL合闸位置,母联断路器5DL处于分闸位置,3DL和4DL为分闸位置,自带控制系统投入运行并准备就绪。 场景1:N1市电正常,N2失电(上级线路外部市电失电)
场景2:N1市电失电,N2市电失电(上级线路外部市电均失电)
DCIM系统可根据N1、N2市电的数据记录,如夏季高峰时段容易断电的记录,提前告知运维人员维护N1\N2市电故障时需要倒闸的开关和母联,保障N1\N2市电故障时以上步骤顺利实施。 2、柴油发电机及柴油供应系统的监测 通过集成柴油发电机厂家提供的并机系统和采集相关柴发控制器等相关智能通讯设备,实时监测柴油发电机组、日用油箱、输油泵、供油泵的运行状态、参数,集成柴油发电机厂商提供的群控系统进行监测柴发进气孔、排风机、风阀等工作状态;同时根据监测柴油发电机组的并机数量情况,实现负载的自动投入顺序和数量。监测内容包括:柴油发电机的输出电力参数(电压、电流、频率、各种功率参数)、转速、油压、水温、启动电池电压、日用油箱液位、储油罐液位、输油泵运行状态、供油泵运行状态、柴油发电机房进风阀(如有)状态等。 DCIM系统可对负载进行数据分析与整理,并对负载优先级进行事先定义与分类,柴油发电机供电时,当超过1台主用油机启动故障或并机失败时,电力监控系统可根据DCIM设定好的负载优先级,优先满足重要负载供电。并对柴油发电机的运行状况出现异常时进行预警,记录异常运行参数为油机检修,保养时提供参考。 3、低压电力监控系统监控 对于低压侧电力监控系统而言,监视的内容居多,数据种类庞杂,数据量大,其管控内容举例如下: (1)400V低压配电室监测。通过多功能智能仪表对所有400V低压进线,母联,出线各回路的电参量进线监测,包括开关状态、三相电压、三相电流、功率等,提供上下两级电压、电流越限实时告警信息,实现对400V低压配电的全面监测和报警。 当采用低压柴发系统作为备用电源时,低压配电室多分散,需配置两路400V低压进线与母联之间,以及400V市电电源与油机电源的自动切换控制系统。正常运行状态为,两路400V进线各自带一段母线,母联断开的运行方式,自控系统投入运行并准备就绪。 场景1:低压400V单路市电失电时,则需自控系统自动分开400V失电线路的进线开关,确定分开后再自动投入400V低压母联开关,恢复供电;当400V失电线路上端口电压恢复供电时,先分开母联开关,在合上400V恢复供电线路的进线开关,恢复正常运行方式。 场景2:低压400V双路市电失电时,则需自控系统自动分开400V两路市电进线开关,分开母联开关,待主用低压油机启动成功具备带载条件后合油机应急电源向400V市电母线供电,合上母联开关满足系统供电。当主用低压油机启动失败时应发给备用油机起机信号,自动控制系统将备用油机作为应急电源给400V母线供电。 DCIM系统根据400V配电系统的运行状况进行分析,实时监测电压的异常波动情况,记录运行时电压越下限、下下限、越上限、上上限的时间和次数,提示运维人员关注异常状况,针对性的提前排除安全隐患,同时集成低压油机自带的控制器系统,监测低压油机的启动运行状况,记录异常告警信息,提供异常运行参数供运维人员提前检修、保养。 (2)列头柜配电监测。精密配电装置监测进线和出线的电量包括电压、进出线电流、零线电流、电压谐波、进出线电流谐波、进线漏电流、进出线有功电能、开关状态等,并能够对电压、电流、用电负荷等异常状况给出至少两级的报警信息,实现对列头柜用电负荷全方位的监测和预警功能,并将数据上传至DCIM系统。 DCIM系统可根据列头柜的电量汇总,实时提示运维人员IT设备电量的变化,例如当电量上升得厉害时,DCIM系统可发送通知至制冷系统,立即加速精密空调的EC风机,或者提前增开冷水机组,而不需要等到送风温度或送水温度偏离时再加速精密空调的EC风机和增开冷水机组。 (3)IT机柜智能PDU监测。通过智能PDU的测量功能可以检测整个机柜的用电状况和机柜内的每台设备的用电状况;此外通过智能PDU每个输出口的远程用电控制功能,还可以实现用电过载保护,空载输出口的节电和安全保护功能。 机柜PDU级监测是在机柜PDU进线处及其下各支路断路器前后监测用电状态,及时了解整个机柜的用电负荷情况并提供非正常状态告警。机柜级监测可连续测量相关用电信息为:机柜进线端单相/三相电流、电压、功率、三相平衡度及各分支电路的断路器前后端电流、电压、功率、开合状态等。 DCIM系统可对连续监测的数据进行汇总、比较和分析,当整个机柜的负荷过低时,可及时发现并预警“僵尸服务器”的存在,提示运维人员优化服务器配置及软件架构,当整个机柜服务器负荷过高时,可提示运维人员及时关注该机柜的用电安全,防止过载,降低上层PDU及RPP断路器跳闸的可能性,并及时关注该机柜的散热及周边空调的冷却能力,提前加速周边空调的EC风机,防止局部热点的出现。另外,机柜的用电数据还可为机柜内、机柜间设备部署、调整提供科学依据。 此外,PDU也可以集成机柜级微环境检测如:温度、湿度、气流、气压、空间、水浸、门禁等。 (4)UPS及电池监测。监测系统通过UPS的RS232/485通信接口获取数据;蓄电池组可增加专用监测仪,通过RS485通讯接口接入监控系统。监测系统采用模块化结构,后期增加UPS、蓄电池时只需添加相应设备即可。监测系统实时显示并保存各UPS的运行参数和部件状态,实时判断UPS的部件是否发生报警,当UPS的某部件发生故障或越限时,监测系统发出短信或邮件,并声光告警。监测内容包括:输入相电压、输出相电压、旁路相电压、输入相电流、输出相电流、旁路相电流、单节电池电压、单节电池电流、输出频率、系统负载、电池充电程度、电池后备时间、输入电压越限、输出电压越限、输出频率越限、过载、电池工作模式、旁路工作模式、单节电池电压高、单节电池电压低、系统报警、整流器报警、逆变器报警、关机、旁路电压超限等。 DCIM系统可对UPS、蓄电池的运行数据进行分析,当运行数据较常规运行的数据有较大偏离时,系统可提示运维人员重点关注异常设备并提前展开维护,防止设备运行状态进一步恶化引起故障。 (5)母线监测。母线槽也是数据中心应用越来越多的一种低压配电方式。其监测可分为有线监控和无线监控两种方式。有线监控可以通过RS485、RS232、RJ45等多种接口,将接插箱单元以及端口供电箱单元采集到的电力监控指标上传至管理系统中,包括 : 电压、电流、功率、能耗、功率因数等。 也可以在在系统接插箱单元或端口供电箱单元上安装独立的无线电力监控模块,每一个无线模块可通过标准的802.11NWI-FI信号,将监控信息发送到一个专用的网关上,该网关再通过RJ45网线连接用户的交换机,连入用户的BMS系统或DCIM系统。 (6)相关电气设备的运行状态及运维信息。低压侧电力监控系统采集并汇总变压器、直流屏、UPS、HVDC等电气设备的运行状态,并显示相关运行参数等。 DCIM系统可对这些电气设备的运行数据进行分析,当某些电气设备的运行数据较常规运行的数据有较大偏离时,系统可提示运维人员重点关注这些电气设备并提前展开维护,防止设备运行状态进一步恶化引起故障。 DCIM系统的数据统计及分析还可帮助运维人员了解如下信息:
五、DCIM对制冷系统的影响 对于制冷系统而言,绝大多数中大型数据中心已经拥有一套楼宇自控系统(BMS)。楼宇自控系统在数据中心中的主要是针对核心的能源系统的控制,主要包括以下几项功能。依据气象条件选择不同的冷源模式(冷机冷源模式、预冷混用冷源模式、自然冷源模式)控制制冷系统、故障切换的响应、依据系统负荷启动相应数量的制冷单元以保证系统冷量供需的平衡、精度及节能控制(通过压力、温差、COP等参数更加精细的控制含有变频功能的设备以达到节能的目的)。 由于种种原因,国内用户对BMS系统的自动化应用水平普遍较低,而且大部分的数据中心BA系统的管理范围也没有包括机房环境和末端送冷设备,这部分的监控还往往还是靠机房动力环境系统来支撑。由于这两套系统并没有很好的整合及数据交叉,这就容易造成数据中心管理的信息“孤岛”现象。所以,将BMS系统的管理范围横向扩展到机房环境监控,也成为一些大型数据中心用户正在实践的一种保障手段。 DCIM系统一方面可以在监测楼宇自控系统(BMS),另外一方面,可以对数据进行分析和整理,并以此为依据对BMS系统和运维管理方法提出优化策略,具体功能举例如下: 1、BMS系统可根据内部、室外气象条件、设备运行情况,严格控制服务器的空间环境。系统可根据服务器对环境的要求,监视服务器的进风温度、相对湿度,并以服务器的进风温度控制精密空调的水阀开度,以送回风温差、地板下静压或者其他信号输入为依据控制精密空调EC风机的转速。当进风温度、相对湿度数值异常的,管理系统告警。 DCIM则可以对运行参数进行统计分析,判断BMS的控制阈值是否合理,并依据数据分析的资料,导出调整策略,达到优化空调运行的目的。比如,BMS最初的空调送风温度设定值为18°C,运行一段时间后,我们观测到机房冷通道的温度普遍低于22°C,我们就可以尝试提高送风温度设定值,如果空调送风温度提高到20°C,冷通道环境温度依然满足18-27°C的运行参数,就证明水阀控制点是可以提高的,甚至冷水机组的出水温度都可以尝试提高。而提高水温可以提高冷水机组的制冷效率(水温每提高一度,冷机效率将提升2-3%。)、可以延长自然冷却的运行时间,从而达到节约能源的目的。 2、BMS系统能够按事先制定的程序顺序加机、减机:断电后,市政电网或柴机发电恢复供电,BMS系统能按照预设的顺序启动制冷设备;加载时,管理系统应能按照预设的顺序启动相应的制冷设备,减载时,管理系统也应能按照预设的顺序关闭相应的制冷设备。 DCIM则可以根据每次加减机的时机对数据进行分析,对照实际运行的冷机参数,判断是否会出现冷机低效运行的区域,并对加减机的时机提出调整策略,BMS调整后,还可以对调整前后的运行数据,再次判断调整的必要性和正确性。当然,这些对比分析必须依赖电力监控系统的数据,包括调整前后用电量对比数据,才能得出正确结论。 3、BMS系统可以监视末端冷负荷,并根据末端负荷加载、减载制冷设备的运行,实现产冷量与需冷量的匹配,避免过度制冷或制冷不足。DCIM则可以根据IT设备的监控系统和BMS系统的监测数据,对IT设备用电量和制冷系统产冷量进行对比分析,寻找运维漏洞,发掘节能潜力。 4、BMS系统可以自动替换故障组件和故障系统,可以针对故障组件告警,并选取备用机组投入运行,以减少运维人员的失误。比如,当冷水机组故障时,管理系统应能自动启动备用冷机;当精密空调故障时,管理系统应能自动启动备用精密空调;当控制器故障时,管理系统应能自动切换至备用控制器;当管理系统灾难性故障时,系统应能维持住控制器的最后一个命令、维持住制冷设备的运行状态,同时声光告警提示运维人员将制冷系统调整至满负荷运行状态。 数据中心的重要性就要求发生故障时,必须及时处理,以减少事故历时,降低故障带来的损失和风险。对故障数据进行分析、统计、整理无疑对提高运维水平影响重大。DCIM系统就是要做好故障期间的数据记录,寻找故障发生的诱因和共性,探讨缩短故障历时的途径,力争总结规律,减少故障次数,甚至对某些故障做出预判断、提前修可能故障的组件。比如我们在运维过程中,连续发现某种设备的传动皮带出现故障,而皮带运行时间远未达到上一批次的平均无故障时间MTBF,这就有可能本批次皮带的产品质量、安装方式或其他因素出现了问题,运维管理系统就应该组织资源对该类产品进行分析排查,提前替换不合格产品。确保制冷系统运行安全。 5、自然冷却场景下的运行模式切换。自然冷却是数据中心制冷常用的节能措施,即当室外温度和湿度条件满足时,充分利用室外空气自然冷量满足制冷需求,无需开启机械制冷。运用自然冷却需在制冷空调系统中增设节能器,分为水侧节能器和风侧节能器。 水侧节能器工作原理 风侧节能器即直接或间接利用室外空气的冷量制备冷风,当室外空气质量满足服务器的要求时,允许室外空气直接进入模块机房区,可采用直接风侧节能器,其工作原理如下图: 风侧节能器工作原理 当室外空气质量不满足服务器的要求时,不允许室外空气直接进入模块机房区,可采用间接风侧节能器,其工作原理如下图: 间接风侧节能器工作原理 风侧节能器需要大型空气处理设备、需大量进风及排风、过多占用建筑空间、增加建设成本;另外直接风侧节能器容易造成模块机房环境污染,需频繁更换过滤器,在我国实际工程中运用颇受限制。 无论制冷系统采用何种节能器,都需要制冷管理系统根据室外气象参数及制冷系统设备、管路状况准确、平稳地切换系统的运行模式,最大限度地节能,并在切换的过程中保障系统可靠运行。制冷系统模式切换需要遵循设计要求,而运行的实际参数可能和设计参数有较大出入,比如,原设计IT负荷为5000KW,实现自然冷却的参数点为室外湿球温度2°C。实际运行时,前期IT负荷只有2000kw,冷却塔的能力完全可以实现室外湿球温度4°C时就开始自然冷却。这样就可以延长自然冷却时间,达到节约能源、降低运维费用的目的。DCIM就是要分析这些数据,及时给出运行参数更新的建议,并由运维人员调整BMS系统,优化运行策略。 6、为了保障制冷连续,数据中心的制冷系统常常配置应急冷源(如蓄冷罐),以确保市电断电、冷机重新启动的时间段内,冷量可持续供给。BMS系统须实现应急冷源(如水蓄冷罐)的充冷、放冷及快速充冷:应能响应紧急情况,自动控制应急冷源运行状态。实现应急冷源运行状态的平稳切换。BMS需要准确感知冷机的市电供给状况,并在冷机掉电或其他紧急工况时,平稳切换至应急冷源供冷,保障服务器的冷量持续供应;在蓄冷系统放冷完毕时,BMS系统应有自动切换至再次充冷的运行状态。 DCIM系统必须整合冷源和电力的监控系统,确保电力故障引起的冷机重启时,应急冷源和备用电源的及时投入、适时退出。以免冷源控制系统和电力监控系统自称体系时,执行自控系统命令时影响到其他系统的安全运行,从而影响到整个IT环境的可靠性。 目前,已经运营的数据中心有很多,BMS系统和DCIM系统的可挖掘的空间很大。越来越多的从业人员在开始重视运维管理、重视资源整合和数据分析。通过管理平台对场地设施的管理,实现减少事故发生、缩短事故历时、优化运维模式、降低运维成本、提升运维效率、节约能源消耗是完全可行的。 (本文节选自《中国数据中心运维管理指针》,如需购买或转载请留下您的联系电话及邮箱发送留言至本公众号,将有工作人员与您联系) |
|