分享

筑好数据中心电力最后一道防线:末端配电调研分析与选型指南

 tuzhanbei2010 2022-09-28 发布于四川

【编者语】

CDCC发起了“数据中心基础设施运营调研及数据中心PDU应用情况专项调研”,共采集数据中心样本总数568个。在数据中心IT服务中断(宕机故障)的主要原因占比中,电力原因高居第一位,而在“所在的数据中心有哪些电气专业的设备发生过故障”中,数据中心PDU故障占比达34%。据悉曾经某品牌PDU被列入知名互联网公司数据中心供应商黑名单,这一事件也充分印证了末端配电在数据中心配电系统越来越受到用户的高度重视。

针对CDCC独家调研数据,特别邀请金融、运营商、第三方数据中心、设计院专家和主流厂家代表,就数据分析、技术趋势、产品选型等多个维度发表精彩观点。综合来说,高质量的产品能够有效减低数据中心故障,可以为筑牢数据中心最后一道防线发挥重要作用。

图片

#1

“小设备,大作用”,不可小觑的末端配电

CDCC调查数据显示,在“所在的数据中心有哪些电气专业的设备发生过故障”中,数据中心PDU故障占比达34%,“小设备,大作用”,不可小觑的末端配电。

图片

柴发、中/高压柜、变压器属于中/高压系统;低压柜、UPS、高压直流属于低压系统;列头柜、PDU属于末端配电系统。从调研数据上可以直观的看到,中/高压配电系统故障发生比低于低压配电系统和末端配电故障发生比。可见,电压等级越低,故障发生率越高。

这个结果可以从三方面理解:1、电压等级越高,出现故障的危险性、影响面越大,因此在设备购置、安装、调测和验收方面,受到的重视程度也越高。例如,高压配电系统和高压电缆均需要通过当地供电公司检测并合格后方可送电,而低压配电系统自行检验检测送电即可,重视程度越高,质量必然更好。2、电压等级越低,越靠近客户系统,相关的分合闸、割接、切换、维护保养等操作越多,可能出现故障的因素越多。3、电压等级越低,设备的数量越多例如,一台变压器下端通过UPS可能带几百个蓄电池,数量不同,发生故障的概率必然不一样。

中国工商银行数据中心资深经理 龚慧钦:

末端配电PDU,肩负末端配电以及保护跳闸作用。由于其数量众多,且易受IT设备自身电源模块故障的影响,因此表现出的故障或跳闸现象比较普遍。

联通数字科技有限公司哈尔滨中心建维经理 车凯:

PDU属于最靠近客户设备的配电末端,至关重要,选用劣质断路器可能导致设备损坏、不可靠,甚至发生火灾等危险情况。在本次调研中,有接近15%的故障,原因有PDU自身质量的问题,也有客户设备功率变化、客户电源线质量问题、客户设备散热不好等因素的影响,因此PDU的前端预警变的至关重要。很多数据中心由于成本等因素,在配置PDU时没有选择具有远程监控和数据收集功能的设备,因此不具备检测潜在故障和及时预警的功能。

中国电子工程设计院有限公司电气主任工程师 杨峻:

PDU属于末端配电,设计师在设计时通常关注度不高,对于PDU采用三相还是单相配电概念不清。在PDU设备的采购过程中,如果随机柜打包,采购时如没严格的品牌把控,可能得到的结果并不能让运维人员满意,在前期设计和采购中有运维人员的参与将有效降低PDU选型带来的后期运维麻烦。PDU在后期运维过程中属于操作相对比较频繁,运维人员在操作前也应培训到位。

#2

故障原因众多,产品质量问题依然严峻

PDU故障原因表现在多个方面,其中过载跳闸以47.45%位居首位。在导致设备故障的主要原因中,产品质量问题占比38.87%,依然成为选项的重点。

图片
图片

联通数字科技有限公司哈尔滨中心建维经理 车凯:

在本次调研选项上,地线缺失、监控未对应和越级跳闸属于建设类原因,合计占比达到75%,产生的主要原因是建设质量不达标和测试验收不规范。PDU地线缺失通常是建设期不重视造成的,而监控未对应很大程度是在验收测试中,没有实现对设备的全覆盖,而是采用了按照百分比抽测的方式。越级跳闸与设计、运维都有关系,通常设计需要给出各级开关整定值的初始参数,而运维人员也可以根据实际负载情况进行调整,避免越级跳闸的出现。

过载跳闸、漏电告警、过温等都与客户设备超载有关,其中过载跳闸比较常见,达到了近50%。通常,机柜内上架IT设备的额定功率一定大于机柜所能承载的最大功率,虽然平时达不到额定功率,但在开机等特定时期可能由于瞬间电流过大引发过载跳闸。客户IT设备供电模块、电源线等出现故障也可能引发跳闸。

世纪互联运维产品总监 宫伟达:

从分析结果看,过载导致PDU跳闸或越级跳闸的因素有很多,主要分以下几类:

1、设计选型不合理,下端设计大于上级微型断路器额定载流量,导致越级跳闸;

2、微型断路器本身质量问题或磨损老化,导致的故障跳闸;

3、IT服务器电源模块故障导致的跳闸;

4、PDU生产工艺问题导致内部焊接点开焊短路或接地导致跳闸;

5、多功能智能PDU电子元器件故障短路导致跳闸。

中国工商银行数据中心资深经理 龚慧钦:

可以通过技术管理手段降低PDU自身故障概率。采购选型质量合格的PDU产品。在机房建设阶段注重安装工艺,提升安装可靠度,也可选择工厂预制的模块化机房产品,减少现场安装施工量复杂度,进一步提升安装可靠度。

在综合测试验收阶段,使用满载负载分批对PDU进行加电测试验收,确认其可靠性。在运营阶段,随时间积累及负载不断变化,存在接触松动的可能性,需要定期进行负载分析和红外成像检测,及时排除风险隐患。 

#3

智能化是必然趋势,优质品牌是理想选择

目前国内从事PDU生产和销售的厂家有小几百家,用户该如何避坑找到真正的优质产品?设备选型时该如何做到科学合理?特邀数据中心主流PDU厂商代表发表观点。

图片

罗格朗中国数据中心业态技术总监 周里功:

智能化是末端配电PDU的必然发展趋势,一些智能PDU的领先厂商,已经将智能化的功能从基本的电力监测,扩展到了微环境监测、门禁管理、资产管理等领域。其中,测量功能越来越重要,尤其是在对数据中心双碳策略的出台,PUE成为了公认的衡量指标,智能PDU的测量功能从测量输入端到测量输出端,测量精度可以达到计费级的1%。另外,近年来PDU的模块化也成为了一个发展趋势,便于用户的扩容、检修和维护。

罗格朗旗下的PDU产品目前在全球的PDU市占率高,克莱沃是国内PDU的头部品牌。对于数据中心选择PDU,建议如下:

1、选主流品牌、大品牌肯定不会错;

2、考察功能相同或相近的PDU的成功案例;

3、定制化的水平(如起订数量、定制周期等);

4、样机评估及测试:负载测试甚至拆解。

图片

公牛数据中心母端配电技术研发总监 江长胜:

数据中心的节能技术成为行业的热门研究方向,末端配电节能降损的研究主要体现在以下几点:1、对用电侧进行节能产品开发。2、提高设备、系统的智能化管理水平,配合数据中心向着数字化管理方向转化,对数据中心电源系统能源损耗情况进行分析。3、以数据中心供配电系统为出发点提出相关的节能方案,以此推动数据中心的发展。

数据中心末端配电选型要点,一方面是注意设备本身能耗。供配电系统的节能主要是在满足电能的使用前提下,通过减少供配电设备本身的能耗来实现节能。为此,除了使用节能设备之外,还要考虑整个配电系统的合理性,以采取行之有效的方法来减少设备能耗。另一方面,要注意管理系统设备用电参数。随着各场所用电设备及用电量的增加,配电网发展迅速,配电管理中如果还是依靠人工进行监管,管理难度大,数据实时性跟不上。智能配电采用的是“设备自采集+实时监测+平台预警”的智能化管理方式,不受人工经验、主观意识为转移,系统构建了一套多维监测、预警体系,提供更可靠的安全保障。

图片

昌遂控股(深圳)有限公司销售总监 巫桂根:

为满足智能电网、电力自动化以及高可靠信息网络建设的进一步需求,供配电系统中末端设备PDU的智能化已成为新趋势。昌遂的智能PDU可以实现精细化用电安全管理,帮助数据中心更节能。从目前市场上主流智能PDU的使用情况来看,智能PDU有以下三方面需要改进,以提高智能PDU的安全性、可用性及普及率。

1、界面的便捷和有效性。数据中心建设完成后,机柜数量庞大,分配的PDU数量更多,如果产品读取数据不够快捷,不能及时有效发现故障设备,造成运维人员维护理解混乱、界面不清晰甚至出错,这样就不能随时追溯任意时间的所有异常报警信息。

2、硬件稳定性。智能PDU功能越来越多,稳定性是用户非常重视的一项指标。运维人员经常通过远程网页登录控制,必须考虑不影响内部环境的正常供电和对电力的控制,实时发现网络设备运行的异常状态,在最短时间内迅速排出故障,达到一点控全局的效果。

3、性价比。目前智能PDU要普及应用,需要提高性价比。

图片

深圳市胜威南方科技有限公司技术总监 党斌,研发总监 陈孔亮:

预制化、模块化、智能化是PDU新的发展趋势。目前,主流的数据中心基础设施供应商都推出了智能PDU解决方案。作为数据中心末端配电的国内头部企业,胜威南方公司不但拥有智能PDU产品研发、设计能力,同时具备智能仪表模块生产制造能力,拥有先进的DIP电子插件生产线,保证产品质量稳定、可靠的同时,可根据客户多样化的需求进行灵活定制。同时还推出了IBS母线+智能PDU整体解决方案,两者相配合,能够将数据中心配电管理提升到新的高度。

数据中心末端配电选型要点:

1、选用行业内知名度高品牌。用户需要关注厂商是否是长期专注于此类细分市场,拥有丰富的产品开发、质量管控经验。在关键制程、关键部件上精益求精,确保产品稳定可靠。

2、优先选择长期与国内外各大互联网、第三方数据中心运营商、三大电信运营商等大型企业合作的品牌。

3、选用创新能力强的产品制造商。长期致力于数据中心末端配电技术发展,有专业研发团队,具有自己的核心技术和专利。

4、选用一体化整体解决方案。优化设计、提高效率、方便维护、节约成本。

#4

优化多种运维手段,避免或减少PDU故障

选择优质产品、规避导致故障发生原因的同时,也应通过多种运维手段,有效地避免或减少PDU故障,提升数据中心运营质量。

图片

A、B和D选项都属于建设后运维前的测试验证范畴,占比都在30-50%之间。一方面,验收时,PDU等配件不要由于数量多就选择抽测,一定要做全量测试。另一方面,在测试时要严格参照测试标准逐项核对,前期放宽要求,必定给运维期带来极大隐患。C选项说明有1/3的运维人员认为,通过对温度的监控能提前发现过载、短路等引起的安全问题。

中国工商银行数据中心资深经理 龚慧钦:

要通过冗余高可用架构提高因IT设备电源故障所造成的PDU跳闸容忍度。由于PDU承担保护跳闸功能,一个机柜的某台IT设备电源模块短路故障或异常过流故障,将可能导致PDU保护跳闸,造成整个机柜失电。此类跳闸现象并不少见,且难以通过技术管理手段完全避免。需要确保双路供电冗余架构的有效性:采用双路供电模式、单电源设备采用STS供电模式、IT侧可采用云化等高可用部署模式,提升跳闸容忍度,减少系统运行风险。 

世纪互联运维产品总监 宫伟达:

在常规数据中心建成后或是运行中有很多方法可以检验PDU的状态,总结几点措施:

1、设计初期需要进行配电链路的复核,避免设计缺陷;

2、集采阶段应尽量采用优质PDU产品,尽量采购结构相对简单的PDU;

3、建设期间利用假负载进行压测检查链路承载能力;

4、上电时需要对PDU的压接进行检查,避免出现线缆压接松动的现象;

5、运行中利用红外热成像定期巡检扫描,及时发现虚接点和过载发热点。

联通数字科技有限公司哈尔滨中心建维经理 车凯:

PDU选型时可参考的要点如下:1、PDU过载、温升等情况时常发生,从安全角度考虑,尽量选取耐温等级和阻燃等级高的产品;2、PDU的很多智能化功能并不实用,但通过对插口电流、温度变化的监控和分析,可以做出预警和预判,提前排除隐患;3、PDU接口最好具备兼容性或者可调节性,以应对因客户设备变化而更换插孔类型的情况。

总结

随着“双碳”战略的推进,“东数西算”工程的进展,全国范围内形成布局合理、绿色集约的数据中心一体化格局已在路上。作为数字经济的支撑,数据中心不论数量还是规模都在增多壮大。面对数据中心高可靠、高可用、高密度、大电流的要求,PDU不仅会迎来新的发展趋势,而且肩负着越发重要的责任。CDCC将《数据中心PDU应用情况专项调研》贡献给行业,并持续开展专项研究。CDCC持续汇聚数据中心生态系统中多方力量,一起为数据中心高质量可持续发展贡献力量。呼吁设备厂商以提升产品质量为发展核心,推出更优秀的技术、产品和方案,筑好数据中心电力最后一道防线。

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多