分享

经典回放|项元伟:从运维的角度看数据中心的建设

 yi321yi 2017-01-04


项元伟

中国数据中心工作组专家技术委员会委员

中国太平洋保险(集团)股份有限公司后援中心建设办公室/成都数据中心筹备组副组长


项元伟:我演讲的题目是《从运营的角度看数据中心建设》。为什么讲这方面呢?我从2014年开始公司调我去运营,因为我负责建设成都的数据中心,建好了负责运维,那时候工作组给我提了个要求,因为我做了运维嘛,希望我在这里面多多的把运维的体会介绍给各位。但我在想,因为工作组层面以建设为主,怎么把建设和运维切到一起,是我这两年一直考虑的事情,我今天给大家带来的内容就是从运营角度看数据中心建设。




我在早几年提到,我们造数据中心的时候的关注点:经济性、效率性、管理性、可靠性。当时还对数据中心运营没有什么体会,当时提到这儿。现在,讲三个方面,第一投产后遇到的问题,第二运维中关心的方面,第三关注运维的切入点。


首先,通常投产后会遇到什么问题?第一个,运维空间不充分、通道不合理。大家有没有遇到这样的问题,由于当时规划建设的时候为了提供更多的机柜,把整个空间设计得比较局促,整个后续运营当中包括整个路线组织上会有影响,我不知道负责运营的有没有这种感受。


第二个,后期优化管线难度非常大,把高压配电室只要在地板下面有强电的,你去翻开,基本能看到这样一个照片,说明我们在后期抽掉一根电缆是不可能的,加一根的话再做一个管道,要去更换是我做不到的。




你到网上搜,照片中的情况机房很多,那这个仅仅是运维人员管理不善造成的吗?有没有前期规划的问题呢?这个后面会讲。


第三个,BA、动环等监控系统容易形成单点。因为动环监控对我的运维影响也很大,我需要改造的时候,会发现这个里头有问题的,改造挺难的,我绑不到整个生产环境里头去(IP地址无法调整)。


最后,关键的系统缺少便捷的离线测试途径,但绝大部分数据中心没有在建设的时候就设计这样的方案,怎么比较便捷的离线下来测性能,这我相信也没有哪个用户敢做,因为它是最后一道防线,如果你电池出了故障,工作全停掉了。




我们分析为什么会产生这样的情况呢?我从这样一个角度,可能有些片面,我今天想说的就是这件事。首先,我们建设时间关注容量和可靠性需求多,关心运维的需求方面比较少。第二,我们关注物理空间比较多,关注运维少。第三,关注核心强弱电系统多,关心其它系统少。


我们规划的时候,我们不是非常关注后面运营到底需要我们做什么事儿,这是不够的。




讲了这个以后,我们看第二个问题,运维到底关注什么?而且这些点是我们在规划前期阶段就要看的,我之前讲了:经济性、效率性、可靠性,但我们看到,从运营的角度来说,它也是关注这三个点,但这三个点的着眼点都不一样。这里我总结一下,首先它是要有一个平稳性,数据中心比较平稳,第二是便捷性,我在日常的运维数据中心,包括机器上架,我要很便捷。第三,安全性,因为我们数据中心的建设其实对的是一个相对静态的目标,交给你的时候系统是达到的,比如说T3、T4、国标A,但运维是动态的,也是不一样的。


我们剥离开分析,其实这两件事情不能直接划等号。我们把这几点都拆开讲,首先你交付的成果和我提出的需求是一致的(从用户的角度看),这点其实蛮难做到,我们看这张图,用户的需求描述是通过一堆文字写出来的,我们理解交付是这样的,用户看到实物的时候,会有一堆的想法出来,你这样不对、那样不对,我原来表达的意思是这样…这样…这样…,你会发现原来双方沟通有差异,所以我们前期规划准确吃透用户需求是很关键的。




第二个,安全性要求每一个系统可靠性,是要匹配的,不是多少高或者多少低,而是每一个系统在不同的可靠度下最终输出的运维的能力,比如T3、T4,是能够实现这样统一的目标,这个是最重要的,所以不能有一个明显的长板或者是短板,因为如果存在短板的话,我们记住,我们长板,也就是电气也好、暖通也好,那些设计都是过度的设计,那个钱是浪费的。


第三个,交付成果的功能和性能是可以实现的,这个是用户非常关心的,我们最终联调测试交付的内容,是要完全100%实现当初的目标,是要花工夫去做的。




再看平稳性,能源的效率,我们反复说PUE什么,从PUE的角度来说,它的初期是很差的,它的效率是逐渐提高,当然我这里讲能源效率,百分比嘛,我们说效率是越高越好,当然它表达的意图是一样的,我们是希望它在一个比较低的负荷下面快速的提升,比如达到30%的时候,可能我PUE已经基本上接近目标的范围了,不需要达到70%、80%的装机率PUE才1.7、1.8。那它需要满载,而且用户持有数据中心,设备的安装周期很长,那怎么很快的符合运行的状态,这个是用户比较关心的。


要有灵活可靠的在线离线的测试,不同系统不一样,不展开讲,我们规划的时候,要把设计的点考虑进去,这是运维当中非常重要的关注点。


我们要关注运维的服务和质保是不一样的,我们选定一个设备的时候,运维需要的保证和建设过程中需要产品的质保是完全不一样的。




接下来讲到便捷性。从我们运维角度发现一个比较大的问题,当我在这端进行巡检的时候,我是没有变化走到这边来的,我在绿色的区域,必须穿过一个等级比较高的区域,或者我走到建筑外头绕,那无论两种方式中的哪种方式都不符合安全规范。一个好的地方,绿色的区域是要环通的,我是在数据中心里面可以从这地方灵活的走到另一个地方,不需要穿过更高等级的机房才能走得到,这个往往在我们规划设计的时候不太关注这些,所以我们要有一个方法,不同等级概念中要标出来,能不能很方便的走到不同的地方去。


这个是我自己数据中心的一个机柜,刚才我讲了,这个机房你布线很乱,你有没有想过另外一个问题,为什么这么乱?你回想一下刚才那张图片,它的机柜设计得很小,所以它后端的布线的空间几乎是没有的,没法理线的,所以我们在这儿,一个是说我把所有的机柜调整成一米二,机柜后面我要求至少留出25公分到30公分,这个空间是让它布线用的,那么同时我们现在都用了,我今天看到外面也有产品,模块化的PDU,我设计的时候不知道要装什么设备,模块化,我发现模块化更省,因为我只需要满配PDU的框就可以了,各种型号都买一点,要什么插什么就行了。


那么切入点,我们建设的过程中,从哪几个点切入,会产生比较好的效果?更关注运维需求,更充分规划运维关注点,更细致的设计图纸需求,运维中关注的几项细节。我们一个一个说。


如果说建好的数据中心是一棵大树的话,我们的需求就是大树的根,我们不能仅仅关心以前说的容量、安全等级,要完整的支撑这个大树,还有相当一块儿是运维的需求,是我们要在前期规划考虑的,当然不同客户、不同等级数据中心是不一样的,我们也不能千篇一律的用,也没必要,但是运维是有需求的,我们要关注。


第二个,我们要充分的规划运维的关注点,合理的平衡物理空间和运维的空间,充分评估人流和物流的组织的管理,这里我正在规划一个我自己的数据中心,可能也是一个初步的概念性的方案,我给大家讲一下,整个方案里面,在规划的阶段,交通组织,第一个要考虑到人进来后,怎么走到任何一个地方,货物需要多大的通道,我是设计在哪里,对称还是不对称去设计,货物进来后怎么最快捷的进到机房,在机房怎么摆列。




如果你的数据中心在行业里领先,如果经常有人参观,你要考虑有没有方法让人不进到数据机房,也构造红色区域,就把数据中心看完,这是高等级的数据中心要考虑的事。


第三,更细致的设计图纸需求,这张是目前大多数的建设者的施工图,它更多的是从工艺安装的角度表述,因为它给施工人员看,它标注了部件尺寸多少、每一个转弯怎么安装,表述的是这些。而这些对我的用户是完全没有用的,我不关心这个。我关心的是什么?我关心的是这里有管道,连到哪里去?下一个开关在哪里?下一个阀门在哪里?应急状态下怎么做?




这是一个真实的案例,就是它在招施工单位的时候已经把每一根管线做完了,这是可视化,我截了一张图,可能未来数据中心的设计也是往这个方向在走,它就是需要你在建设的阶段都做好,然后这张图交给用户,是用户最终非常需要的,它会知道我后面的运维每一个部件是通过什么方式连接的,下一个节点在哪里,关这个阀门对我系统有什么影响,而不需要像上面这张图纸这样,这两种完全不一样。


接下来讲一下运维关注的几个结点,第一张,柜门都关不上了,第二张,很宽的空间让你做布线,这个是设计当中要留出来的。这张图是我自己的案例,自己的照片,大家看从这里到这里是有非常大的空间的,给我布线,去展开做。


第二个,我们在规划的时候,往往会疏忽,监控系统可能就是厂商胡乱配,拿到我数据中心,我需要管理的时候,这些网段和每一个设备都是绑死的,所以接手的时候是不能调整的。


第三个,在高空作业的时候,你要设计有爬梯,有放爆措施。


第四个,仓储区域要有温湿度控制,如果你直接拿过去,可能生锈这些事情都来了。


最后一个,我们要有一个物业配套服务的作业空间,否则你保洁喝水的地方、休息的地方都没有,如果没有的话会在机房打盹甚至抽烟,这个是很大的安全隐患,要有一个空间留给他。


总结三点。第一个,运维需求是规划与设计基本的要求,不要缺失。第二个,不同安全等级有不同运维需求,我们不要忽略。第三个,一个好的建设方案一定是涵盖到生产运维的需求的,不要忘记。


我今天的介绍内容就到这儿,谢谢大家。

(以上文字部分来自于“CDCC2016数据中心工程标准化建设年度论坛”会场速记,如有纰漏敬请指正)


(视频实录,时长25:35,建议收藏查看)

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多