金融用户运维咨询服务项目案例
1现场调研与金融用户管理层以及数据中心运维团队相关人员进行现场面谈和调研,了解现有运维现状。将银行数据中心运维的基本情况,结合运维标准框架和实践经验进行比较分析,梳理它们之间的差距,提供差距分析报告并以此为依据制定咨询服务的具体实施方案。 2体系导入对银行管理现状与相关管理层的要求,结合运维标准及咨询公司在数据中心运维管理的最佳实践,系统地指出数据中心应增加何种管理领域的建设,从而提升数据中心的运维管理范围,为数据中心搭建运维管理体系模型。 3文档建立根据确认的运维体系管理域及文档模板,协助建立运维体系文档,文档包含管理制度手册、管理流程手册、操作流程手册及输出表单。所有运维文档以体系文件管理树的形式展现。运维体系文档建立完成后,对体系文档进行验证、完善。经过修订后体系正式发布启用。 4人员培训体系建设完成后,将已完成的体系文档对不同岗位的运维人员进行针对性的培训,建立培训计划。管理性文档会针对运维管理层进行培训,操作性文档会针对运维技术人员进行培训。培训后会对运维团队所有人员进行考核。保障运维体系启用后能够被有效、完整的执行。 通过机房现场及运维工作两方面的咨询,共涉及机房现场23项问题,运维工作15项问题。 如上提到的金融用户在运维管理上的问题,其实也是整个金融行业内普遍存在的问题。造成问题出现的主要原因有如下几个方面: 1、金融用户管理体制,金融行业本身资金非常充足,在设施建设和投入力度上非常大,可是考虑到安全管理方面的原因,在运维人员投入上却非常少。所以在人员配置上的投入成本很少,造成运维人员数量无法满足7*24要求。尤其是金融用户总行数据中心运维人员除需要完成总行数据中心运维工作外,还需要下属分行、支行数据中心的运维工作。再加上非正式员工不能有权限进入机房的要求,造成金融用户运维人员工作量超负荷,岗位职责不清晰,不能全身心的投入到数据例行维护工作中。
综上所述,从近几年金融用户出现的重大故障分析来看,究其根本原因都是在运维管理细节上出现了问题,运维无小事,当这些细节管理没有得到管理人员及运维人员的关注时,风险也会悄然而近。作为数据中心运维团队人员只有持续性的不断改进、完善运维工作,才能真正的去保障数据中心运维安全。 作者手记:
点击“阅读原文”,分分钟原汁原味杂志印刷版快递到手哈。 |
|
来自: 昵称bL4ze1MC > 《待分类》