分享

【视野】智慧IT运维破解高复杂度数据中心管理难题

 老黄兄 2014-10-15





云计算发展带来业务量、信息量及用户数量的快速膨胀,数据中心不仅规模增长迅速,而且需要具备强大的突发调拨能力,以应付不断的突发性业务需求。据不完全统计,目前中国各类数据中心总量约43万个,可容纳500万台服务器。其中,经营性数据中心机房921个,机柜数约17.7万个,可容纳服务器月200万台。

同时,数据中心也日益成为基本的社会基础设施,这需要更高的服务连续性和更低的成本,而当前数据中心大部分还处于孤立、粗放的部署模式,重复建设与低效利用并存,可用性低与成本高并存。

对于一个良好运营的数据中心,其生命周期经历了从咨询规划、布局建设、使用维护、升级优化等多个阶段。在这漫长的过程中,“运维”是其中最重要、也是最长久的环节。如何管理数以万计的服务器,如何提高资源利用率,如何实现高效的人员管理。在运维过程中,安全、架构、自动化、预警、虚拟化、流程、工具、培训等等无不贯穿于其中,它们在运维专家的管理下,形成一套先进的“智慧运维管理体系”。而在拥有海量IT设备的数据中心,要成熟、高效、稳健地实施“智慧运维”,何其难也!一方面是种类繁多、数量庞大的软硬件,另一方面是对业务连续性的严苛要求,同时还要兼顾到人工成本和能耗控制。此外,新技术的发展也推动的运维管理工作的升级,提出了“运维可视化”、“运维实时化”的要求。运维不再是“救火队员式”的后知后觉,而能通过预警将隐患消弭于未然。

要达成这些运维目标,对于运维企业而言并非易事。要想将数据中心里成千上万的IT设备“信手拈来”,这其中考验的不仅仅是经验,也不仅仅是技术,而是要基于一整套完善的、经过实践验证的先进的方法论,将人员、工具、流程、平台等有机整合。

赛迪监理在数据中心运维服务领域发展多年,整合先进的数据中心运维管理经验,创立了针对大型数据中心的运维管理体系。在该体系中,同时实现了“人员、工具、流程、平台”十大要素的一体化。例如,“监控管理平台”和“技术工具集”的一体化。前者用于有效地发现和预警问题,可支持万台以上的IT设备监控,支持多操作系统和多硬件平台。后者用于处理日常运维的特定需要,将常见的技术活动进行归纳总结并工具化,包括:数据库自动重建工具、容灾快速切换工具、存储配置自动收集工具等,可在简单有效地解决问题的同时,最大程度地减少人为操作的风险。通过研究与实践相结合,在为高复杂度数据中心提供运维管理时,将日常巡检、系统监控、故障预警、可视管理、自动记录等无比繁琐的运维活动变成有条不紊、有章可循、有迹可查的“智慧IT运维”。


 













    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多