分享

数据中心服务持续性管理

 yi321yi 2017-01-24

数据中心服务持续性管理,是负责预防灾难、增强IT基础架构的弹性(Resilience)和容错容量(Fault Tolerance)的过程,它需要确保组织在发生灾难后有足够的技术、财务和管理资源,来确保IT服务的连续性运作。


数据中心服务持续性管理的目标,是确保业务运作所需的IT基础架构和和IT服务在灾难发生后的限定时间内能够得到恢复,从而对组织的总体业务连续性管理(BCM)提供支持。数据中心服务连续性是BCM的一部分。


国家针对业务连续性先后出台了多项有关灾难备份的保障措施。已出台的有关文件如下:


(1)2004年9月份下发了《关于加强国家重要信息系统灾难备份工作的意见》(信安通〔2004〕11号)。文件强调了“统筹规划、资源共享、平战结合”的灾备工作原则;国家为此圈定了银行、保险、证券、税务、海关、民航、铁路、电力等必须建立灾难备份的八个重点行业,同时提出,灾难备份建设要从实际出发,提倡资源共享,可以采用自建、共建和利用社会化服务等模式,鼓励社会力量参与灾难备份设施建设,提倡使用社会化灾难备份服务,走专业化服务道路。


(2)2007年11月1日,国家正式下发了GB/T 20988-2007《信息安全技术信息系统灾难恢复规范》。该规范作为我国目前颁布的第一部关于信息系统灾难恢复工作的行动指南和标准;明确定义了灾备行业的规范用语;规范了整个灾难恢复的工作流程;作为资料性附录,提供灾难恢复预案的模板;引入了灾难恢复的分级机制(目前确立为六个级别)。规范指出要加快实施八个重点行业(银行、电力、铁路、民航、证券、保险、海关、税务)的灾难恢复工作。


对于第三方数据中心服务提供商,数据中心服务连续性主要是指业务应急预案体系最大限度减少灾难性事件出现时对于SLA达成的影响;对于甲方数据中心,通常需要通过建设灾备中心来解决IT服务连续性的问题。


数据中心服务持续性管理的关键点包括:


(1)数据中心预防和应急预案体系。对于数据中心运营管理来说,应急预案的完整性和充分性是数据中心业务连续性的重要部分。但对于数据中心灾难性事件的预防机制的重要程度和投入,要更大于应急预案体系的建设。数据中心应急预案常见的分类如下:


  • 消防系统应急预案

  • 供配电系统应急预案

  • 制冷系统应急预案

  • 物理环境应急预案

  • 网络故障应急预案

  • 公共事件应急预案

  • 自然灾害应急预案


数据中心应急预案制定的关键点如下:


(1)应急小组成员和联系方式明确和准确;

(2)应急响应流程明确,每个阶段的响应责任到人;

(3)应急过程中的安全注意事项;

(4)应急预案场景化;

(5)应急预案容易获取;

(6)应急预案简练;

(7)应急预案的定期演练;

(8)演练后的持续改进。


(2)数据中心灾备中心建设。数据中心级灾备模式一般有三种分类,两地三中心模式、同城模式和异地模式,其中异地模式要考虑灾备点的物理距离,常见的要求是灾备点距离≧800公里。对于这部分内容,国家相关文件有许多明确的要求,尤其是对于金融机构。具体可以参考相关文件。


  • 《国家信息化领导小组关于加强信息安全保障工作的意见》;

  • 《关于做好国家重要信息系统容灾备份工作的通知》;

  • 《关于加强国家重要信息系统灾难备份工作的意见》;

  • 《信息安全技术信息系统灾难恢复规范》(GB/T 20988-2007);

  • 《中国人民银行关于加强银行数据集中安全工作的指导意见》;

  • 《关于进一步加强银行业金融机构信息安全保障工作的指导意见》;

  • 《银行业信息系统灾难恢复管理规范》行业标准的通知》;

  • 《商业银行信息科技风险管理指引》;

  • 《商业银行数据中心监管指引》。

(本文节选自《中国数据中心运维管理指针》,如需购买或转载请留下您的联系电话及邮箱发送留言至本公众号,将有工作人员与您联系)


    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多