分享

【鹅厂网事】探秘腾讯网络备件管理演进

 longabcdyui 2017-08-19


前言
网络备件是网络运营的生命线,网络设备硬件故障处理离不开备件服务的支撑。备件服务模式可分为厂商备件服务和自有备件服务,两种模式各有特点。如何根据网络规模和运营能力选择合适的备件模式;如何有效的开展精细化的备件管理为网络运营提供优质可靠、低成本的备件服务,是我们在网络备件管理工作中需要解决的问题。

腾讯网络备件管理经历了三个主要阶段,从最初厂商备件模式到厂商备件加自有备件的混合模式,再到精细化的备件管理,我们在备件模式的选择和备件管理精细化程度上都在不断进化。

本文结合网络备件模式的特点为大家讲述腾讯网络备件管理的演进之路。
网络备件模式
厂商备件即由网络设备供应商提供硬件维保服务(软件服务 备件服务),发生设备硬件故障时由厂商将备件寄送至故障机房支撑故障处理。网络设备供应商提供的硬件服务按照等级从高到低有7*24*4、7*24*NCD(下一自然日)、7*24*NBD(下一工作日)等。厂商备件模式的优点为不需要对备件进行具体的管理,但备件响应时长不能完全满足运营需求,备件费用随设备数量线形增长。

自有备件即由网络运营方采购同型号的网络设备作为备件,发生硬件故障时备件由运营方负责管理和调用,厂商仅提供软件服务支持故障处理。自有备件模式的优点为响应时长更能贴合运营需求,当网络规模较大时备件总成本较低。但在初期需要较大成本投入进行备件采购,过程中还需进行备件补充。自有备件覆盖的范围越大,投入的管理成本也越高。

备件模式的演进
早期腾讯网络整体规模不大,备件服务采用厂商备件模式。随着网络规模的扩大,厂商备件成本不断增加。厂商备件服务承诺的备件到位时间为4小时,加上设备替换时间,故障恢复时间较长。单一的厂商备件模式受到不断增加的备件成本和响应时长的双重挑战。

为应对成本和响应时长的挑战,我们引入了自有备件模式作为补充。根据网络设备在网络架构中的层次、冗余性和规模综合评估响应时长和成本,将接入层设备由厂商备件模式替换成自有备件模式。

响应时长评估:承载网、城域网核心设备完全冗余,厂商备件4小时送达时间能够满足故障恢复SLA时限要求。接入层设备并非完全冗余,对故障恢复SLA时限要求较高,使用自有备件更能贴合运营需求。自有备件快速响应的特点需要常备机房驻场人员才能充分显现,在网络驻场人员就位的情况下从领取备件到到达故障处理现场的时间不超过20分钟。

备件成本评估:承载网、城域网核心设备规模小、同型号设备数量少、备件采购单价高、利旧资源少,使用厂商备件模式成本较低。接入层设备数量庞大、设备采购单价低、利旧资源较多,使用自有备件模式在成本较低。(利旧指因产品架构升级或IDC裁撤下架的非故障网络设备整机、部件重新使用。)

在评估成本时我们还需要注意两种备件模式在成本投入时间上存在较大差异,应根据设备折旧年限评估每一年的成本和总成本。

厂商备件成本=设备数量*硬件维保价格*设备折旧年数
自有备件成本=备件采购 备件补充 设备数量*软件服务价格*设备折旧年数
精细化的备件管理

为了提供更好的备件服务并降低备件成本,我们朝着精细化的备件管理演进,并不断尝试和创新。

厂商备件管理方面,随着架构的优化和整体运营能力的增强,我们选用不同等级的厂商备件服务,将城域网核心设备服务等级从7*24*4降至7*24*NCD,降低备件成本。

自有备件管理方面,在接入层备件实行部件化管理,当交换机电源、风扇故障出现故障时仅需更换同型号的电源和风扇,而不用更换整机,省去了故障处理过程中机器上下架、设备配置导入等环节,提升了故障处理效率同时也节省了成本。未来我们还会在核心层开展自有备件试点,评估核心层设备自有备件对运营效能的影响。

精细化的自有备件管理,需要有相应的流程、工具和人来支撑,我们主要对自有备件管理中的五个子流程进行管控。

1
备件库搭建
根据不同网络设备故障恢复SLA时限要求,分别建立园区备件库和城市备件库(逻辑),覆盖当前城市所有机房设备的备件使用需求。

2
备件容量管理
容量管理结果直接决定了备件支撑率和成本,根据网络备件的特性可建立概率性需求模型,同时需考虑备件补充周期和可用性风险。模型中备件库覆盖设备数量、设备故障率的变化都会影响备件库容量模型的计算结果,同时故障替换消耗的备件会影响备件库存量。备件容量管理是一个动态管理过程,需要有标准流程和支撑系统对影响备件容量的事件进行管理。
3
备件补充
根据容量评估结果对网络备件进行补充。备件来源包括备件调拨、利旧和备件采购,充分使用利旧资源可降低成本,缩短备件补充周期。

4
可用性管理
根据备件出入库流程、备件库6S标准对现场备件的出入库、存放合规性进行管理;根据备件抽检流程对备件进行通电检查和OS版本检查,保证备件能够在第一时间转入运营。

5
备件使用
网络备件仅限于故障设备替换、故障测试时使用。我们通过备件资产领用返还流程和线上化系统对备件的使用进行管理,网络运营人员新建故障工单保证备件使用需求合理、向现场派发备件出入库工单保证出库型号和数量的准确性、通过配置变更系统保证设备状态准确。

小结
网络备件管理的每一次演进都是围绕备件服务质量和成本进行的,当中也离不开人、工具和流程的支撑,只有整体运营能力提升,精细化的备件管理才能落地实施。本文通过网络备件管理的演进向大家介绍了不同网络规模下备件模式的选择和自有备件的管理方法,希望本次分享能帮助大家通过精细化的备件管理为网络运营提供高质量、低成本的备件服务。

微信号:鹅厂网事

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多