分享

【干货】长发光故障剖析

 文化龙乡 2016-12-17
1
前言
自2008年我国各个运营商将EPON/GPON作为全业务接入网的主要技术,中国的FTTx用户在2016年将达到1亿多个,占全球用户的50%多,但是点到多点的PON网络毕竟不同于传统的有源传输网络,在网络运维方面会出现一些特殊情况,流氓长发光ONU的检查和定位就是必须解决的问题之一;下面我们将分享长发光ONU故障处理的心得。

2
长发光ONU的定义

长发光ONU是对那些光模块不受控制的ONU的形象称呼;根据长发光故障的原因可以分为“间歇性长发光”与“持续性长发光”。


3
长发光故障的现象

      故障现象一:大量用户端ONU的PON灯一直闪烁(链路正常),无法注册上线;一个PON口下只有一个onu上线,其他的onu都下线(提示link-down状态);

      故障现象二:大量用户端ONU业务不稳定(ONU掉线);一个PON口下大量ONU持续出现上下线;
      故障现象三:大量用户端业务不稳定(ONU在线),PPPOE拨号中断;一个PON口下大量ONU出现OAM协商阶段,下行数据业务中断。

4
长发光故障的原因

上行数据流以TDMA 的方式共享上行带宽,光线路终端(OLT)在下行帧中以字节为单位指示上行数据流在上行帧中允许的位置,OLT在下行物理控制块(PCB)中发送时隙授权,这些时隙授权指示了每个ONU发送上行数据流的开始时间和结束时间。这样在任意时刻只有一个ONU可以访问媒质,在正常工作状态下不会发生碰撞。


如果有ONU不按照OLT的带宽映射方式发送数据流,可能会导致整个PON口无法正常工作。长发光ONU就是这样一种“流氓”ONU,其特征是占据了其他onu发送上行数据流的时隙,使其他ONU不能正常工作。
 
导致流氓ONU 出现的原因可归结为两大类:一类归结为PON 芯片控制软件故障,另一归结为光模块硬件故障。前者是指ONU 的PON 芯片内部负责控制光模块打开和关闭的状态机或寄存器由于某种原因产生异常,无法在正确时刻产生正确输出; 后者是指PON 芯片本身是正常的,能在正确时刻发出打开和关闭光模块的命令, 但ONU 光模块或辅助电路发生故障,不能正常响应PON 芯片的命令。如果ONU长发光故障,甚至是完全不受控制的长期发光(持续长发光ONU),就会对xPON 中的协议报文(MPCP) 和OAM 帧都产生干扰,导致整个PON 口下的大量ONU 都无法上线或则业务不正常,使整个PON 口都退出服务!

5
长发光故障的定位及处理

(1)“流氓”ONU的定位

通过用户端故障现象、长发光检测模块的检测机制及设备网管软件告警定位。


(2)“流氓”ONU的处理
     方法一:人工排查,起初部署xPON 网络时, 当出现PON 口下大量ONU注册失败或则业务不正常时,维护人员首先要通过光功率计查看是否上行有长时间漏光。这种方法只能检测到硬件故障的流氓ONU, 却很难检测到软件故障的流氓ONU。在确认有流氓ONU 后,首先要由运维人员在分路器处尝试拔掉1 根分支光纤,然后再观察其他ONU是否能注册上;如果其他ONU 都仍不能注册,就再尝试拔掉下一根分路光纤。
     方法二:软件处理机制,随着EPON技术的成熟,通过OLT自动检测机制与自动处理机制隔离故障长发光ONU,在设备日志或则网管软件可以告警提示及定位到该ONU物理地址,以便现场更换故障设备。

6
总结

长发光故障ONU 可能存在于正常使用中,由于运行时间加长、环境温度波动、器件老化等因素而产生;各个厂家针对ONU长发光故障,有不同的检测机制与处理机制;但是最终目的都是达到定位、隔离故障ONU的目的。



    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多