流氓ONU处理方法总汇编Word下载.docx
- 文档编号:17242937
- 上传时间:2022-11-29
- 格式:DOCX
- 页数:9
- 大小:48.17KB
流氓ONU处理方法总汇编Word下载.docx
《流氓ONU处理方法总汇编Word下载.docx》由会员分享,可在线阅读,更多相关《流氓ONU处理方法总汇编Word下载.docx(9页珍藏版)》请在冰豆网上搜索。
xPONMACchipsetstateNormal
Lowtimelapse-
Lastdowncause-
Lastuptime2014-04-1718:
01:
32+08:
00
TXpower(dBm)4.81
IllegalrogueONTExistent//显示存在流氓ont
Maxrate(Kbps)1300000
MaxDistance(Km)20
Wavelength(nm)1490
FibertypeSingleMode
SignaldetectNormal
TXfaultNormal
IdentifierSFP
选取某个ONT,查看它最后一次离线原因为LOSi。
XJ-ALT-FY-ZXJ-MA5680T-2(config)#displayontinfo0568
-----------------------------------------------------------------------------
F/S/P:
0/5/6
ONT-ID:
8
Controlflag:
active
Runstate:
online
Configstate:
normal
Matchstate:
mismatch
……
Lastdowncause:
LOSi
Lastuptime:
2014-04-1718:
52:
29+08:
Lastdowntime:
51:
31+08:
Lastdyinggasptime:
2014-04-1501:
48:
00+08:
ONTonlineduration:
0day(s),0hour(s),2minute(s),38second(s)
3.进入单板模式,进入pon板,将该PON口0/5/6下所有ont全部deactivate,然后逐个逐个执行ontactive操作,故障依旧,所有ont均无法激活。
4.全局模式下执行命令anti-rogueontautodetecton打开系统自动隔离检测到的流氓ONT功能开关。
几分钟后,设备显示alarm相关告警信息如下:
ALARM919736故障告警警告0x2e314022硬件设备类2014-04-1718:
42:
47+08:
告警名称:
ONT是流氓ONT
业务影响:
影响业务
参数信息:
机框号:
0,槽位号:
5,端口号:
6,ONTID:
3
告警描述:
ONT光模块常发光,ONT是流氓ONT
告警原因:
ONT光模块常发光
修复建议:
(1)隔离ONT
(2)替换ONT
5.派人前往现场手工清除更换该流氓ont后,PON口下其他ont均陆续正常上线,用户业务恢复正常。
此时设备alarm告警如下:
ALARM919766恢复告警清除0x2e324021硬件设备类2014-04-1718:
57:
端口下的非法入侵流氓ONT已经被清除
不影响业务
6
端口下非法入侵的流氓ONT已被替换
无需处理
6.执行命令anti-rogueontautodetectoff关闭设备自动隔离检测到的ont功能开关。
问题解决。
对于流氓ONU的判定,还可以通过U2000网管进行判断
登录U2000网管客户端,进入设备面板查看PON口状态,可以看到PON下时候存在流氓ONU的显示:
解决方法:
现场手工清除更换掉该ont后,pon口所有ont全部正常上线,问题解决
总结和建议:
关于流氓ont问题,总结如下:
1.流氓ont定义:
由于PON上行时分复用,每个ONT根据OLT分配的时间戳向上行方向发送数据包。
当某个ONT在没有分配时间戳的时候发光的话,就会与其他ONT的发光信号发生冲突。
我们把这种不按照分配的时间戳向上发送光信号的ONT叫流氓ONT。
2.流氓ONT主要分为以下两种:
1).长发光流氓ont:
ont一直在发光(任何时刻都在发光)。
2).乱发光流氓ont:
在非OLT分配的时间戳内发光,可能是提前发光,或者是延迟关断等。
3.流氓ONT常见故障现象:
1).如果该ONT已上线,会导致同一PON口下其他某个ONT或者所有ONT下线(离线)或者大部分ONT频繁上下线。
2).如果该ONT未配置,会导致OLT设备下其他未配置的ONT无法正常自动发现。
4.流氓ont问题常见解决办法:
当怀疑PON口下存在流氓ont时,一般在PON口下将所有ont全部deactivat
然后逐个逐个active的方法往往并不能解决问题,现网常见的解决问题办法如
下:
1)对于长发光流氓ont,处理起来比较简单,如上案例。
一般采取在OLT设备上自动隔离检测流氓ont的方法。
命令为:
anti-rogueontautodetecton(OLT配置该命令后,系统检测到流氓
ONT时,上报告警信息并将该流氓ONT设置为隔离状态。
处于隔离状态的流氓ONT
只能接收信息,不能发送数据。
(命令使用限制条件:
1、系统只能检测长发光
的流氓ONT。
2)对应PON口下的ONT必须全部要支持华为扩展PLOAM消息(GPON);
或扩展
OAM消息(EPON))。
另外注意:
1.GPBC单板仅支持长发光流氓ONT检测,不支持排查和隔离。
2.EPBA单板不支持长发光ont检测。
2).对于乱发光流氓ont,需要通过现场手工逐个排查的方法来解决。
a.现场在分光器处将分支光纤全部拔掉,然后一根光纤一根光纤的插。
插入
第一根分支光纤,ont正常上线后,再插入第二根分支光纤。
依次进行,当插入
某根分支光纤后,PON口下其他ont出现离线故障,证明该分支光纤有问题或者
下挂ont是流氓ont。
b.现场在分光器侧使用光功率计来测量ont的发送光功率,以此来判断流氓ont的存在。
光功率计波长选择1310nm,逐个测量ont上行发送给OLT设备的光功率值。
在1分钟之内观察光功率计读数情况变化。
如果光功率计一直没有读数,说明不存在流氓ont;
如果光功率计一直有读数,证明存在长发光的流氓ont;
如果光功率计时而有读数,时而没有读数,则该测量处存在乱发光的流氓ONT。
二、中兴厂家:
流氓ONU定义:
正常情况下ONU发光时隙是由OLT控制的,但是当ONU发光时隙不再受OLT控制并且其光模块处于长发光或乱发光状态。
这样的ONU就叫流氓ONU。
如何检测流氓ONU,长发光ONU
组网环境
问题原因分析
问题解决方案
1、在断开OLT的情况测试上行光功率,看是否上行长发光,如果和OLT断开,上行还有光功率的,有可能光网络中不小心接入了光猫等长发光的设备或者下面有ONU长发光。
如果版本支持检测的情况下打开流氓ONU检测开关:
ZXAN(config-pon)#rogue-onu-detect2enablelocateenableauto-shutdownenable
2、在C300上打开流氓ONU检测开关
(config-pon)#rogue-onu-detect5enablelocateenableauto-shutdownenable
//此处的数字5代表槽位号,locateenable表示打开流氓ONU定位开关,auto-shutdownenable表示自动关闭流氓ONU
3、在C300上查看流氓ONU告警(由于C300对ONU的检测是采用逐个ONU顺序检查的方法,需要等一段时间后再查看告警)
ZXAN#showloggingalarm
|include
RogueONU
Analarm35279level0occurredat18:
47:
4908/10/2012UTC
sentbyMCP
GPONa
larmRogueONUdetected:
shelf1slot5olt1onu1level0
on
当C300检查到该流氓ONU后,会自动关闭该ONU,长发光ONU被关闭之后,其他正常ONU会自动上线,后续需要将检测到的流氓ONU进行更换,排除隐患。
4、在OLT上启用检测流氓onu的功能(该功能需要onu支持)
rogue-onu-detect2enablelocateenableauto-shutdowndisable
第一个参数2是槽位号,locate是长发光onu位置使能,也就是长发光告警的位置(定位为哪个onu长发光),auto-shutdown是自动关闭长发光的onu,enable是关闭,disable是不关闭。
三、贝尔厂家:
OLT下带的PON用户(对应OLTPON端口1/1/2/2,该PON带大约25个ONT用户)不定时出现闪断,故障表现为ONT用户不停上线下线,闪断频率时快时慢,没有规律,且误码率增长非常迅速,具体log信息如下:
15/02/0901:
29:
11majoralarmoccurredforont1/1/2/2/36(serviceaffecting):
ONTisinactive
11majoralarmoccurredforont1/1/2/2/27(serviceaffecting):
14majoralarmoccurredforont1/1/2/2/25(serviceaffecting):
16majoralarmoccurredforont1/1/2/2/23(serviceaffecting):
16majoralarmoccurredforont1/1/2/2/18(serviceaffecting):
16majoralarmoccurredforont1/1/2/2/16(serviceaffecting):
16majoralarmoccurredforont1/1/2/2/15(serviceaffecting):
16majoralarmoccurredforont1/1/2/2/13(serviceaffecting):
16majoralarmoccurredforont1/1/2/2/5(serviceaffecting):
16majoralarmoccurredforont1/1/2/2/3(serviceaffecting):
16majoralarmoccurredforont1/1/2/2/2(serviceaffecting):
16majoralarmclearedforont1/1/2/1/21(serviceaffecting):
1490Opticalsignalleveltoolow
16majoralarmclearedforont1/1/2/2/25(serviceaffecting):
SignalDegradedfromONT
16majoralarmclearedforont1/1/2/2/18(serviceaffecting):
ZZLY-NKeSuo-7360-33.227>
#showponber-stats1/1/2/2
=======================================================================
ber-statstable
pon-idx|ont-num|bit-err-down|bit-err-up|ranged-ind
---------+-------+------------+----------+----------------------------------------------------------------------------
1/1/2/212042077ranged
1/1/2/224171552461ranged
1/1/2/23229183526ranged
1/1/2/242128361ranged
1/1/2/254053645598ranged
1/1/2/26109918100not-ranged
1/1/2/271855089591ranged
1/1/2/282785352530not-ranged
1/1/2/29572787475ranged
1/1/2/2101893068826ranged
1/1/2/2112173962846not-ranged
1/1/2/2122292728350not-ranged
1/1/2/2133604562798ranged
1/1/2/2142434956220not-ranged
1/1/2/2152691176529ranged
1/1/2/2162285148not-ranged
1/1/2/2172625392128ranged
1/1/2/218415137896ranged
1/1/2/2192382276648not-ranged
1/1/2/2202595904572not-ranged
1/1/2/2212105086538ranged
1/1/2/2222434734875not-ranged
1/1/2/2231823672936ranged
故障分析
PON技术是一种点对多点的光纤传输和接入技术,下行OLT将全部信号广播出去,通过ODN分配到各ONU。
每个ONU接受到所有信号,但只取出属于自己的信号。
上行则采用TDMA的传输方式,每个ONU在各自预定的时隙内发送光信号。
所有ONU的突发光信号通过ODN汇合后形成包括所有ONU信息的突发光信号。
OLT接收所有信号后再根据协议处理。
结合PON工作原理及本次故障现象,分析故障原因为:
1.所有故障只集中在1/1/2/2这一个PON口上,当ONT用户发生闪断时,OLT对应的PON口1/1/2/2能看到大量的误码存在(其他PON均没有误码),且一直快速增长,累计可达几十万。
而在正常情况下,该部分数值应该为0或偶尔增长最多累计到几十几百的数量级。
因此可以确定是因为误码快速变化导致了整个PON口下的ONT集中发生闪断。
2.分析产生误码的原因:
在PON网络中,导致误码快速增长的可能原因有:
流氓ONT(某台ONT长发光或乱发光),或中间光路问题,或PON口光模块问题。
而故障发生后该PON口的主干光路及分光器等均做过替换,因此光路应该没问题,但故障依旧反复,因此基本判断是流氓ONT导致了故障。
处理过程
流氓ONT处理过程相对较复杂,并且可能需要用户方面的配合,下面简述此故障的现场排查过程:
1.通过流氓ONT排查命令adminpondiagnostic1/1/2/2modeinit-onofftest诊断流氓ONT(中断命令为adminpondiagnostic1/1/2/2modestop),但没能成功定位故障ONT。
2.长时间跟踪告警打印log,没能发现某台ONT导致其他ONT跟随中断和误码迅速增长的规律。
3.人工对整个故障PON口进行排查(PON1/1/2/2光路情况为:
PON出来经1:
2分光器分两路到不同的主箱):
1)在主分光器位置,把其中一个主箱(假设A路)下的所有ONT光路拔掉,观察发现另外一主箱(假设B路)下部分ONT端口的误码仍然快速在增长;
2)恢复A路,拔掉B路,发现A路下面的用户误码没有增长,初步判断是B路引起;
3)对B路ONT用户分段排查后发现,ONT1/1/2/2/16异常。
隔离该ONT后1/1/2/2PON误码不再增长;
把1/1/2/2其他用户恢复后,观察误码没有再快速增长。
而把ONT1/1/2/2/16接上后误码又迅速增长。
4)在该用户家测量OLT发过来光功率大约在-20dbm,判断光路没有问题。
更换该ONT后观察,该PON所带ONT均正常运行,没有再出现闪断。
而该PON下误码迅速大量增长的情况也未再出现。
流氓ONT排查思路
针对现场流氓ONT的排查思路如下:
1.判断此类故障的主要手段是检查故障PON下的误码率是否快速大量的增长(几秒钟内成千成万数量级的增长)。
2.用命令adminpondiagnosticX/X/X/Xmodeinit-onofftest诊断流氓ONT,但需要注意该命令有时诊断不出来流氓ONT,需要再人工排查。
3.跟踪网管或CLI告警信息,如果发现某ONTinactive或dyinggsap后其他ONT紧随着都开始掉线,则可以判断此ONT为疑似流氓ONT(如下例中的1/1/1/3/48),可以尝试用命令configureequipmentontinterfaceX/X/X/X/Xont-enabledisable将此ONT配置断光,然后再观察PON口误码的变化情况。
15/04/1009:
18:
59majoralarmoccurredforont1/1/1/3/48(serviceaffecting):
19:
01majoralarmoccurredforont1/1/1/3/47(serviceaffecting):
08majoralarmoccurredforont1/1/1/3/46(serviceaffecting):
16majoralarmoccurredforont1/1/1/3/44(serviceaffecting):
19majoralarmoccurredforont1/1/1/3/42(serviceaffecting):
4.用光功率计在主干分光器位置测量从ONT侧发过来的光,因为ONT侧发光应为OLT触发后才产生,因此如果能测量到发光,则判断存在长发光的流氓ONT。
下一步可以通知局方通过逐段测量发光来找到长发光的ONT。
5.有时流氓ONT表现为乱发光,并且通过上述方法不能定位的,则要在分光器侧逐个对ONT断纤并同步在OLT侧做误码检查来进行排查,从而排查出流氓ONT。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 流氓 ONU 处理 方法 总汇