05ECC问题Word文档格式.docx
- 文档编号:20841004
- 上传时间:2023-01-26
- 格式:DOCX
- 页数:7
- 大小:31.67KB
05ECC问题Word文档格式.docx
《05ECC问题Word文档格式.docx》由会员分享,可在线阅读,更多相关《05ECC问题Word文档格式.docx(7页珍藏版)》请在冰豆网上搜索。
5.1.1ECC简述
SDH网元之间传递信息是通过ECC通信来实现,ECC的物理层就是DCC通道,即SOH中的D1-D12字节。
OptiX系列产品用到了其中的D1-D3字节,即再生段DCC,速率为192Kbit/s,用于网元之间的OAM信息交流。
在主控板上,有数个SCC串口专门用于处理DCC字节,每个SCC串口对应一路192Kbit/s的DCC通道。
5.1.2网管通过网关网元登录其他网元所走的路径(为收发一致路由)
1、若路由一切正常,走环网上的短路径
2、若短路径不正常,则走环网上的长路径
3、若长短路径皆不正常,例如备环全部拔掉,则不能登录
4、在备环全部拔掉的情况下,只有人工设置路由(为收发不一致),方可登录。
我们很少采用人工设置的方法(比如单纤环中),而是由系统自动分配ECC路由。
图5-1环网中的ECC
如图7-1所示,假设A是网关网元,连接网管。
从网管登录网元D,既可以走A踎D的路径,也可以走A踎B踎C踎D的路径;
即所谓的短路径和长路径。
在环网中,即使A踎D的短路径出了问题,走长路径网管还是可以登录网元D。
所以我们不能仅仅以是否能登录网元来判断ECC的正常与否,应经常查看ECC路由,发现走长路径的现象就应查找原因,排除故障。
5.2ECC故障定位的思路
5.2.1故障举例
以下图的故障为例,如图5-1所示的链形组网中,NE1为网关网元,连接网管。
现在NE3、NE4登录不上。
图5-1
5.2.2首先排除外部故障
比如某站掉电、断纤。
另外,在新开局或升级扩容中,一些设置上的错误也会导致ECC问题。
比如,新增网元的ID和老网元的ID重复,新增网元的主机和老网元的主机不是一个系列牋牋牋
5.2.3再将故障定位到单站或两个站之间
注意对于ECC问题,逐段自环不能定位故障;
一般根据从哪一站开始不能登录来判断故障位置。
如图7-1中所示,如果NE3、NE4都不能登录,则故障基本可以先定位到NE2和NE3。
5.2.4接下来对单站进行分析
对于ECC问题,不但要分析ECC有问题的站点,还要分析其上游站。
如上所述如果网管不能登录NE3,则对NE2、NE3都应分析。
1、首先查看告警,遵循“先高级后低级”的原则。
2、查看性能数据。
要查看所有能登录站点的当前性能数据和历史性能数据。
如果从性能数据中发现相关站点(图中NE2、NE3)有大量的误码和指针调整,则可能导致ECC忽通忽断甚至完全中断。
另外,其他站大量的性能数据上报也将导致ECC经过站点的通道拥塞,忽通忽断;
或网元登录缓慢。
5.2.5检查单板
通过告警和性能的分析,排除了光路的故障后,如果还没有定位出单站内的ECC故障,就要对相应的单板进行检查了。
1、首先检查相关站点的SCC板是否已经故障,或在不停复位。
运行局出现以上情况则一般要换板;
新开局或改换主控后出现问题可能是SCC板和主机软件的配合问题,参见《设备问题树》(比如SS13SCC加载了15以下主机导致不停复位等)。
2、如果SCC板闪灯、登录正常,则检查相关站点的ECC路由(:
ecc-get-route)、ECC串口的状态(:
ecc-get-sccinfo)。
上面的例子中,NE3不能登录则不能通过命令行进行此项检查,所以检查NE2。
3、检查了NE2的ECC串口状态正常,并且复位了ECC口(:
ecc-reset-dcc)也无效后,可以尝试复位、拔插SCC板。
4、还无效,可以先将SCC板拔出,使ECC通道在本站穿通。
5、还无效,就要检查光板。
光板有告警应先查明告警原因,否则尝试对相应光板进行复位,以及拔插光板。
有些时候ECC不通是光板接触不良所致,拔插后可恢复。
一定注意对业务的影响。
5.2.6进行ECC整机自检和本地自检
5.2.7ECC路由不畅
由于线路误码的存在或系统工作环境(温度条件)引起光板与主控板配合时序混乱及软硬件死锁,这样会导致系统ECC单通或该网元ECC全断,因此在很多ECC不通的情况下需要复位主控板。
软复位的办法:
3.0命令行:
rstecc//复位ECC通道
4.0命令行:
ecc-reset-dcc//复位ECC通道
rst//复位主控
reset//复位主控
硬复位:
按一下RST键。
5.3扩展ECC
5.3.1扩展ECC的有关命令
1.3.01主机中的命令
注意命令的参数是对端端口的参数。
如#1网元、#2网元创建扩展ECC,#2的IP地址为129.9.0.2,则命令为:
#1:
addeccclnt0x1600129.9.0.2
#2:
addeccsrvr0x1600
创建完后要人工复位SCC使之生效。
删除扩展ECC的命令如下:
:
deleccclnt129.9.0.2
deleccsrvr0x1600
2.4.01.15主机中的扩展ECC命令
自动扩展ECC的命令为“:
cm-control-tmn:
nebylan,open;
”。
此命令下发后,SCC自动复位生效。
指定方式扩展ECC要执行以下命令:
nebylan,close;
//网元自动复位
ecc-add-maclan:
server,1600,0;
ecc-add-maclan;
client,1600,129.9.0.2;
//IP地址是#1网元的IP地址
还需要将#1、#2站的SCC都复位一下,以上的server和client设置才能生效。
5.3.2开通扩展ECC的主机版本要求
1、3.01主机只支持指定方式扩展ECC(即要人工设置扩展ECC的server端和client端)。
2、4.01.13.06以前版本只支持指定方式扩展ECC,4.01.13.06以后的4.01.13.X版本只支持自动方式扩展ECC(自动扩展ECC就是:
用直连网线连接两个ETHERNET口即可)。
3、4.01.15版本既支持指定扩展ECC,也支持自动扩展ECC,缺省状态下为指定扩展ECC。
4、155H的4.02系列软件只支持指定方式进行以太网扩展ECC。
5、所以,如果想两个主机版本之间能通过以太网扩展ECC,只有以下组合:
<
a>
两个都是只支持指定方式的版本,两个网元一端设置为server,另一端设置为client。
b>
两个都是只支持自动方式的版本。
c>
一个是4.01.15版本,一个是其他。
5.3.3主机从4.01.13.X升级到4.01.15.52时的扩展ECC问题
由于4.01.13.X(4.01.13.06以后)主机只支持自动扩展ECC,而4.01.15.X主机在缺省状态下的扩展ECC是人工指定方式;
所以当主机从4.01.13.X升级为4.01.15.52后,由于15.52主机缺省状态下自动扩展ECC是关闭的,原来的自动扩展ECC将中断。
因此必须到现场,对升级主机为4.01.15.52后扩展ECC两端的网元都下发命令:
将自动扩展ECC打开,然后扩展ECC才能互通。
注意,此命令下发将导致主控自动复位一次。
5.4ECC的网上问题与已知设备缺陷
1、网元ID重复导致一个网元不能登录(在新增站点时经常遇到)。
2、由于线路误码的存在及系统工作环境(温度条件)引起系统光板SL4、SL1、SCC间DCC配合时序混乱及软硬件死锁,这样会导致系统ECC单向通或该网元ECC全断,因此,在很多ECC不通的情况下复位主控板或线路板即可解决。
3、新增网元的主机和原有网元的主机不是一个系列,比如原有为3.01.33.12主机,新增为15.52主机。
4、4.01.13.10和4.01.13.11主机在光板拔插后ECC可能不通。
出现这种情况时,可以先复位DCC通道观察,如果复位DCC通道无效,则复位主控。
5、SS21SL4和SS22SL4板用在增强型子架上ECC有问题。
6、155/622标准子架上,使用XC4板和SS11OHP板配合,可能会出现ECC问题。
原因:
由于SS11OHP板从开销总线提取E1、E2时,在“某些情况”下要在各个光板的开销总线上切换轮询,而XC4配合11OHP时,对开销总线的切换会引起开销总线的抖动误码。
干扰了开销总线上的DCC字节,从而引发ECC不通问题。
“某些情况”是:
支路带单链,同时线路光板数量大于2或支路带多链;
解决方法:
将XC4板换成GTC板,或将网上所有站点的OHP板换成OHP2板。
临时解决方法:
可以发ptp命令禁止OHP板对支路链的轮询以保证通讯正常,在主机4.01版本下,可以通过设置将支路链不加入允许通话子系统中来解决,在主机3.01版本下,可以通过相应的ptp命令来完成相应设置。
7、在OptiX155/622系统中,11与12、13与14这两组相邻板位中,SS33SL2与SS31SL2、SL1、SL4板的混插有以下限制:
(1)SS31SL2:
V2.31版本之后单板在12、14板位软件自动关断上下光口ECC;
V2.31版本之前单板在12、14板位只通上光口ECC;
在老子架上11、13板位,只通上光口ECC,12、14槽位可以混插其它线路光板,且只通上光口ECC;
在新子架11、13板位,此时若对板无光板,则上、下光口ECC都通;
若对板插线路光板:
A对板线路板不为31SE2、31SL2,则只通11、13板位31SL2的上光口ECC,对板ECC将不通;
B对板线路板为31SE2,则两块板ECC都不通;
C对板线路板为31SL2(V2.31版本以前),则两块板ECC都不通;
D对板线路板为31SL2(V2.31版本以后),则11、13板位31SL2的上下光口ECC都可通,对板ECC都不通;
(2)SS33SL2:
在老子架12、14板位,若对板没有光板,则通上光口ECC;
若对板有线路光板的话,只通上光口ECC,且对板也只通上光口ECC;
在新子架12、14板位,若对板没有光板,则通上、下光口ECC;
若对板有线路光板的话,只通上光口ECC,且对板也只通上光口ECC;
在老子架11、13板位,若对板没有光板,则只通上光口ECC;
若对板有线路光板的话,只通上光口ECC,且对板也只通上光口ECC;
在新子架11、13板位,若对板没有光板,则通上下光口ECC;
A若对板为SS31SE2、SS31SL2的话,只通上光口ECC,且对板也只通上光口ECC;
B若对板有线路光板(为31SE2、V2.31版本以前的31SL2)的话,上下光口ECC都不通,且对板也只通上光口ECC;
C若对板有线路光板(为V2.31版本以后的31SL2)的话,只通上光口ECC,且对板上下光口ECC都不通;
(3)SS32SE2
DCC完全同SS33SL2。
(4)以上所说SS31SL2仅指REV.0、REV.A、REV.C单板,对于REV.D版本单板只有上光口ECC通。
8、如果出现SS31SL2板和SL1、SL4板必须插在OptiX155/622相邻板位的情况,则会导致ECC和公务都不通。
必须关闭一块光板的ECC口,使另一块板的ECC能通。
对于15主机,关闭和开启ECC口的命令为“:
cm-close-ecc:
para1,para2;
”和“:
cm-open-ecc:
para1表示群/支路,0表示群路,1表示支路;
para2表示板位,其中群路为1-2(2.5G)或1-4(155/622),支路为1-8。
查询ECC封锁状态的命令为“:
cm-get-eccstate;
”,返回结果为inhibit表示关闭状态,idle表示开启状态。
如果主机不支持以上命令,可以采用PTP命令关闭ECC和数据“:
ptp:
板位,a7,0;
”(SL2支持)。
这样另一块光板的ECC和公务都能通。
9、关于8C、8D、8E、8F命令对ECC的影响:
8C、8D环回将导致ECC中断。
8E、8F环回的如果不是第一个VC4,对ECC没有影响;
如果环回第一个VC4,则要视具体的光板和版本。
10、在SBS155/622设备上,由于SS11SCC板的开销时钟为对偶板位共用,这就对对偶板位的光板类型有要求,如果对偶板位的光板开销时钟不一致,则会对ECC通信带来问题。
(11/12、13/14为对偶板位)
ASS21SL4(需经过割线处理)、SS22SL4、SS23SL4在SS11SCC上可以混用,ECC不存在问题。
B当采用SS11SCC时,SS24/25/26SL4(使用ASIC芯片光板)与其他种类SL4板均不能在对偶板位混插,否则ECC不通。
C当采用SS11SCC时,各种SL1板都不能与SL4板混插在对偶板位。
D当采用SS11SCC时,SS33SL2板不能与SS24SL4以下的SL4板混插在对偶板位。
E各种SL1板可以混插。
F若系统使用SS12SCC、SS13SCC、SS32SCC则没有此类ECC的问题。
11、SL2插在2.5G支路板位上时,若邻板位(1和2、3和4、5和6、7和8互为邻板位)有板,主机会自动选择上路DCC,下路DCC将不通;
12、标准155622子架和增强155622子架中,主机软件4.01.13.05版本中对于用两块SL1带出一个扩展子架或是带1+1的链连到同一个网元时会分配两个SCC口,属于软件BUG;
13、标准155622子架和增强155622子架中,如果11、12带一个环,13、14带一个环,支路也用两块SL1板带一个环,则支路环上的ECC不稳定。
交叉板为GTC,公务板为OHP2。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 05 ECC 问题