05第5章 指针调整故障处理.docx
- 文档编号:29208963
- 上传时间:2023-07-21
- 格式:DOCX
- 页数:22
- 大小:116KB
05第5章 指针调整故障处理.docx
《05第5章 指针调整故障处理.docx》由会员分享,可在线阅读,更多相关《05第5章 指针调整故障处理.docx(22页珍藏版)》请在冰豆网上搜索。
05第5章指针调整故障处理
目录
第5章指针调整故障处理5-1
5.1背景知识5-1
5.1.1指针调整的机理5-1
5.1.2指针调整的检测上报5-3
5.1.3指针调整的性能事件5-4
5.2常见故障原因5-5
5.3故障定位方法与步骤5-6
5.3.1常用定位方法5-6
5.3.2故障定位步骤5-6
5.4分类故障定位与排除5-10
5.4.1检查时钟配置数据5-10
5.4.2检查环境温度5-10
5.4.3检查设备对接的同步情况5-11
5.4.4检查光纤连接5-11
5.4.5检查外部时钟质量5-11
5.4.6检查网元硬件故障5-12
5.5常见故障处理案例5-13
5.5.1时钟板引起的指针调整5-13
5.5.2线路板故障产生的指针调整5-14
5.5.3配置错误导致的指针调整5-15
5.5.4光纤接反引起时钟互跟导致指针调整5-16
5.5.5外部时钟精度太低引起指针调整5-18
插图目录
图5-1管理指针AU-PTR的位置和内容5-1
图5-2AU指针的产生5-2
图5-3组网示意图5-3
图5-4指针调整故障处理流程图5-7
图5-5系统组网图5-13
图5-6系统组网图5-14
图5-7系统组网图5-16
图5-8系统组网图5-17
图5-9系统组网图5-18
表格目录
表5-1指针调整状态5-2
表5-2设备支持的指针调整性能事件5-4
表5-3指针调整的常见原因5-5
表5-4与指针调整关的告警及告警产生的可能原因5-8
表5-5各网元同步源及时钟源级别配置5-13
表5-6各网元同步源及时钟源级别配置5-14
表5-7各网元同步源及时钟源级别配置5-15
表5-8各网元同步源及时钟源级别配置5-15
表5-9各网元同步源及时钟源级别配置5-17
表5-10各网元同步源及时钟源级别配置5-18
第5章指针调整故障处理
指针调整是SDH网络所特有的一种现象。
当指针调整发生时,说明SDH网络中存在时钟不同步的网元。
通过对指针调整问题的及时处理,使得SDH网络各网元间时钟保持良好同步,以保障传输的信号质量。
5.1背景知识
5.1.1指针调整的机理
SDH网络中要求各网元时钟同步——频率相同、相位相同,但在实际的网络中,完全的同步是不可能的。
在SDH网络中,通过两个层次的工作,来解决时钟的同步问题:
首先通过时钟跟踪的方法,使得各网元时钟的频率在某一程度上保持同步;其次,通过指针技术,解决时钟的相位偏差问题和微小频偏问题。
SDH中的指针有两种,管理单元指针(AU-PTR)和支路单元指针(TU-PTR);与之对应的指针调整也有两种,AU指针调整和TU指针调整。
两种指针调整产生的机理基本都是相同的,下面分别说明。
1.AU指针调整产生机理
如图5-1,AU帧中,在特定位置(第四行前9个字节)用若干个字节记载帧中相应数据信息的起始位置,即用它们来表征数据信息的相位,这些字节就是指针。
其中H1、H2是指针,H3,H3,H3是负调整机会,紧接最后一个H3字节后的连续三个字节为正调整机会。
图5-1管理指针AU-PTR的位置和内容
当网络处于同步状态时,指针用于进行同步信号之间的相位校准。
如果SDH的网元工作在相同的时钟下,从各个网元发出的数据传输到某个网元时,各个信号所携带的网元时钟的工作频率是相同的,所以无需速率适配。
但是从瞬时上看,可能忽快忽慢,因而需要进行相位校准。
当网络失去同步时,不同网元工作于有频差的状态,指针用作频率跟踪校准。
还可以通过指针调整来容纳网络中的频率抖动和漂移。
如表5-1所示,当AUG和VC的帧速率不同时,在AU指针区的H3字节填充信息或是在H3字节后面的字节填充伪信息,以提高或降低VC的帧速率;同时指针值按照需要增加或减少,以指示信息净负荷的起始位置,从而产生正指针调整和负指针调整。
表5-1指针调整状态
状态名称
STM-1帧中第4行字节编号和字节的内容
速率关系
7
8
9
10
11
12
指针零调整
H3
H3
H3
信息
信息
信息
信息=容器
指针正调整
H3
H3
H3
填充
填充
填充
信息<容器
指针负调整
信息
信息
信息
信息
信息
信息
信息>容器
SDH网中的所有网元在正常情况下是良好同步的,一般不会产生指针调整。
产生AU指针调整最根本的原因,是由于SDH网中各网元间的时钟不同步引起的。
如图5-2所示,1站和6站的E1业务在中间站点以VC-4进行穿通,1站为时钟源,其它站点西向跟踪该站时钟。
若2站和3站间的时钟不同步,则2站的东向光板和3站的西向光板将进行AU指针调整;2站、3站的指针调整又导致1、4、5、6的西向光板也发生指针调整:
●若2站的时钟比3站的时钟快,则2站东向光板将进行AU指针正调整,3站西向光板将进行AU指针负调整;
●若2站的时钟比3站的时钟慢,则2站东向光板将进行AU指针负调整,3站西向光板将进行AU指针正调整;
图5-2AU指针的产生
2.TU指针调整产生机理
对于TU指针来说,从E1信号适配成VC-12直至合成STM-1整个过程,并不会产生TU指针调整。
若交换机的E1信号与SDH时钟存在频偏,则通过适配过程完成同步。
因此,支路板检测到的TU指针调整都是AU指针调整转化过来的。
转化的条件就是配置VC-12的穿通或者上下。
需要注意的是,AU转化为TU指针后,AU指针调整就不会检测上报了。
如图5-3所示,E1业务从1站上到传输设备,其中一部分业务下到2站,而另外一部分业务则以VC-12的方式从2站穿通到3站,再下到支路。
若1站和2站时钟不同步,则1站西向光板和2站西向光板会产生AU指针调整,并直接转换成1站、2站的TU指针调整;2站西向光板的AU指针调整将导致3站西向光板也产生AU指针调整;在2站西向和3站西向发生的AU指针调整也都直接转化为3站的TU指针调整。
因此,最终发现在1站、2站和3站均有TU指针调整上报。
图5-1组网示意图
5.1.2指针调整的检测上报
AU指针调整产生后,其检测上报的方式有两种:
远端检测和本端检测。
1.远端检测
即本站产生AU指针调整后,本站并不检测上报,而是通过H1、H2字节将指针调整的信息传递给远端站点,由远端站点通过解释H1、H2字节完成AU指针调整事件的上报。
因此对于远端检测方式来说,如果远端站上报AU指针调整事件,则说明本端站点产生了指针调整。
如图5-2例中,2、3站时钟不同步,但2站东向光板和3站西向光板都不会检测到AU指针调整性能事件上报,而是3站西向光板产生的指针调整,在4站西向光板被检测出来并上报;2站东向光板产生的指针调整,在1站西向光板检测并上报。
大部分SDH接口板,都是采用这种远端检测的方法。
2.本端检测
即本站产生的AU指针调整就在本站检测上报。
因此,若本站上报AU指针调整事件,则说明本站产生了指针调整。
这种检测方式只有99年以前早期的SDH接口板采用了这种方式。
对于TU指针来说,都是通过检测V1、V2字节的变化情况来上报指针调整性能事件的,因此属于远端检测的方式。
注意:
指针调整的产生和指针调整的检测上报是两个不同的概念。
指针调整在哪里产生并不一定就在那里检测上报。
对于AU指针来说,它一般在上游站产生,而在下游站检测上报;对于TU指针来说,它在AU指针转化成TU指针的站点产生,而在业务终结站点的支路板上检测上报。
5.1.3指针调整的性能事件
线路板复用段适配MSA中的AUPPJC、AUNPJC参数,分别表示AU指针正调整计数和AU指针负调整计数;支路板高阶通道适配HPA中的TUPPJC和TUNPJC参数,表示TU指针正调整计数和TU指针负调整计数。
OptiX155/622设备支持的指针调整性能事件如表5-2所示。
表5-1设备支持的指针调整性能事件
简称
详细信息
支持单板
AUPJCHIGH
AU指针正调整计数
PL4、SL1、SL2、SL4、SLE、SE2
AUPJCLOW
AU指针负调整计数
TUPJCHIGH
TU指针正调整计数
PD1、PL1、PL3、TDA
TUPJCLOW
TU指针负调整计数
5.2
常见故障原因
指针调整的常见故障原因主要如表5-3所示,可分为外部原因、数据配置原因以及设备故障原因三大类。
指针调整可能是其中的某一故障引起的,也可能是由于其中某些故障共同引起的。
所以要根据具体的情况,采用相应的故障定位方法逐个分析。
表5-1指针调整的常见原因
故障类别
故障原因
外部原因
外部时钟(如BITS等设备提供的外时钟)性能劣化。
光纤接反,造成两个网元间时钟互跟。
设备温度过高(如风扇长期未清扫或风扇故障或机房空调故障)。
时钟网规划不合理(如时钟跟踪链路过长)。
数据配置
同一个SDH组网中配置了多个独立的时钟源。
时钟源级别配置错误,出现两个网元间时钟互跟的情况。
未正确启用SSM保护功能(应该启用的没有启用、启用的没有正确设置)。
设备原因
时钟板失效或性能劣化。
线路板失效或性能劣化。
交叉板失效或性能劣化。
5.3
故障定位方法与步骤
5.3.1常用定位方法
●告警、性能分析法
●更改配置法
●替换法
5.3.2故障定位步骤
导致指针调整的根本原因就是时钟不同步,所以应当主要围绕时钟方面的问题进行故障定位。
故障的定位原则是:
分析
业务方向
时钟跟踪方向
指针调整检测上报的位置
指针调整产生的位置
定位
时钟不同步的位置
故障点的位置
指针调整故障定位流程如图5-4所示。
注1:
第1站是指沿时钟跟踪方向,在与时钟方向相同的业务方向上,第一个上报指针调整的站。
注2:
第1站没有AU指针调整,即只有TU指针调整。
此时要处理的是TU指针调整问题。
图5-1指针调整故障处理流程图
2.检查并分析告警
在故障处理过程中一般遵循优先处理其它告警,因为指针调整有可能是伴随SYN_BAD、LTI、S1_SYN_CHANGE、EXT_SYN_LOS等与时钟有关的告警产生的,当告警处理后指针调整一般也会消失。
如果指针调整不消失请按照流程中的步骤继续进行故障定位。
表5-4列出了与指针调整相关的告警及告警产生原因、处理方法。
表5-1与指针调整关的告警及告警产生的可能原因
告警名称
可能原因
处理方法
SYN_BAD
(同步源劣化)
1)所跟踪的同步源质量劣化;
2)本站时钟板故障
1)重新设置时钟源的优先级别;
2)如跟踪线路时钟源,则检查是否有R_LOS告警,并按相应方法解决;
3)如跟踪支路时钟源则检查是否有T_ALOS告警,并按相应方法解决;
4)如跟踪外部时钟,则检查外部时钟源是否正常工作。
LTI
(同步源丢失)
未启用SSM时钟保护时:
1)光纤断(如果跟踪线路时钟源);
2)外部时钟源停止输入(如果跟踪外部时钟源);
3)同步源设置为不可恢复;
4)误启用SSM时钟保护。
启用SSM时钟保护时:
1)光纤断;
2)同步源质量不稳定、外时钟没有输入,进入自由振荡模式;
3)同步源设置错误;
4)外部时钟质量劣化。
1)检查时钟同步配置,看是否配置为同步时钟源跟踪于不存在的时钟源,如配置错误,修改配置并重新下发;
2)如配置正确,则检查所跟踪的同步源是否正常,如不正常则处理相应故障使之正常(如配置为跟踪线路时钟,而线路上有信号丢失告警,则先处理信号丢失告警;如果跟踪外时钟,应检查外时钟是否正常,以及外时钟线是否接触良好);
3)如跟踪的同步源正常,则为单板故障,更换单板。
SYNC_C_LOS(同步源级别丢失)
未启用SSM时钟保护时:
1)光纤断(跟踪线路时钟源时);
2)外部源时钟停止输入(跟踪外部时钟源时)。
启用SSM时钟保护时:
1)本站发生S1字节倒换;
2)外部时钟(BITS)输入改变。
1)重新设置时钟源的优先级别;
2)如跟踪线路时钟源,则检查是否有R_LOS告警,并按相应方法解决;
3)如跟踪支路时钟源则检查是否有T_ALOS告警,并按相应方法解决;
4)如跟踪外部时钟,则检查外部时钟源是否正常工作。
EXT_SYNC_LOS
(外部时钟源丢失)
外部时钟源信号丢失
1)检查外部时钟输入电缆连接是否正常;
2)检查外部时钟提供设备工作是否正常。
3.AU指针调整的常用分析定位方法
某业务沿时钟跟踪方向,在中间多个站点均连续以VC-4级别进行穿通。
则沿时钟跟踪方向,第一个报AU指针调整站点的前一个站点,就是时钟不同步的站点。
该结论对于任意组网(链形、环形)均成立。
4.TU指针调整的常用分析定位方法
一般来说,PDH业务配置,全网的时钟基准源为自由震荡或跟踪外时钟。
沿时钟跟踪方向,第一个出现支路指针调整的站点(不考虑业务中心站),就是时钟不同步的站点。
可能是该站的时钟板或提取时钟的线路板有问题,或上游站发送信号的线路板有问题。
该结论对于任意组网(链形、环形)均成立。
5.4
分类故障定位与排除
5.4.1检查时钟配置数据
时钟配置错误,会导致时钟不同步。
可采用时钟配置数据分析法和更改配置法,保证配置数据的正确性,进行故障定位。
可能会引起指针调整的常见时钟错误配置:
●同一传输网中,配置了两个以上时钟源导致指针调整;
●配置跟踪的时钟源精度较低,如接入交换时钟精度较低或者跟踪站点数过多;
●未设时钟保护子网,主时钟丢失后(或断纤),时钟无保护引起指针调整;
●时钟源级别设置错误,时钟保护倒换后引起互跟现象,导致指针调整;
●主时钟网元的内部时钟源没有配置时钟源ID,当高级别时钟源丢失后,网元进入自由振荡状态,其它网元不会和中心站同步,导致该时钟子网中所有的站都处于自由振荡状态,导致指针调整;
●未启动SSM时钟保护,当时钟质量劣化时,不能够根据时钟质量进行保护倒换,引起指针调整;
●未启动SSM时钟保护,SSM质量输出设为禁止,所以其向其他网元传递的时钟质量为不可用(S1字节后四位为1111)。
但某网元重新启动后自动启动SSM,检测到所有线路时钟源质量为不可用,就会转而跟踪内部时钟,进入自由振荡状态,引起指针调整。
5.4.2检查环境温度
传输设备工作温度过高也能够引起指针调整,所以在将故障定位到单站后,需检查该网元的环境温度。
一般可以通过网管查询网元的温度性能事件或现场检查环境温度,来判断是否温度过高引起指针调整。
影响网元工作温度过高的主要原因是:
●网元风扇故障;
●风扇防尘网长期未清扫;
●机房温度过高,或设备散热通路不畅;如机房无空调或空调故障。
5.4.3检查设备对接的同步情况
不同类型的设备对接或不同厂家的设备对接时,应当检查对接设备之间的时钟是否同步,将SDH设备与其它设备设置使用同一个时钟源。
否则也会引起指针调整。
全网时钟不同步,不一定是传输设备本身有问题,可能是全网的时钟同步规划不合理。
比如说对接设备跟踪一个时钟基准源,传输设备又跟踪另一个时钟基准源,造成两个网络的时钟有一定的偏差。
说明:
SDH在与其它设备如路由器、ATM设备、交换机或微波设备对接时,都可能由于时钟不同步而产生指针调整。
设备对接时产生的指针调整,如果不影响业务,可以不用处理。
如果需要消除指针调整,则要求对接设备统一规划时钟源。
5.4.4检查光纤连接
在某些组网情况下(如通道保护环),即使光纤东西向接反,业务仍然正常,但时钟会出现互相跟踪,从而引起指针调整。
可以通过网管对怀疑光纤接反的网元下插MS_RDI告警或进行ECC路由查询,判断光纤是否接反。
如果光纤接反,正确连接光纤后,指针调整就会消失。
5.4.5检查外部时钟质量
一般通过更改时钟源配置的方法来判断外部时钟源质量是否良好。
有时SDH设备跟踪的外部时钟源精度较低,容易引起全网指针调整。
有时外接BITS的上级时钟源倒换也会导致SDH设备指针调整。
导致网元产生指针调整的外部时钟源质量因素有:
●时钟源精度太低;
●外部时钟源质量不可用;
●外接时钟的电缆劣化。
5.4.6
检查网元硬件故障
排除外部原因之后,可以检查产生指针调整的网元的单板是否有问题。
影响网元时钟质量的主要因素有:
●时钟板失效或性能劣化;
●线路板失效或性能劣化;
●交叉板失效或性能劣化。
这时进行故障定位主要采用的方法就是更改时钟配置法。
首先改变时钟的跟踪方向,然后根据指针调整性能事件的产生和消失情况进行分析,将故障定位到网元的具体单板。
最后根据实际需要,更换单板,解决指针调整问题。
说明:
其中,时钟板和线路板故障比较常见,特别是时钟板。
当时钟板、线路板故障都排除后,应当考虑是否交叉板质量问题。
因为时钟板通过锁相产生的时钟首先送给交叉板,通过交叉板分配给线路板及支路板。
5.5
常见故障处理案例
5.5.1时钟板引起的指针调整
1.系统概述
如图5-5所示,1站与6站的2M业务在2、3、4、5站以VC-4级别穿通。
1站自由振荡。
其余各站跟踪1站时钟。
表5-1各网元同步源及时钟源级别配置
网元
同步源
时钟源级别
NE1
内置时钟源
内置时钟源
其它网元
西向时钟源
西向时钟源、内置时钟源
图5-2系统组网图
2.故障现象
运行过程中发现,1站支路板和6站支路板报TU指针调整性能事件;1、4、5、6站西向光板报AU指针调整性能事件。
3.故障分析及排除
(1)检查时钟跟踪配置,没有问题;
(2)检查各网元,没有出现工作温度异常现象;
(3)对于穿通业务全为VC-4级别的组网,AU指针调整上报站点的前一个站点为进行指针调整的站点,即不同步站点,所以可得知3站与2站时钟不同步,即1、2同步,3、4、5、6同步;
(4)查看全网时钟配置无异常,因而故障有可能是2站东向光板、3站西向光板或3站时钟板;
(5)调换2站的东西向光板,故障现象依旧;
(6)调换3站东向光板,故障现象依旧;
(7)更换3站时钟板,指针调整消失。
4.结论及建议
本案例故障原因为3站时钟板故障,导致本站时钟信号劣化,引起指针调整。
这是指针调整中的典型案例,凡是只有VC-4业务级别穿通的组网,第一个上报AU指针的站点的前一个站点为时钟不同步站点,若时钟配置无误,则故障点有可能是上报AU指针的前一个站点或更前一个站点。
5.5.2线路板故障产生的指针调整
1.系统概述
如图5-6所示,由四个OptiX155/622设备组成一个单向通道保护环,1站为网管中心站,各站时钟配置如表5-6所示。
表5-1各网元同步源及时钟源级别配置
网元
同步源
时钟源级别
NE1
内置时钟源
内置时钟源
其它网元
西向时钟源
西向时钟源、内置时钟源
图5-2系统组网图
2.故障现象
1、3、4站所有支路板上报大量指针调整。
3.故障分析及排除
(8)通过性能事件分析,可判断2、3站时钟不同步,可能3站西向光板提取时钟质量不好或时钟板故障,也有可能2站的东向光板有问题;
(9)采用更改时钟配置法定位:
将3、4站的时钟跟踪方向改为如表5-7所示,即更改3、4站东向跟踪1站时钟。
进行观察,发现指针调整性能事件消失,说明3站西向光板时钟提取有问题;
表5-1各网元同步源及时钟源级别配置
网元
同步源
时钟源级别
NE1
内置时钟源
内置时钟源
NE2
西向时钟源
西向时钟源、内置时钟源
NE3
东向时钟源
东向时钟源、内置时钟源
NE4
东向时钟源
东向时钟源、内置时钟源
(10)更换3站西向光板,故障排除。
4.结论及建议
通过更改时钟配置后的指针调整性能事件的产生或消失情况,可定位3站是西向光板故障或时钟板故障。
如果更改时钟配置后,4站指针调整消失,3站依旧,可断定是3的时钟板故障。
5.5.3配置错误导致的指针调整
1.系统概述
如图5-7所示,某传输网由4个OptiX155/622网元组成,为二纤单向通道保护环,全网由4站自由振荡产生基准时钟,其余单站均跟踪西向时钟与4站保持同步;各单站时钟跟踪级别设置如表5-8所示。
表5-1各网元同步源及时钟源级别配置
网元
同步源
时钟源级别
NE4
内置时钟源
内置时钟源
NE1
西向时钟源
西向时钟源、东向时钟源、内置时钟源
其它网元
西向时钟源
西向时钟源、内置时钟源
图5-2系统组网图
2.故障现象
1站与4站之间的光缆中断后,各站业务均正常保护倒换,但出现AU及TU指针调整,并伴随误码,观察发现指针调整频率和误码率随时间呈逐渐上升的趋势。
3.故障分析及排除
(11)检查各站时钟设置发现1站的时钟跟踪级别设置错误,本应设为“西向时钟源/内部时钟”,被误设为“西向时钟源/东向时钟源/内部时钟”;
(12)更改该站时钟跟踪级别为“西向时钟源/内部时钟源”,下发后观察指针调整和误码均消失,故障排除;
(13)仔细分析故障原因,断纤后各站的时钟跟踪方向为:
4站继续保持自由振荡;1站由于西向断纤,时钟本应转为自由振荡,但由于设置错误而转为跟踪东向;此时2、3站均保持跟踪西向,从而发生1站与2站时钟互相跟踪的情况,导致时钟性能劣化产生指针调整并出现误码。
4.结论及建议
对于全网时钟配置不仅要考虑光路正常时的情况,也必须考虑断纤后的时钟跟踪会不会出现互跟现象。
5.5.4光纤接反引起时钟互跟导致指针调整
1.系统概述
某本地网采用OptiX155/622组成一个两纤单向通道保护环,网络结构如图5-8所示。
1站为业务中心站,其它各站只与中心站有业务,网管终端及主振时钟设在1站,其它各站均跟踪西向线路时钟。
表5-1各网元同步源及时钟源级别配置
网元
同步源
时钟源级别
NE1
内置时钟源
内置时钟源
其它网元
西向时钟源
西向时钟源、内置时钟源
图5-2系统组网图
2.故障现象
运行中根据需要,对第3站使用的东西向光缆进行了更换,更换后测试3站的收、发光功率均正常,但网管上报1站的支路板上报TU指针调整,3站西向光板上报AU指针调整,4站西向光板上报AU指针负调整,同时1站到2站的业务发生倒换,其余业务出现误码。
3.故障分析及排除
(14)根据以上故障现象判断,可能是由于3站或4站与1站时钟不同步引起的;
(15)仔细检查各站时钟配置均无误;
(16)查询各网元工作温度,正常;
(17)由于更换光缆前系统正常,故仔细检查3站的光纤连接方向,发现东、西向接反。
分析原因不难发现,由于3站东、西向光纤接反,3站实际跟踪4站的时钟,而4站也跟踪3站时钟从而造成时钟互跟,使3站、4站的时钟性能劣化,出现指针调整;
(18)重新连接光纤,观察系统告警和性能恢复正常。
4.结论及建议
通道保护环光纤东西向接反,由于业务为双发选收,所以业务正常,但时钟会出现互跟现象。
5.5.5外部时钟精度太低引起指针调整
1.系统概述
某市采用OptiX155/
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 05第5章 指针调整故障处理 05 指针 调整 故障 处理