几十个爱立信告警详细处理步骤Word文档格式.docx
- 文档编号:17270791
- 上传时间:2022-11-30
- 格式:DOCX
- 页数:32
- 大小:32.09KB
几十个爱立信告警详细处理步骤Word文档格式.docx
《几十个爱立信告警详细处理步骤Word文档格式.docx》由会员分享,可在线阅读,更多相关《几十个爱立信告警详细处理步骤Word文档格式.docx(32页珍藏版)》请在冰豆网上搜索。
3.若有被怀疑硬件列出,交现场人员处理,更换硬件后继续测试SNT。
若测试通过则解闭SNT:
NTBLE:
告警清除。
1.3CCITT7SIGNALLINGLINKFAILURE
信令被激活状态下无法正常服务或信令出错后无法恢复正常
1.查看信令链路状态:
C7LTP:
LS=;
2.将故障SLC进行闭解:
C7LAE:
LS=,SLC=;
C7LAI:
3.若闭解无效则查看信令链路数据:
C7LDP:
如进行以上操作后,告警仍没有清除,交现场人员做进一步的传输及信令板检测。
1.4GROUPSWITCHFAULT
GROUPSWITCH被检测到有错误。
1.检查故障单元状态。
有3种设备类型:
ClockModule(CLM)、SpaceSwitchModule(SPM)、TimeSwitchModule(TSM)。
2.TSM故障的处理步骤:
1)查看所有TSM状态GSSTP:
TSM=;
2)闭掉有故障的单元GSBLI:
TSM=;
3)测试该TSMGSTEI:
4)若测试结果有错误单元列出则更换硬件,若无则解开TSM:
GSBLE:
若测试结果为硬件故障,交现场人员更换硬件处理。
3.SPM故障的处理步骤:
注意:
对SPM进行闭塞测试时,有可能会引起相关半平面的TSM也同时闭塞,因此对SPM的操作需在话务闲时进行。
1)查看所有SPM状态GSSTP:
SPM=;
SPM=;
3)测试该SPMGSTEI:
4)若测试结果有错误单元列出则更换硬件,若无则解开SPM:
4.CLM故障的处理步骤:
1)ALLIP;
查看是否有与CLM相关的EMFAULT告警。
如有,先参照EMFAULT处理流程修理EM。
修理不成功,交现场人员更换硬件处理。
2)没有EMFAULT告警或修理成功,用ALLIP;
查看是否有NETWORKSYNCHRONIZATIONFAULT告警,如有交现场人员处理。
3)没有上述告警,可对故障的CLM进行测试:
闭掉有故障的单元GSBLI:
CLM=;
测试该CLMGSTEI:
若测试结果有错误单元列出则更换硬件,若无则解开SPM:
CLM发生故障时,若同时有SPM处于WO/S状态,除测试列出的错误单元外,两者之间的接口板和连线也有可能会存在问题。
5.若某TSM、SPM、CLM频繁出现告警,但通过闭解操作又能修复,需通知现场人员进行进一步测试和故障定位。
1.5DIGITALPATHQUALITYSUPERVISION
DIGITALPATHUNAVAILABLESTATEFAULT
传输质量降低,出现误码、滑码等数量超过定义的监测值,即产生上述告警。
DTSTP:
DIP=dip;
显示该DIP状态
DTQUP:
显示该DIP是否有误码等
DTQSR:
清除误码等
省网管中心采用定时自动清除此误码告警,并进行告警频次统计,如传输告警频繁,将通知分公司现场处理。
1.6SynchronousDigitalPATHQUALITYSUPERVISION
SynchronousDigitalPATHFAULT(ET155硬件)
由于光纤传输质量稳定,上述告警平时较少出现。
在遇光缆割接或环路倒换时会出现大量上述告警。
TPSTP:
SDIP=sdip;
显示该SDIP状态
TPQUP:
显示该SDIP是否有误码等
TPQSR:
如传输告警频繁,将通知分公司现场处理。
1.7RPINTERCOMMUNICATIONGROUPFAULT
i.告警产生原因:
PCU是GSM网的一个节点,它整合在BSC上,作为电路交换网络(GSM)与包交换网GSN节点的一个接口。
PCU的硬件由1~64个RPP组以以太网连起来,rpintercommunicationgroup(rpig)它是PCU中的具有监测功能的RP组,包含NETA和NETB两部分,被一些独立的应用块来调用,当RPP间通信或软件运行出错,产生此告警。
1.DBTSP:
TAB=RPSRPISUPERVS;
查看表中定义的GROUP类型及相关RP地址。
2.BLRCI:
GROUP=,NET=;
3.BLRCE:
检查CABLE无误,闭解NET,使其正常应用。
如有硬件故障,需要现场人员处理。
1.8RADIOTRANSMISSIONGBINTERFACEFAULT
BSC中“GB”接口告警,常见的有两种情况,一是NS层被闭塞掉,一是NSVC拥塞或被禁止状态。
1.NS层被闭塞的情况,一般由SGSN设备告警造成,需现场人员处理。
2.当NSVC告警时,首先检查相关DIP和SNT状态,正常状态则闭解NSVCI:
〈RRVBI:
NSVCI=;
〈RRVBE:
3.将相关RP进行分离、闭解:
EXRPP:
RP=ALL;
(RP类型为RPP的即是)
FCRWS:
RP=,SEP=YES;
BLRPI:
RP=;
BLRPE:
4.仍不好,进行NSVCI的重定义:
〈RRGBP;
〈RRNSE:
〈BLODI:
DEV=;
〈RRNSI:
NSVCI=,DEV=,NUMDEV=,DLCI=;
〈BLODE:
1.9NMROUTEASRSUPERVISION
一、告警产生原因
路由上话务应占比低于告警门限值。
一般在凌晨话务闲时会产生,能自动恢复,不需处理。
如该告警在话务忙时出现,或频繁出现,需通知现场人员处理。
2、A2类告警
2.1INFINITEFILEENDWARNING
无限连续文件满或接入失败。
1、使用IOIFP查看子文件的状态。
IOIFP:
[FILE=file];
如果为计费文件(TTFILE),通知现场人员处理。
统计文件再执行以下操作:
1、使用INFSP查看文件传送情况。
FILE=file[-subfile[-gen]],DEST=dest,[,ORDER=order][,IO=io];
与现场人员确认为垃圾子文件后,执行以下操作将其删除。
2、使用INFUP查看FPU功能。
INFUP:
FILE=file[-subfile[-gen]],DEST=dest;
3、如有FPU功能,需先取消。
INFUE:
FILE=file[-subfile[-gen]];
4、删除文件。
INFIR:
FILE=file[-subfile[-gen]];
2.2VOLUMELIMITEXCEEDED
每个VOLUME在硬盘上都定义了一定的空间大小,并且设置了容量门限值。
当VOLUME下的子文件容量大于该门限值时就会产生VOLUMELIMITEXCEEDED告警。
1、检查告警中所示卷标的数据:
INMCT:
SPG=0;
:
INVOP[:
VOL=vol];
2、如卷标名是RELVOLUMSW,则执行以下指令查看该卷标下的子文件列表:
:
INFIP:
FILE=RELCMDHDF;
其他卷标名用指令INFIP:
VOL=;
3、与现场人员确认是否需要对文件进行保存。
如需要,由现场人员保存:
将子文件保存,保存方法有2种:
一是人工传送、二是拷贝到光盘上。
INFTI:
FILE=file,DEST=dest[,EQUIP=equip][,REVERSE]
[,FILEID=fileid,RULE=rule];
INFMT:
[SPG=spg,]DEST=dest,VOL1=vol1[,COPIER=copier];
4、不需要保存的文件,直接删除,使卷标的已使用容量小于设置的门限值。
INFUE:
FILE=file;
(该file为子文件,如:
AFFILE1-1234)
(有FPU功能的文件先进行该功能的清除)
INFIR:
END;
2.3LINEUNITBLOCKED
LU闭塞。
1、进入DCS子系统
IMLCT:
SPG=spg;
2、查看LU板状态:
ILLUP:
LU=lu;
3、人工闭LU板:
ILBLI:
4、解闭LU板:
ILBLE:
若执行以上操作后,告警仍未清除,交现场人员进行硬件检测处理。
2.4SIZEALTERATIONOFDATAFILESSIZECHANGEREQUIRED
存储数据的SIZE不够。
1、查看出现SIZE告警的SAE:
DBTSP:
TAB=SAACTIONS;
2、查看出告警的SAE、BLOCK的NI值:
SAAEP:
SAE=sae,[BLOCK=block];
3、远程处理人员需和爱立信银牌或分公司维护人员确认需要扩的SIZE是否可由远程操作后,方能进行处理。
4、自动扩SIZE:
SAALI;
5、如果不成功,手动扩:
(注意:
远程处理人员需和爱立信银牌确认该SIZE扩充方法后,再进行操作)
SAAII:
SAE=sae,BLOCK=block,NI=ni;
将以上操作做好LOG,交现场人员进一步分析。
如同一个SIZE频繁出现告警,需及时通知现场人员处理。
(现场人员应对产生告警的SIZE具体作用以及该SIZE拥塞的相关影响进行分析。
通过这种分析,可以及时地了解网络的状态及相关话务模型的趋势。
并且由于执行过SAAII指令增加SIZE值,故在闲时需要做一个人工软件备份)
2.5RPFAULT
RP发生硬件故障时会产生上述告警。
夜间22点后才可远程进行处理。
修理所用指令如下:
<
REPRI:
RP=;
REMRI:
RP=,PCB=;
RECRI:
如果修理不成功,一般为RP硬件故障,交现场人员处理。
更换RP硬件时需注意:
1.RP所属的类型.
2.202型设备需注意RP的位置,电缆。
3.指令SARPI是对BYB501串型BUS的操作。
当RPFAULT告警出现时,应根据OPI操作流程得出要更换的硬件,进行替换。
当需要中断BYB501机框上一侧串行RPBUS的连接时,则需用指令SARPI防止RPBUS中断对CP运行的干扰,操作结束后,用指令SARPE恢复。
2.6EMFAULT
EM(ExtensionModule)是交换机中最小的控制单元。
EM有可能是ETC,TSM或其他单元,当EM有故障时,EMFAULT告警产生。
<
BLEMI:
RP=,(RPT=),EM=;
BLEME:
;
如闭解EM无效,进行软件修理:
REPRI:
RP=,EM=;
REMRI:
RP=,EM=,PCB=;
RECRI:
如果修理不成功,一般为EM硬件故障,交现场人员处理。
2.7BACKUPINFORMATIONFAULT
系统备份功能中产生错误或有制约时产生上述告警。
远程只处理MSC、BSC上的该类告警。
在操作前,请先电话联系现场人员,了解是否是因为打补丁、升级等原因,现场人员人工关闭自动DUMP而产生的告警,如果是则不进行处理。
不是则进行以下处理:
在话务闲时做一次系统备份SYBUE;
SYBUP:
FILE=RELFSW*;
SYBFP:
FILE;
SYTUC;
SYBUI:
DISC;
打开自动DUMP。
若进行上述操作后,告警仍然不能清除,需要现场人员处理。
2.8SOFTWAREERROR
交换机出软件错误。
1、查看软件错误修复情况:
SYRIP:
SURVEY;
将详细软件故障信息做好LOG,提供爱立信银牌进行分析,查找错误原因。
2、手动清除告警:
SYRAE:
RECTYPE=SOFTERROR;
或:
EVENT=event;
2.9APPLICATIONDETECTEDSOFTWAREERROR
交换机产生的软件错误被某些应用检测到就会产生一个告警,告警级别依赖于命令的设置。
1、显示软件错误恢复信息:
SYRIP:
SURVEY;
2、SYRIP:
EVENT=;
将处于ACTIVE状态的EVENT的内容做好LOG,提供爱立信银牌进行分析,查找错误原因。
3、SYRAE:
EVENT=;
清除该告警。
2.10PVCSET-UPFAILURE
该功能由DataCommunicationSubsystem(DCS)实现。
此告警产生有多种原因,例如无法从硬盘上载入A侧的PVC信息,B侧的协议无法处理PVC服务等。
1、根据告警显示内容中的错误类型参照ALEX进行处理操作。
2、下面以“ACCESSBARRED”错误类型为例,操作步骤如下:
SPG=;
/\
|/\|
||NTN=ntn...||
ILACP|:
++|;
检查通路参数
||CUG=cug||
|\/|
\/
NP=;
/ILBLI:
PORT=;
将端口人工闭塞
更改NTN的通路:
ILACC:
NTN=ntn+[,PRI=pri][,ICB=icb][,OCB=ocb][,IAC=iac][,OAC=oac]+;
ILBLE:
将端口人工解闭,观察告警是否消失。
2.11AUDITFUNCTIONTHRESHOLDSUPERVISION
交换机定义了CP存储器(PS、DS、RS)占用情况和SAE文件使用监测告警。
如果CP存储器(PS、DS、RS)占用或SAE文件大小高于设置的门限,就会产生一个告警,告警级别依赖于命令的设置。
1、告警信息TEST决定处理步骤(一般TEST=110):
2、显示文件使用日志:
AFTSP:
TEST=110,LOG;
4、根据得到的SAE值进行自动扩SIZE:
SAALI;
5、若自动扩不成功,则进行人工扩SIZE:
(需先和爱立信银牌确认扩充方法)
SAAII:
SAE=,NI=;
6、重复以上2-4步骤,直到所有SIZE扩完:
7、告警处理完毕,话务闲时做一次人工Dump。
3、A3类告警
3.1CCITT7DISTURBANCESUPERVISIONLIMITREACHED
7号信令扰动监测。
1、ALLIP;
2、查看扰动数据:
C7DSP:
ENUM=enum;
3、将告警计数器RESET:
C7DSR:
“C7event”报告是对七号信令网络安全监测的重要手段,在日常维护工作中,应根据需要激活相应的C7event报告。
有个别ENUM对话务有影响:
110、120、132、133、145、207,出现以上ENUM告警时由现场人员进行处理。
3.2DISTURBANCESUPERVISIONOFTRUNKROUTES
一、告警说明:
如果路由的干扰数目高于设置的门限,系统就会产生告警。
如果告警产生后,干扰等级在下一个测量周期低于允许等级,告警可自动消除。
路由的允许干扰等级可以用指令加以定义。
这项功能对交换机路由的话务质量做连续监测。
它能监测的路由类型有CS、CR、CSR和BT,同时还能监测老的模拟中继,诸如IT和OT。
1.将路由干扰监测计数器清零
DUDAR:
R=r;
3.3HLRAUTHENTICATIONDATAREQUESTFAULT
HLR认证数据请求故障,一般当AUC向HLR提请认证数据失败时产生该告警。
1.查看认证提请失败记录
HGALP:
NLOG=\\;
2.将以上记录做好LOG,交现场人员进行分析,并进行相应处理。
3.将告警计数器RESET:
HGALR;
告警清除。
3.4MTFAILEDAUTHENTICATION
一般当移动台认证失败时产生该告警。
1.将告警计数器RESET:
MGAAR;
由省网管中心每日凌晨对此告警进行一次自动清除。
3.5SEIZUREQUALITYSUPERVISION
这项功能是用来监测正常呼叫和不正常呼叫的比率。
能够受此功能监测的电信设备有BT、RT和KR。
一个设备在进行256次呼叫后,正常呼叫和不正常呼叫之间的比率将被检测并与本路由组内所有设备的平均值做比较。
如果比率偏离超过命令创建值,设备就会被认为发生错误或被闭掉。
1.显示产生告警的设备
SEQIP:
R=\\;
2.将占用质量监测计数器清零
SEQAR:
3.6SIGNALLINGFAULTSUPERVISION
信令故障监测告警。
1.查看指定路由上信令故障设备情况
FAIAP:
R=\\,[,FRP];
2.将监测计数器清零
/\
|DEV=dev...|
||
FAIAR:
+R=r...+;
|ACL=acl...|
\/
3.7ALIFAULT
ALI是IOG的组成部分,一般告警接口单元故障时产生该告警。
1.查看告警触发条件
ALDIP;
2.闭掉该ALI
ALBLI:
ALI=ali;
3.解闭ALI
ALBLE:
如执行以上操作后告警仍不能清除,则交现场人员检测硬件,进一步处理。
二、无法远程处理的告警
1.1CPFAULT
CPFAULT一般是位于CPS或MAU中的硬件故障。
当系统发现一个永久性故障或三个相同类型的暂时性故障或暂时性故障出现频率太高时,MAS的软件就会产生CPFAULT的告警。
CPFAULT是比较复杂的情况,以现场操作为主。
CP主要是APZ21220和APZ21230两种,CPFAULT的告警分为三级。
由于CP在交换机中的中心地位,CPFAULT可能发生的危害如下:
交换机类型
CP型号
影响程度
影响时间
CP的小启动
MSC
21230
新的呼叫不能建立
约2至3分钟.
BSC
21220
基站不为新的呼叫服务,恢复时间根据BSC的负荷,站型和基站配置的不同而不同.RBS200,基站配置TRX多的恢复时间长.
约5至10分钟.
基站不为新的呼叫服务,恢复时间根据BSC的负荷,站型和基站配置的不同而不同.RBS200,基站配置TRX多的恢复时间长.相比21220恢复时间短.
约3至8分钟.
HLR
新的呼叫瞬间受影响.
CP的大启动
呼叫不能建立
5至10分钟
呼叫不能建立,恢复时间根据BSC的负荷,站型和基站配置的不同而不同.RBS200,基站配置TRX多的恢复时间长.
10至15分钟
呼叫不能建立,恢复时间根据BSC的负荷,站型和基站配置的不同而不同.RBS200,基站配置TRX多的恢复时间长.相比21220恢复时间短.
8至12分钟
备份HLR工作.
CP的重装系统
呼叫不能建立,恢复时间根据BSC的负荷,IOG类型,站型和基站配置的不同而不同.RBS200,基站配置TRX多的恢复时间长.
15至30分钟
呼叫不能建立,恢复时间根据BSC的负荷,IOG类型,站型和基站配置的不同而不同.RBS200,基站配置TRX多的恢复时间长
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 几十 爱立信 告警 详细 处理 步骤