华为告警管理组织说明材料10Word下载.docx
- 文档编号:19073412
- 上传时间:2023-01-03
- 格式:DOCX
- 页数:76
- 大小:43.42KB
华为告警管理组织说明材料10Word下载.docx
《华为告警管理组织说明材料10Word下载.docx》由会员分享,可在线阅读,更多相关《华为告警管理组织说明材料10Word下载.docx(76页珍藏版)》请在冰豆网上搜索。
硬件故障。
对于WSMU和WIFM板,需要检查网线的连接情况。
对于其它单板,需要检查WHSC板的运行情况。
DSPBRD:
FN=1,SLN=2;
(输入单板的框号槽号)
1.3、WCKI时钟参考源丢失
当WCKI时钟参考源丢失时而产生此告警。
WCKI板所在的框号
WCKI板所在的槽号
丢失时钟源端口号
丢失的时钟参考源号
可能使系统不能正常工作。
时钟参考源丢失,可能导致时钟系统不能正常工作。
∙外部时钟源工作不正常。
∙连接外部时钟源的时钟线有问题、或时钟连线不正确
1.观察设备面板CKI单板BITS时钟输入端口是否正常。
2.检查外部时钟源是否工作正常,如果不正常,更换时钟源。
3.检查时钟线连接是否正确,如果连线正确,请更换时钟线。
1.4、控制框与业务框通信失败
当控制框和业务框之间的通信中断时产生此告警。
控制框和业务框之间的通信中断。
∙可能控制框与业务框的HSC之间连线不正确
∙可能业务框工作不正常。
∙可能业务框没有及时发心跳消息给控制框。
1.检查控制框与业务框的HSC之间的连线是否正确,或更换网线,如果问题解决,这说明是连线有问题。
2.观察业务框的WSMU板是否运行正常,如果不正常,更换WSMU单板看问题是否解决,如果仍然没有解决更换HSC板,如果仍然没有解决,那可能是背板有问题,需更换背板解决。
3.检查CPU是否被某个任务长时间占用,导致没有发送心跳消息,或者有网络风暴,导致控制框无法正常接受到消息
1.5、BAM到主机通讯失败
当BAM到主机通讯失败时,系统发出此告警。
模块号
表示与BAM无法通讯的模块号。
BAM与主机之间无法通讯。
该告警由ALM-2364BAM到主机连接中断引发,ALM-2364BAM到主机连接中断表示BAM和交换机断连,因此必然导致该告警的产生。
交换机有一个框的两个连接都断了。
1、检查设备面板是否显示正常,绿色代表正常,灰色代表BAM与主机连接失败。
2、检查BAM机器网卡和LANswitchs:
3、检查BAM机器网卡和LANswitchs是否工作正常。
并保证所有网线连接正常。
告警是否恢复?
1.6、BAM到主机连接中断
当BAM与主机中断时,系统发出此告警。
IP
与BAM连接失败的模块对应的IP地址。
该告警连带产生ALM-2362BAM到主机通讯失败。
交换机某一个框的一个连接断开。
1.7、与NTP服务器断连
时间同步进程与NTP服务器断连,时间同步已停止。
系统时间无法和NTP服务器同步。
∙NTP服务器被停止或服务被关闭。
∙系统和NTP服务器之间的网络断连。
(1)、在MSOFT3000跟踪维护中用PINGNTP服务器IP地址,检查网络是否正常。
(2)检查NTP服务器是否被停止,NTP服务器的时间服务是否被关闭。
(3)检查系统和NTP服务器之间的网络是否断连。
1.8、Q922链路故障
系统单板之间通过Q.922链路进行通信,底层为FE。
当两个单板间的Q.922链路发生故障时,产生该告警。
当WSMU启动时,WHSC板会自动被复位,此时也会产生该告警。
源模块号
发出告警的单板的模块号
目的模块号
Q.922链路对端模块号
∙使用该链路通信的两个模块之间通信中断。
∙该链路传输的业务发生中断。
∙Q.922链路发生故障。
∙WSMU启动。
1.
检查是否复位了WSMU板?
Y=>
正常告警,不用处理
N=>
转步骤
(2)
2.
检查FE网口的状态是否正常?
观察设备面板HSC端口状态。
转步骤(3)
更换不正常状态网口所在的单板
3.
检查单板的运行状态,如果单板发生故障,更换单板。
DSPBRD:
FN=1,SLN=2,PSN=FB;
(输入HSC单板框号、槽号、前后插板)
1.9、TCP链路故障
系统监测到TCP链路出现故障时产生该告警。
WSMU板通过TCP链路与BAM和iGWB进行通信。
产生该告警的模块号
连接类型
出现故障TCP链路的连接类型,用于定位链路。
如到BAM的链路、到iGWB的链路。
∙告警模块与目的模块之间的通信中断;
∙基于该TCP链路的业务中断。
∙网络连接网线故障;
∙网卡故障。
(1)检查WHSC单板工作状态是否正常?
可能为对端设备如BAM、iGWB网卡故障。
更换故障单板。
(2)根据告警参数确认故障链路位置,检查TCP链路两端网卡的指示灯是否正常?
请联系华为当地办事处技术支援人员。
可能是网线连接问题。
(3)判断是否网线松脱,拔插一下两端的网线接头,确保网线连接正常,检查故障是否排除?
网线连接问题,结束。
可能是网卡故障。
1.10、CPU过载
单板CPU占用超过设定的阈值(使用命令SETCPUTHD设置)时,产生该告警。
发生CPU过载的单板的类型
发生CPU过载的单板所在的机框号码
发生CPU过载的单板所在的槽位号码
位置
该单板在机框中的位置,包括前插板和后插板
过载级别
CPU过载的级别,包括1~4共四个级别
CPU占用率
告警发生时CPU的占用率。
部分呼叫会丢弃,产生呼损。
系统启动流量控制机制,降低CPU占用率。
∙系统容量不足;
∙处理模块分配不合理。
(1)根据告警参数确认发生CPU过载告警的单板,确认是否大部分同类型单板都CPU占用率偏高?
检查该单板的CPU大小:
DSPCPUR:
LT=MN,MN=2;
(输入该单板模块号)
(2)调整业务配置,将过载单板部分业务的调整到其它单板。
1.11、单板网口协商失败
告警解释
当单板的内网口或外网口以半双工模式工作时产生此告警。
告警参数
单板所在的框号
单板所在的槽号
单板的网口号
3.举例
参数“框号=0,槽号=0,端口号=2”表示位于0框0槽WIFM板的第2个网口(外网口)协商失败。
注意:
系统板和WIFM板配置有3个内部端口,即端口0、1和2。
其他单板配置有两个外部端口,即端口0和1。
BAM与主机之间的以太网数据包不正常丢失,可能导致系统从BAM加载文件失败。
单板起来之后,会和LANSwitch进行网口工作模式协商,如果LANSwitch工作在半双工模式,单板端口也会工作在半双工状态。
检查LANSwitch设置,将其设为全双工。
1.13、许可证文件即将失效
许可证在X天后到期。
当以下两种情况中的任意一种发生时将产生此告警:
∙MSC服务器运行在试用许可证模式下。
∙许可证文件在30天之内到期。
文件名
许可证文件名称
发出告警的位置
剩余天数
许可证文件的剩余有效天数
许可证文件很快到期。
当许可证到期,MSC服务器运行在默认许可证配置下。
系统性能会降低。
1.伴随告警
2.引发告警
∙许可证文件很快到期。
∙MSC服务器运行在试用许可证模式。
(1)、检查LICENSE状态,确认LICENSE正常使用期限。
DSPLICENSE:
;
输出结果:
(2)请及时购买许可证文件。
1.14、计费中心长时间未取话单
当计费中心长时间不取话单时,产生此告警。
通道号
通道ID
服务器号
0-主机;
1-备机
访问点ID
接入点ID
与计费中心的连接失败。
(1)检查与计费中心的连接是否正常;
(2)检查FTP或FTAM是否运行正常;
(3)检查计费中心是否运转正常。
1.15、心跳中断
当计费网关双机之间用于心跳的私网、串口均长时间没有接收到对端发送的信号时,产生此告警。
双机间用于心跳的串口、私网连接失败。
检查双机各自的对端是否在运行,双机之间的串口线、私网线是否连接正确,IP地址设置是否正确。
1.16、双机倒换
当计费网关双机中的激活方无法继续工作时,产生此告警。
激活方不能正常运行。
请检查与此告警伴随的其他告警,并进而排除故障。
1.17、私网中断
当计费网关双机之间用于心跳的私网无法正常通信时,产生此告警。
心跳号
0-私网1;
1-私网2
可能引起同步操作或倒换失败。
双机之间用于心跳的私网无法正常通信。
请根据告警参数检查对应的私网网络,检查IP地址设置是否正确,网线连接是否正确。
1.18、IP资源失效
当计费网关激活方无法使用双机之间的某个虚拟IP时,产生此告警。
IP资源号
虚拟IP的编号
可能引起与计费中心、主机、网管台的通信失败。
激活方无法使用双机之间的某个虚拟IP。
请根据告警参数检查具体的虚拟IP,检查网络中是否已经存在相同的IP。
1.19、备份连接失败
当计费网关侦测到连接目的机失败时,产生此告警。
备份任务号
备份任务序列号
计费网关与目的机之间的连接不正常。
检查计费网关与目的机之间是否连接正常。
1.20、单板故障
当系统检测到单板板故障时,产生此告警。
故障单板包括:
WSMU、WMGC、WCCU、WCSU、WCDB、WVDB、WBSG、WIFM、WALU、CPC、WEPI、WCKI
发生告警单板的类型
该故障单板所在的机框号码
该故障单板所在的槽位号码
∙该单板会重启;
。
∙单板发生故障;
∙单板复位。
1.根据告警参数确认该故障单板的位置,检查该单板是否松动,如果松动插紧该单板。
2.打开操作维护系统的设备面板,查看该单板的运行状态(或者使用命令DSPBRD:
),复位该单板,查看故障是否排除?
1.插拔该单板,进行硬件复位,查看故障是否排除?
1.更换故障单板,查看故障是否排除?
1.21、许可证即将过期告警
当许可证文件剩余天数小于90天时,产生此告警。
到许可证过期还剩余的天数。
∙许可证文件离截止日期小于90天。
∙许可证文件运行模式为试用模式。
(2)请重新申请新的许可证文件。
1.22、许可证已经过期告警
当许可证文件过了运行截止日期或者试用模式的试用天数已经用完时,产生此告警。
许可证文件申请的时间已经过期。
1.23、电源输出开关关闭
当电源输出开关关闭时产生此告警。
机架号
管理配电盒的WSMU的框号
开关编号
配电盒的开关号
∙输出电压被关闭
∙系统的灾难恢复能力被减弱。
无
∙配电盒故障;
∙配电盒输出端口故障。
1.检查配电盒输入电源是否正常。
2.检查配电盒。
3.更换配电盒。
1.24、H.248SCTP链路故障
MSCServer同媒体网关间(Mc接口)的SCTP链路发生故障。
MGW索引号
发生此告警的媒体网关索引号。
链路号
发生此告警的媒体网关链路号。
∙H.248消息将不能在该链路上进行传输;
∙如果到指定媒体网关有多条链路,将导致其它链路的负荷增加;
如果到指定媒体网关只有1条链路,则到此媒体网关的所有业务中断。
∙数据配置不正确。
∙MSCServer和媒体网关的物理连接网线脱落或断开。
∙如果MSCServer作为SCTP的服务器端时,由于维护或者其他原因,媒体网关主动发起了SCTP连接的拆除操作。
∙如果MSCServer作为SCTP的客户端时,由于维护或者其他原因,MSCServer删除了所配置的H.248SCTP链路。
∙Mc接口的H.248SCTP链路出现了异常。
(1)检查H.248SCTP相关的数据配置:
使用MML命令LSTSCTPPARA检查MSCServer使用的校验和算法是否和网关使用的一致;
使用MML命令LSTMGW检查MSCServer的SCTP的“服务器/客户端”配置是否正确:
∙如果MSCServer是作为服务器端,那么媒体网关应该是作为客户端
∙如果MSCServer是作为客户端,那么媒体网关应该是作为服务器端
使用MML命令LSTH248LNK检查MSCServer配置的H.248SCTP链路中IP地址、端口信息是否和之前与网关协商的一致;
确保相关数据正确后,检查告警是否恢复?
Y=>
结束。
N=>
转
(2),检查MSCServer同媒体网关间的物理连接。
(2)检查MSCServer同媒体网关间的物理连接。
如果是物理连接网线脱落或断开,确保连接正常后,检查告警是否恢复?
转(3),检查是否媒体网关发起了SCTP链路的拆除操作。
(3)检查是否媒体网关发起了SCTP链路的拆除操作。
在MSCServer上跟踪SCTP链路的消息,确认是否由于媒体网关发起了链路拆除操作?
请联系MGW维护人员处理。
联系华为当地办事处技术支援人员。
1.25、MGW退出服务
当媒体网关向MSCServer上报“退出服务”消息,或者MSCServer同媒体网关间的所有H.248链路中断,将产生该告警。
如果媒体网关发生故障导致退出服务,MSCServer将释放所有在该媒体网关上进行的呼叫,并且不再处理任何与该媒体网关相关的业务。
∙媒体网关向MSCServer报告“退出服务”。
∙MSCServer与该媒体网关之间的所有H.248链路都处于故障状态。
(1)检查媒体网关是否退出服务:
检查媒体网关侧是否已经退出服务,确认退出服务的原因?
待媒体网关重新进入服务后,检查告警是否恢复?
DSPMGW:
MGWIDX=0;
(输入告警MGW号)观察MGW的运行状态。
转
(2)
(2)检查MSCServer同媒体网关之间的H.248链路状态:
检查MSCServer同媒体网关之间的H.248链路状态是否正常,如果不正常,则需要恢复链路。
在链路恢复正常后,检查告警是否恢复?
LSTH248LNK:
输出H.248所在MGW号
DSPH248LNK:
MGWIDX=1;
(输入以上输出的MGW号)
1.26、MTP目的信令点不可达
MTP目的信令点不可达。
目的信令点编码
该链路所连接的远端目的信令点编码
源
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 华为 告警 管理 组织 说明 材料 10