华为EPON设备语音故障处理参考手册.docx
- 文档编号:9614042
- 上传时间:2023-02-05
- 格式:DOCX
- 页数:43
- 大小:90.72KB
华为EPON设备语音故障处理参考手册.docx
《华为EPON设备语音故障处理参考手册.docx》由会员分享,可在线阅读,更多相关《华为EPON设备语音故障处理参考手册.docx(43页珍藏版)》请在冰豆网上搜索。
华为EPON设备语音故障处理参考手册
资料编码
产品名称
使用对象
产品版本
编写部门
资料版本
MxU语音业务故障处理指导
拟制:
日期:
审核:
日期:
审核:
日期:
批准:
日期:
华为技术有限公司
版权所有XX
修订记录
日期
修订版本
描述
作者
09年10月31日
V1.0
目录(TOCHeading)
第1章业务故障处理思路5
1.1业务故障整体处理思路5
1.1.1故障处理整体思路5
1.2故障分析处理常用方法和介绍6
1.2.1故障处理常用方法6
1.2.2告警分析7
1.2.3性能分析8
1.2.4分段处理8
1.2.5仪表测试9
1.2.6对比分析10
1.2.7互换分析10
1.2.8配置数据分析11
1.2.9协议分析11
第2章语音业务故障处理指导12
2.1接口注册异常问题12
2.1.1原因分析12
2.1.2排查方法12
2.1.3典型案例13
2.2主叫摘机无馈电问题16
2.2.1原因分析16
2.2.2排查方法17
2.2.3典型案例19
2.3主叫摘机无拨号音问题20
2.3.1原因分析20
2.3.2排查方法20
2.3.3典型案例21
2.4主叫摘机听忙音问题23
2.4.1原因分析23
2.4.2排查方法23
2.4.3典型案例25
2.5主叫拨号忙音(或不通)问题26
2.5.1原因分析26
2.5.2排查方法26
2.5.3典型案例27
2.6被叫振铃异常问题29
2.6.1原因分析29
2.6.2排查方法30
2.6.3典型案例31
2.7被叫来电显示异常问题32
2.7.1原因分析32
2.7.2排查方法32
2.7.3典型案例33
2.8语音质量问题(单通、杂音、回声)34
2.8.1原因分析34
2.8.2排查方法35
2.8.3典型案例35
2.9传真类问题37
2.9.1原因分析37
2.9.2排查方法38
2.9.3典型案例38
第1章业务故障处理思路
业务故障整体处理思路
故障处理整体思路
各处理步骤的详细指导如下:
Ø了解故障现象和进行信息收集:
接到故障申告时,请在第一时间收集以下故障信息:
故障发生的具体时间。
故障现象的详细描述。
故障后已采取的措施和结果。
登录设备采集告警信息,设备、单板运行状态,设备软硬件版本。
Ø分析引起故障的可能原因:
分析故障是指哪些方面的原因可能会导致出现该故障,确定故障的范围即可初步确定故障处理的方向,也就是说在什么地方、顺着什么思路去查找故障的具体原因。
如果是当前设备所有用户出现故障,请进一步了解上行设备接入的其他设备或用户是否同时出现故障。
如果是部分用户出现故障,请进一步了解:
故障用户的业务类型,其他业务是否也出现故障。
故障用户与正常用户的业务单板是否相同。
Ø制定排除方案:
在分析出现问题可能的原因后,应该制定合理的排查方法。
Ø实施排除方案
故障排除是指根据排查方法采取适当的措施逐步分析、清除故障、恢复设备正常运行的过程,如检修线路、更换部件、核对和修改配置数据等。
Ø确认故障处理结果
在完成故障排除的工作后,还需要根据故障影响的范围,对受影响的相关业务进行验证测试,以确认故障现象是否消失。
故障处理完成后,需要进行全面验证,保证故障现象完全消失且没有新的问题被引入。
如果在故障处理过程中遇到难以解决的问题,请及时联系华为技术支持工程师处理。
在故障处理过程中,要对每一步操作及操作所产生的现象做详细记录。
详细的记录是申请华为技术有限公司进一步技术支持的基础。
----结束
故障分析处理常用方法和介绍
故障处理常用方法
先判断外部线缆连接是否正常,再判断设备工作状态是否正常。
先通过控制台查看系统的整体运行状态是否正常,再查看各个模块的运行状态是否正常。
如果故障已经大概定位到某个范围内的排障点,则建议根据排障点的差异选择不同的故障定位方法,有效帮助排除故障。
常用的方法如下:
故障分析处理常用方法
排障点
常用方法
辅助方法
设备外部
对比分析
互换分析
仪表测试
协议分析
告警分析
性能分析
具体设备
分段处理
配置数据分析
告警分析
性能分析
具体模块
分段处理
互换分析
仪表测试
协议分析
告警分析
定义
设备告警系统输出的信息,通常以屏幕输出的形式为维护人员提供信息。
应用场景
告警信息涉及硬件、链路、业务等各个方面,信息量大且全,是进行故障分析和定位的重要依据之一。
告警信息主要包含以下内容:
告警的内容描述
告警发生的位置
告警发生的可能原因
告警的修复建议
告警信息量大、全、直观、简单,对维护人员要求不高。
举例
例如:
使用displayalarmhistory命令查询次要告警。
发现其中一条告警是系统资源过载,系统给出“降低系统负载来解决故障”的修复建议。
huawei(config)#displayalarmhistoryalarmlevelminor
{
Command:
displayalarmhistoryalarmlevelminor
ALARM921FAULTMINOR0x3641a001ENVIRONMENTAL2009-09-1015:
56:
23
ALARMNAME:
Thesystemresourcesusageexceedsthethreshold
PARAMETERS:
ResourceName:
CPU,CurrentPercent:
86
DESCRIPTION:
Thesystemresourcesusageexceedsthethreshold.Thesystem
resourcesincludesystemCPU,systemmemory,andsystem
messages
CAUSE:
Theusagerateofsystemresourceexceedsthethreshold
ADVICE:
Decreasesystemload,forexample,restrictthenumberofon-
lineusers
---END
性能分析
定义
通过设备提供的性能统计手段,对发生故障的业务进行性能指标的分析,从而定位故障原因。
应用场景
针对不同的故障类别,需要查看不同的统计信息。
对维护人员有一定要求,维护人员需要:
熟悉系统的结构和运行机制。
了解系统能够提供哪些统计信息。
了解如何查看、分析统计信息。
举例
例如:
在以太网端口模式下,使用displayportstatistics命令查询以太网端口的统计信息,根据以太网端口的统计信息判断设备运行是否正常。
如果发现CRC错误帧增长很快,说明设备之间可能存在链路异常、端口协商不正确或端口物理故障。
如果发现存在大量的丢弃帧,说明对接设备发送的流量超过了端口的接收能力。
分段处理
定义
当故障现象比较复杂(可能涉及到多个环节)时,需使用分段处理的方法逐个排除正常的环节,最终定位故障。
应用场景
对维护人员有一定要求,维护人员需要:
对设备的系统结构和原理有深入的了解。
对可能导致业务故障的各个环节全面了解。
熟练掌握环回操作。
熟练使用测试仪器。
举例
例如:
某用户组播节目经常会出现中断,重新点播后又恢复正常。
通过分段分析,故障可能原因如下:
组播路由器配置问题
组播服务器问题
用户机顶盒问题
在分析结果的基础上,对各个环节进行测试,最终定位故障。
仪表测试
定义
使用各种仪器、仪表取得实际的各种性能参数,对照理论的参数值来定位和排除故障。
由于仪器、仪表以直观、量化的数据直接反映设备运行状态,在故障处理过程中有着不可替代的作用。
应用场景
常用的仪器、仪表的功能或应用场景如所0示。
故障处理时常用的仪器和仪表
仪器或仪表名称
用途
万用表
用于测试电缆的通断及设备的电性能指标,包括电压、电流、电阻等。
光功率计
用于测试光功率值。
可调光衰减器
通过调节衰减量可调节光信号的光功率。
线路测试仪
用于测试光纤的长度及损耗等物理规格,辅以数据分析,精确定位光纤链路中的事件点及故障点。
举例
例如:
使用光功率计测试光口平均发送光功率,依此判断光信号发送模块是否正常;或者在电源调试过程中使用万用表,进行电压、电阻、电流强度的测试。
对比分析
定义
将故障的部件或现象与正常的部件或现象进行比较分析,通过找出不同点来定位故障。
应用场景
对比分析适用于故障现象或原因比较单一的场合。
举例
例如:
某EPON接入用户的ONT不能上线,此时可通过更换ONT或者对比同一分光器下的其他EPON用户是否有同样的问题来定位故障。
互换分析
定义
将处于正常状态的部件(如单板、光纤等)与可能故障的部件对调,从而判断故障点。
应用场景
在以下情况下使用此分析方法:
在更换部件后,仍然不能确定故障的范围或故障点。
通过比较“对调后二者运行状况的变化”,确定故障的范围或故障点。
故障现象或原因比较复杂。
互换操作具有一定的风险,例如:
将短路的单板换到正常的机框有可能造成正常机框损坏。
因此,使用互换方法需要谨慎,确保不会引入新的故障。
配置数据分析
定义
通过分析设备的配置数据来定位问题,数据配置错误或更改是引起故障的重要原因之一,配置数据分析是故障定位不可缺少的一个方法。
应用场景
在新开局点或更改配置后推荐使用此分析方法。
举例
例如:
一台MA5620E下所有用户无法收看组播节目,通过检查配置数据发现:
组播源设置的TTL值太小,导致组播数据在MA5620E上转发时,由于TTL值等于0而被丢弃。
协议分析
定义
通过信令跟踪、捕获数据包等手段对故障进行分析的方法。
应用场景
当ONU和上层设备出现对接问题时的定位和故障排除。
对维护人员有一定要求,维护人员需要对协议有深入的了解,掌握各种协议报文的交互流程,从而能够从获得的报文中定位故障。
举例
例如:
某用户不能点播组播节目,通过抓包分析后发现,BRAS丢弃了该用户发出的IGMP报文。
问题处理过程中涉及的收集信令和分析信令操作比较复杂,可以联系华为技术支持咨询详细操作。
第2章语音业务故障处理指导
2.1接口注册异常问题
2.1.1原因分析
重启MG接口后,发现接口状态始终为“接口等待响应”或者“接口故障”,可能的原因有:
ØH248接口数据配置错误
MxU侧H248接口数据需要与上级软交换侧接口数据相一致,在故障处理过程中务必要确认下面的接口数据内容:
协议起始版本号、传输协议、MG/MGC地址、端口号。
ØMxU与软交换之间路由不通,MxU与软交换之间存在防火墙造成2944/2945端口
隔离;
ØMxU与某软交换协议配合类问题:
当前各厂商对H248协议的理解存在一定的差
异,这些差异的存在导致MxU与其他异厂家软交换设备对接的时候可能存在异常,
需要注意在对接异厂家软交换设备的时候采用相应的profile文件。
2.1.2排查方法
Ø步骤1检查本设备运行状态是否良好,各单板指示灯状态是否正常,是否存在相
关告警,排除本设备问题。
Ø步骤2使用ping或tracert命令依次检查从本设备至上行网关和软交换设备的
连通性,确认物理线路和上行设备均正常。
Ø步骤3仔细检查本设备和MGC的对接参数设置。
如果MG接口属性中配置了域名,
需要首先确保域名的配置是正确的,因为设备对域名是优先处理的。
注意
配置参数对应如下:
MG接口属性
ONU配置
MGC配置
网关IP
接口IP地址必须是ONU的IP地址池中的一个IP地址
存在一个以IP:
29XX为标识的网关
网关端口号
是范围从2900到2999的任意一个值
MG信令IP地址
IP地址必须是ONU的IP地址池中的一个IP地址
MG媒体IP地址
IP地址必须是ONU的IP地址池中的一个IP地址
MGCIP地址
需要注册到的某个MGC的IP地址
和MG注册时的MGCIP地址和MGC端口号一致
MGC端口号
一个合法的MGC端口号
控制协议类型
H.248
H.248
传输协议类型
UDP
UDP
是否支持鉴权
支持鉴权
MGC也配置为支持鉴权
鉴权参数
ONU上的鉴权参数(包括初始密钥、鉴权网关表示、加密算法)需要和MGC配置一致
MGC的鉴权配置需要和ONU对应
Ø步骤4确认上级软交换设备类型,检查MxU侧H248接口属性中是否采用了相
应的profile文件:
MXU(config-if-h248-1456)#if-h248 attribute profile-index ?
---------------------------------------------
Command of h248mgid-1456 Mode:
---------------------------------------------
index
0:
CustomizingProfileTemplet("")
1:
NoProfile("")
2:
BT_AGW/3("BT_AGW/3")
3:
FT_AGW/2("FT_AGW/2")
4:
KPN_AGW/1("KPN_AGW/1")
5:
PCCW_AGW/1("PCCW_AGW/1")
6:
ZTE_AGW/1("ZTE_AGW/1")
Ø步骤5在软交换侧或MxU侧进行H248信令收集,看是否可以收到对端的信令消息。
Ø步骤6分析H248信令交互过程定位问题。
问题处理过程中涉及的收集信令和分析信令操作比较复杂,可以联系华为技术支持咨询详细操作。
2.1.3典型案例
Ø由于Z厂家交换机ACL限制导致MA5620G的H248接口无法建立
【现象描述】:
新开局MxU设备配置完MG接口后,接口反复重启。
【组网】:
MA5620G-MA5680T-8500-T64G-MGC概述:
MA5620G上语音业务三层接口vlan384,MA5680T打上外层vlan1001,8500透传,Z厂家T64G剥离外层vlan,终结vlan接口。
【处理过程】:
1、检查MA5620G设备接口数据与软交换一致无误。
2、从MA5620G ping网关也不通,检查MA5620GMG接口地址及相关VLAN配置正常,而且MA5620G上宽带上网业务正常,取消VLAN384接口,将384配置到一个FE口,PC上配置MG接口地址,ping网关也不通。
而且检查MA5680T上通过vlan1001学习的MAC地址可以学到PC的MAC。
3、检查MA5680T配置透传业务流正常,在MA5680T上配置VLAN384并启用三层接口配置同网段IP可以与MG接口地址互通。
4、恢复MA5680T上的配置,到T64G上查看可以学习到PC的MAC,定位问题应该在T64G及其上层设备导致。
仔细查看T64G ACL,发现MA5620G的MAC不在允许的地址段中,添加MA5620G的MAC地址后,再恢复MA5620G上的MG地址配置,可以正常ping通MGC,重新启动接口后接口可以正常建立。
ØMA5606T由于域名设置问题导致无法注册
【现象描述】:
某局新开MA5606T和Z商软交换配合开NGN语音业务,经过检查发现MA5606T上MG接口总是处于等待状态,无法正常。
【组网】:
MA5606T-----B200-----软交换
【处理过程】:
1、检查MA5606T设备上数据,由于是采用域名注册重点检查MG接口域名是否和软交换一致,检查双方配置域名配置一致。
2、经过了解MA5606T设备并不是直接注册到软交换而是注册到Z商B200代理服务器上,由于已经有MA5606T成功注册到B200上。
对照设备进行比较检查发现:
两台设备唯一区别是MGC Domain Name,成功设备后面有-BGW,而失败的设备上没有-BGW。
在失败的设备上对MG接口数据进行修改加BGW就可以成功注册。
通过客户那里了解B200设备之所以需要ONU设备加BGW这个参数是为了区别信令是从软交换发到B200还是从ONU发送到B200。
ØSBC设备未启用H.248协议导致MA5620E无法注册
【现象描述】:
MA5620E启用H248协议,采用域名方式注册,查看MA5620E上MG接口一直处于WAIT-ACK状态,MA5620E一直无法注册成功。
【组网】:
MA5620E-MA5680T-SBC-MGC。
【处理过程】:
1、确认通讯正常,MA5620E可以与MGC通讯。
2、核对MA5620E配置,没有问题。
3、核对MGC的数据,已经对该局点的信息进行过添加。
4、查看与MGC协商的版本信息,都是从V1开始,没有问题。
5、通过DBWIN打印消息,MA5620E一直在发注册消息,没有响应报文,基本定位在上层设备问题。
6、通过逐步检查,查看SBC设备,发现H248协议被禁用了,启用后问题解决。
Ø软交换配置问题导致HG850e注册报504错误
【现象描述】:
MG接口注册失败,抓包发现注册时软交换报504错误。
【组网】:
SOFTX3000--ME60--SR--MA5680T--HG850e。
【处理过程】:
1、用一台MA5620E设备使用相同的数据替代HG850e,可以正常注册。
说明链路和两端的H.248协议参数配置正确。
2、将软交换上对应的媒体网关参数‘是否非我司认证的网关设备’修改为‘是’,即表示非我司网关设备后,HG850e注册正常。
ØMA5620E因配置的注册域名冲突导致MG接口20分钟复位一次
【现象描述】:
某局反映,某小区一台MA5620E,有时可以正常拨打电话,有时出现摘机无音,经常出现这样的问题。
。
【组网】:
softx3000---SBC---OLT----ONU。
【处理过程】
1、检查ONU、OLT上面的告警信息,没有发现有任何的光路告警信息,现场测试ONU接收光功率,为-14DB,非常正常,排除光路问题。
2、在问题出现的时候,在ONU上pingSBC的地址没有丢包,在SBC上pingsoftx3000的地址,也没有丢包。
由于只有这个ONU出现问题,丢包的可能性也比较小。
3、查看SBC和softx3000上面的数据配置,和其他ONU的配置都一样,排除数据配置的问题。
4、在ONU上使用DBWIN跟踪信令消息,发现ONU5分钟没有收到softx3000发送的心跳报文,然后ONU主动发送心跳报文给softx3000,心跳报文1分钟发送一次,连续发送了5次都没有收到softx3000的回复报文,于是ONU自动复位MG接口,如此周而复始,就出现了20分钟中断一次的问题,由于是ONU没有收到softx3000发送的心跳导致的MG接口复位,怀疑是softx3000没有发送心跳报文导致,所以在softx3000上面跟踪了该ONU的信息,发现softx3000一直都在发心跳报文。
分析softx3000上面跟踪到的消息,softx3000一直不停的发送心跳,直到收到了ONU发送过来的RE="900"的复位消息,才响应了复位。
开始怀疑是SBC丢弃了softx3000发给ONU的心跳报文,于是在SBC上面跟踪该ONU的消息,发现SBC根本就没有收到softx3000发过来的心跳报文,和ONU上跟踪的信息一致。
从softx3000和SBC上面跟踪同一个ONU出现两种截然不同的结果,肯定出了问题。
仔细查看softx3000的信令消息,发现MGW的地址发生了变换,从原来的10.34.18.41变成了10.34.18.52,说明有两个ONU和softx3000之间通信,但是域名却是同一个。
在10.34.18.41和10.34.18.52这两个SBC上面查看该域名,都可以查看到注册用户,问题很明白了,两个不同的ONU配置了相同的域名。
总结:
1号、2号ONU配置相同的域名,在同一时间只能有一个ONU和softx3000之间信令交互。
假如2号ONU正常,而1号ONU在5分钟内没有收到softx3000的心跳时,它会自动发送心跳给softx3000,如果5分钟没有得到响应,就会发送重启动MG接口信令给softx3000,当softx3000收到该重启动信令后,会回复该消息,此次1号ONU进入了服务。
而2号ONU就会和先前1号ONU一样,收不到softx3000的心跳,出现10分钟后MG接口复位,所以每个ONU的MG接口刚好是20分钟复位一次。
2.2主叫摘机无馈电问题
2.2.1原因分析
话机馈电(Battery)作为POTS用户接口板的基本功能之一是由电源板转换生成-48V直流电压,由POTS单板经过模拟外线提供给话机终端的。
因为在POTS用户端口不配置端口数据的情况下主机仍然可以提供馈电电压,所以此类问题通常与数据配置原因无关。
对于常见的主叫摘机无馈电问题有以下几个方面原因:
Ø模拟线路和终端问题;
ØPOTS单板硬件问题。
2.2.2排查方法
Ø步骤1检查是否由于短路还是断线引起话机无馈电。
可以使用命令potsloop-line-test对相应的用户端口进行外线测试。
下面是一个外线测试结果正常的例子。
huawei(config-test)#potsloop-line-test0/4/0busy1
Testingport:
0/4/0
Telno:
70000000
MGid:
0
Terminalid:
A0
-------------------------------------------------------------------------
TestitemResult
-------------------------------------------------------------------------
A->groundACvoltage(V)3.677
B->ground
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 华为 EPON 设备 语音 故障 处理 参考手册