04第4章 故障处理流程.docx
- 文档编号:29224013
- 上传时间:2023-07-21
- 格式:DOCX
- 页数:7
- 大小:83.38KB
04第4章 故障处理流程.docx
《04第4章 故障处理流程.docx》由会员分享,可在线阅读,更多相关《04第4章 故障处理流程.docx(7页珍藏版)》请在冰豆网上搜索。
04第4章故障处理流程
目录
第4章故障处理流程4-1
4.1故障处理引导4-2
4.1.1引导图4-2
4.1.2引导说明4-3
4.2故障处理流程4-4
4.2.1流程图4-5
4.2.2流程说明4-5
4.3信息采集与信息记录4-8
4.4通报和技术支持4-8
插图目录
图4-1故障处理引导流程图4-2
图4-2OptiXOSN1500故障处理流程4-5
第4章故障处理流程
本章介绍了OptiXOSN1500设备故障处理的流程。
包括:
●故障处理引导
●故障处理流程
●信息采集与信息记录
●通报和技术支持
4.1
故障处理引导
4.1.1引导图
图4-1故障处理引导流程图
4.1.2引导说明
(1)进行故障记录时,力求做到对故障发生的全过程进行真实、详细的记录。
对于像故障发生的时间,在故障出现前后曾经做过哪些操作等重要信息都要进行详实地记录,同时对于网管中的告警信息,性能事件等重要数据也要进行保存。
(2)外部原因造成的故障,如电源问题、光缆问题、机房环境、终端设备等,应及时进入其它相应处理流程。
(3)如果是由于设备问题造成的故障,参照设备应急处理流程进行处理。
在解决问题时,对设备的操作应该严格按照操作规范进行,如必须佩戴防静电手腕等。
(4)遇到困难无法排除故障时,拨打华为公司24小时问题受理电话:
800-830-2118,以获取技术支持,并配合华为公司工程师处理故障。
(5)在业务恢复后,对运行情况进行观察,确认故障已经排除。
(6)在故障处理完后,应及时填写相关的处理报告。
4.2
故障处理流程
因电源故障、断纤等外部原因,或操作不当以及设备软、硬件故障引起的业务中断,维护人员可参照此流程快速定位故障,或及时寻求帮助,直到业务恢复。
注意事项:
按照此流程处理业务中断或其它紧急问题时,需要注意以下几点:
(1)以尽快恢复业务为原则,可以使用调整业务路由、强制倒换等方法恢复业务。
(2)应先分析故障现象,定位原因后再进行处理。
在原因不明的情况下应避免盲目操作,导致问题扩大化。
(3)处理过程中遇到困难,及时联系华为公司以获取技术支持,并配合华为公司处理故障,最大程度减少业务中断时间。
(4)处理过程中一定要作好故障记录,保存好故障的原始数据。
系统应急处理流程是指设备在出现业务中断情况下的故障处理过程,对OptiXOSN1500设备来说,除了遵照故障处理流程外,还应尽可能采取其它的应急措施,减少业务中断时长。
4.2.1流程图
图4-1OptiXOSN1500故障处理流程
4.2.2流程说明
(1)发生业务中断故障时,首先检查是否有以下设备告警,这些告警指示设备或单板有故障,应当首先排除这些故障。
告警名称
告警说明
操作
POWER_FAIL
电源故障
检查电源盒或外部电源
FAN_FAIL
风扇故障导会致设备温度高,影响正常运行
检查风扇开关是否开启;或更换风扇
BD_STATUS
单板不在位
更换单板或主控板
MAIL_ERR
邮箱通信错误
更换单板或主控板
NO_BD_SOFT
单板无软件
更换单板
HARD_BAD
单板硬件故障
更换单板
WR_FAIL
单板硬件故障
更换单板
NE_INSTALL
网元进入安装态
重新下发配置
SYN_BAD
时钟同步源劣化
更换本站或其它站时钟板;或启动主备倒换;或更换外时钟源。
注意:
(1)复位、拔插、更换单板或重下配置数据,都会导致业务中断。
具体操作时避免造成故障扩大。
(2)更换主控板后,需重下该网元的配置数据。
(2)检查保护倒换是否正常
保护倒换故障包括网络级保护倒换故障和设备级保护倒换故障。
对于网络级保护(如复用段、SNCP(Sub-NetworkConnectionProtection))的网络,应先检查业务中断是否由于保护倒换失败引起。
对于设备级保护(如CXL板主备保护、TPS保护)的网元,在工作板故障后出现的业务中断,应检查是否由于保护倒换失败引起。
(3)线路故障处理
线路上有R_LOS、R_LOF等告警或再生段误码时,可通过网管查询光板激光器性能事件或通过光功率计测试收、发光功率,判断光功率是否在光板的正常工作范围之内,排除对端站故障和光缆故障。
如果是设备问题,可通过自环的方法定位故障点。
(4)高阶通道告警的处理
出现HP_TIM、HP_SLM告警,需检查上游站线路板相应高阶通道的J1、C2字节配置与本站是否相同,如配置不同,修改配置再重新下发配置。
OptiX系列设备在出现HP_TIM告警时不影响业务。
(5)支路T_ALOS告警处理
T_ALOS告警一般为线缆、终端设备或本站支路板故障引起。
通过逐段环回或仪表测试的方法来定位问题。
(6)支路TU_AIS告警处理
线路故障、外部因素、倒换异常等问题都会造成支路板上报TU_AIS告警。
在处理TU_AIS前,先排除线路等高级别告警。
通过环回法定位故障点后,可以通过启动网络级保护或设备级保护来试图恢复业务。
通过倒换方法恢复业务时,需要注意避免故障扩大化。
(7)误码和指针
误码问题按照先线路板、后支路板的顺序处理。
线路误码与光功率、光板类型、光板故障有关;只有支路误码的情况可以通过环回的方法定位。
指针问题需要检查全网的时钟配置情况。
(8)配置问题处理
按照业务路由,逐段检查业务配置正确性。
(9)环回和未装载
检查业务路由上是否设置了环回或通道未装载。
4.3
信息采集与信息记录
处理过程中,维护人员要及时记录故障现象、告警、性能以及详细的处理过程,便于对故障进行准确定位,防止真正的故障还遗留在网络中,对网络稳定运行构成威胁。
4.4通报和技术支持
通过设备应急处理流程,不管是否成功排除故障,请尽快与华为公司客户服务中心联系。
设备出现重大故障时请采用电话或传真的方式申请华为公司工程师支援。
请将应急处理中更换的单板返回华为公司维修,并根据服务合同的承诺条款请求提供相应备板。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 04第4章 故障处理流程 04 故障 处理 流程