华为交换机网络环路识别和问题定位.pptx
- 文档编号:1720291
- 上传时间:2022-10-23
- 格式:PPTX
- 页数:21
- 大小:646.26KB
华为交换机网络环路识别和问题定位.pptx
《华为交换机网络环路识别和问题定位.pptx》由会员分享,可在线阅读,更多相关《华为交换机网络环路识别和问题定位.pptx(21页珍藏版)》请在冰豆网上搜索。
交换机网络环路识别和问题定位,诊断工具display工具如何快速识别环路定位思路第一步:
通过端口流量发现环路风暴第二步:
通过持续MAC漂移判断环路第三步:
通过大量的CPCAR丢包判断环路第四步:
通过LDT功能检测环路如何快速恢复环路如何快速破环如何分析环路的成因典型环路场景破环后网络优化,目录,loop-detecteth-loopalarm-only,Quidway-vlan100loop-detecteth-loopalarm-only?
Quidwaydisplayloop-detecteth-loopvlan100VLANBlock-timeRetryTimesBlock-action-10000alarm-onlyTotalitems:
1,框式设备默认全局已经使能,盒式设备需要在vlan下使能,Vlan下使能后通过此命令查看,框式设备默认已经使能,如果有漂移打开terminaldebugging、terminalmonitor就可以查看。
MAC漂移检测命令用于检测设备上MAC地址漂移信息。
框式设备默认全局开启,盒式设备默认未能使,需要在VLAN视图下使能。
loop-detecteth-loopalarm-only,L2IFPPI/4/MFLPVLANALARM:
OID1.3.6.1.4.1.2011.5.25.160.3.7Loopexistsinvlan1001,forflappingmac-address0025-9e6e-1c55betweenportGE2/1/23andportGE2/1/22.,L2IFPPI/4/MAC_FLAPPING_ALARM:
OID1.3.6.1.4.1.2011.5.25.42.2.1.7.12Themac-addresshasflapvalue.(L2IfPort=0,entPhysicalIndex=0,BaseTrapSeverity=4,BaseTrapProbableCause=549,BaseTrapEventType=1,MacAdd=0025-9e6e-1c55,vlanid=1001,FormerIfDescName=GigabitEthernet2/1/23,CurrentIfDescName=GigabitEthernet2/1/22,DeviceName=9303-222.157),框式设备的告警信息如下:
盒式设备的告警信息如下:
displayinterfacebrief|includeup,Quidwaydisplayinterfacebrief|inupPHY:
Physical*down:
administrativelydown(l):
loopback(b):
BFDdownInUti/OutUti:
inpututility/outpututilityInterfacePHYAuto-NegDuplexBandwidthInUtiOutUtiTrunkGigabitEthernet0/0/2upenablefull100M0%0.01%-GigabitEthernet0/0/16upenablefull1000M76%76%1GigabitEthernet1/0/12upenablefull1000M76%76%1MEth0/0/1upenablehalf100M0.01%0.01%-,对于流量出入都异常大的端口,需要特别关注,可能都是网络异常环路上的端口。
displaycpu-defendstatistics,Quidwaydispcpu-defendarp-requeststatisticsslot3CPCARonslot3-PacketTypePass(Bytes)Drop(Bytes)Pass(Packets)Drop(Packets)arp-request91720644610013391561348833897078517-,dispcpu-defendstatistics?
allCPCARinformationofallboards.slotSpecifytheslotnumber|MatchingoutputQuidwaydispcpu-defendstatisticspacket-typearp-request?
allCPCARinformationofallboardsmcuCPCARinformationofmainboardslotSpecifytheslotnumber,针对单板或全局看出各个cpcar的丢包情况,也可以指定特定cpcar查看,大量的协议报文被丢弃,Drop比Pass多很多,这种情况要怀疑由协议报文在网络异常环路中风暴导致的,需要排查网络环路。
诊断命令行display工具如何快速识别环路定位思路第一步:
通过端口流量发现环路风暴第二步:
通过持续MAC漂移判断环路第三步:
通过大量的CPCAR丢包判断环路第四步:
通过LDT功能检测环路如何快速恢复环路如何快速破环如何分析环路的成因典型环路场景破环后网络优化,目录,如何快速识别环路,第一步:
通过流量异常发现环路风暴,1.如果只有一台设备的一个端口出入方向流量较大,可能是单端口环回。
2.如果只有一台设备的两个端口流量较大,可能是本设备两个端口环回,如上所示。
3.如果某端口只有单方向流量,需要重点排查,该端口下设备可能存在环路。
QuidwaydispinterfaceEthernetbrief|inupPHY:
Physical*down:
administrativelydown(l):
loopback(b):
BFDdownInUti/OutUti:
inpututility/outpututilityInterfacePHYAuto-NegDuplexBandwidthInUtiOutUtiTrunkGigabitEthernet0/0/2upenablefull100M0%0.01%-GigabitEthernet0/0/16upenablefull1000M76%76%1GigabitEthernet1/0/12upenablefull1000M76%76%1,第一步:
通过流量异常发现环路风暴,还可以通过CPCAR丢包来发现网络异常环路。
通常情况下,ARP报文的交互是有序进行,短时间内不会出现大量ARP报文的丢弃。
当交换机作为汇聚网关时,出现上述情况后,可能是ARP广播报文在网络物理环路中转发,形成ARP广播风暴冲击交换机,进而被交换机CPU限速(CPCAR)丢弃。
如下所示,arp-request大量丢弃,可能存在网路环路:
displaycpu-defendarp-requeststatisticsslot3CPCARonslot3-PacketTypePass(Bytes)Drop(Bytes)Pass(Packets)Drop(Packets)arp-request91728872610017599401348954897084705-,第二步:
通过持续MAC漂移判断环路,对于端口配置了广播抑制,或者单环、半环场景,流量无法产生风暴,则还可以通过MAC漂移检测来判断是否存在环路。
任何二层环路都会伴随着持续MAC地址漂移。
如下所示,如果设备一直打印该告警,GE2/1/23和GE2/1/22端口之间可能存在环路。
L2IFPPI/4/MAC_FLAPPING_ALARM:
OID1.3.6.1.4.1.2011.5.25.42.2.1.7.12Themac-addresshasflapvalue.(L2IfPort=0,entPhysicalIndex=0,BaseTrapSeverity=4,BaseTrapProbableCause=549,BaseTrapEventType=1,MacAdd=0025-9e6e-1c55,vlanid=1001,FormerIfDescName=GigabitEthernet2/1/23,CurrentIfDescName=GigabitEthernet2/1/22,DeviceName=9303-222.157),MAC-Flapping示意图,第三步:
通过LDT发现环路,对于单端口网络环路,还可以通过LDT(loop-detection)进行发现。
Quidwayloop-detectionenableQuidwayloop-detectionenablevlan100Quidwaydisplayloop-detectionLoopDetectionisenabled.Detectionintervaltimeis5seconds.Followingvlansenableloop-detection:
vlan100Followingportsareblockedforloop:
使能某个VLAN下所有接口的环路检测功能,查询该VLAN下是否有接口存在环路,成环的端口会在此显示出来,注:
LDT可以发现单端口环回,并默认将该端口做DOWN处理,具体配置可参考用户手册。
查询命令行display工具如何快速识别环路定位思路第一步:
通过端口流量发现环路风暴第二步:
通过持续MAC漂移判断环路第三步:
通过大量的CPCAR丢包判断环路第四步:
通过LDT功能检测环路如何快速恢复环路如何快速破环如何分析环路的成因典型环路场景破环后网络优化,目录,如何快速破环,以太网的环路,会在短时间内形成数据风暴,对业务质量有严重影响。
在确认网络发生异常环路后,可以通过如下方式快速破环恢复业务。
1端口退出成环VLAN破环2shutdown成环端口破环3直接拔出成环光纤破环,如何分析环路的成因,网路环路一般都很网络变动相关,需要先从近期的网络变动排查起。
1.是否由于近期施工或者客户操作操作引入环路。
如果环路问题是由于近期施工操作引入,可以和施工方确认,了解施工的过程,特别是新增线路连接的细节,结合拓扑结构,确认后排出物理环路。
2.是否由于近期修改配置引入的环路,重点检查如下几类端口或环路相关的操作命令:
典型环路场景:
本设备自环路,前置条件:
交换机未配置STP和LDT问题现象:
端口出方向和入方向流量持续增加。
问题原因:
端口自环或者链路环回。
处理方法:
此类环路造成的原因是光纤或者网线误接,需要拆除连线。
图3:
设备自环出现环路,典型环路场景:
下游设备自环路,前置条件:
设备未部署STP和LDT,本设备未环回。
问题现象:
端口入方向和出方向流量持续增大。
问题原因:
下游链路环回或者自环。
处理方法:
1.首先逐跳向下游寻找环路链路(可以通过接口异常流量逐端口排查)。
2.设备由于链路引入环路有两种:
一种是单端口收发环回,另一种是设备上两个端口环路。
此类环路造成的原因是光纤或者网线误接,需要拆除连线。
下游设备自环出现环路,典型环路场景:
网络环路,前置条件:
设备部署STP、RRPP、SEP或者SMLK等破环协议。
问题现象:
环路一段时间收敛正常,一段时间收敛失败,或持续震荡。
问题原因:
环网协议报文转发失败,反复超时震荡。
处理方法:
1.检查环路各接口错包情况,如果有建议更换问题链路或者光模块。
2.检查环路各接口是否有流量抑制配置,如果有建议修改流量抑制配置。
3.检查环路各接口网络流量,确认环路各接口是否存在Discard拥塞计数,如果有则建议部署QoS。
图:
环路堵塞端口存在振荡,典型环路场景:
报文转发异常导致环路,前置条件:
二层网络环路收敛正常,堵塞端口状态下发正常问题现象:
在LSW3形成频繁的MAC-Flapping,出现疑似环路问题。
问题原因
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 华为 交换机 网络 环路 识别 问题 定位