F5负载均衡产品的常见故障处理手册.docx
- 文档编号:23485822
- 上传时间:2023-05-17
- 格式:DOCX
- 页数:17
- 大小:449.39KB
F5负载均衡产品的常见故障处理手册.docx
《F5负载均衡产品的常见故障处理手册.docx》由会员分享,可在线阅读,更多相关《F5负载均衡产品的常见故障处理手册.docx(17页珍藏版)》请在冰豆网上搜索。
F5负载均衡产品的常见故障处理手册
密级:
内部公开
使用对象:
工程师、合作方、用户
产品名称:
F5BIG-IP应用交换机/应用加速器
F5产品的常见故障处理手册
拟制:
Preparedby
日期:
Date
审核:
Reviewedby
日期:
Date
审核:
Reviewedby
日期:
Date
批准:
Grantedby
日期:
Date
修订记录Revisionrecord
日期
Date
修订版本Revisionversion
描述Description
作者Author
一、常见故障处理说明
1.1当处于主机的BIG-IP突然发生故障时,如何尽快恢复业务?
在确保双机配置一致的前提下(能过日常巡检来保证),进行主备切换,看是否能恢复业务。
主备切换的方法有:
通过Web管理界面进行切换:
System→HighAvailability→Redundancy→ForceStandby。
当主备发生切换完后,看备机能否顺利接管业务。
1.2如何修改配置以后,导致业务异常如何处理?
在修改配置之前,先作一次配置备份。
如果配置修改以后,业务出现异常,恢复配置进行回滚。
备份与恢复配置的方法如下:
1.3如何操作BIG-IP前面板上的LCD按键?
通过操作LCD按键可以实现以下功能:
•Pauseonascreen
•UsetheLCDmenus
•Poweruptheunit
•Halttheunit
•Powerdowntheunit
•Reboottheunit
ØPausingonascreen
Normally,thescreenscycleontheLCDataconstantrate.However,push
theCheckbuttontotoggletheLCDbetweenHoldandRotatemodes.In
Holdmode,asinglescreenisdisplayed.TheRotatemodechangesthe
screendisplayedontheLCDevery4seconds.
ØUsingLCDmenus
PressingtheXbuttonputstheLCDpanelinMenumode.ThebuttonsLeft
Arrow,RightArrow,UpArrow,andDownArrowareonlyfunctionalwhen
theLCDisinMenumode.
ØPoweringuptheunit
Whenyouwanttopoweronaunitthatisshutdown,presstheCheckbutton
toturnthepoweron.
ØHaltingtheunit
Werecommendyouhalttheunitbeforeyoupoweritdownorrebootit
usingtheLCDmenuoptions.
Tohalttheunit
1.PresstheXbutton,thenusethearrowkeystonavigatetotheSystemmenu.
2.PressCheck.NavigatetotheHaltmenu.
3.PresstheCheckbutton.PresstheCheckbuttonagainattheconfirmationscreen.
4.Wait50secondsbeforepoweringthemachineofforrebootingit.
ØPoweringdowntheunit
HoldtheXbuttonfor4secondstopowerdowntheunit.Werecommend
thatyouhaltthesystembeforeyoupowerdownthesysteminthismanner.
Rebootingtheunit
HoldtheCheckbuttonfor4secondstoreboottheunit.Youshouldonlyuse
thisoptionafteryouhalttheunit.
ØClearingalerts
PresstheCheckbuttontoclearanyalertsontheLCDscreen.Youmust
clearanyalertsonthescreenbeforeyoucanusetheLCD.
1.4如何解读LED(设备关面板上的状态灯)显示的信息?
LED功能说明如下:
正常状态下,LED的显示情况:
出现告警时的LED状态:
1.5故障诊断时,有时需要用到命令行。
如何用命令行登陆BIG-IP?
用SSH命令登陆到BIG-IP管理网口的地址。
(BIG-IP管理网口的地址可以在BIG-IP前面的液晶显示板上看到。
)
1.6SSH访问具有密码加密传输的优点,请问从哪里获取SSH客户端?
常用的SSH客户端有:
ØSecureShellClient——
ØTTSSH——TTSSH是公司标准软件TeraTerm的SSH扩展免费软件。
ØSecureCRT——本软件功能强大,评估版为免费软件。
1.7能否采用Telnet登陆到BIG-IP的命令行?
出于安全考虑,BIG-IP不允许采用Telnet的方法登陆到BIG-IP。
PleaserefertothefollowingSOLfordetail.
1.8BIG-IP单机或两台双机系统处于Standby状态,为什么?
单系统处于Standby状态,通常是BIG-IP系统Licnese没有生效,请执行了bversion
解决办法:
激活License。
激活License后bigstartrestart命令结果如下:
f5test-1:
~#bigstartrestart
bigstart:
restartinetd
bigstart:
restartnamed
bigstart:
restartsod
Jan1614:
52:
29f5test-1kernel:
BIG-IPauthorizationsuccessful.
Jan1614:
52:
29f5test-1kernel:
SSLTPSLevel:
100
<输出省略>
f5test-1:
~#bversion
Kernel:
Linux2.4.21-9.2.2.72.0smp
Package:
BIG-IPVersion9.2.276.6
FinalEdition
EnabledFeatures:
ZoneRunner-DNSZoneManagementEarlyAccessFeatures
GlobalApplicationSupportLinkTotalCostLoadBalancing
CNAMERedirectionGlobalCustomRegionDefinitions
LinkCapacityLoadBalancingGTMFailoverToOneDataCenter
IPClassifierInternetWeatherMap
……
如果License已经激活,则在EnableFeatures下会列出所有支持的功能模块。
1.9BIG-IP系统Web管理员admin密码忘记了,如何恢复?
可以通过在命令行执行passwdadmin重新设置admin密码。
方法请参考--ChangingaccountpasswordsforthecommandlineandConfigurationutility。
1.10BIG-IP系统root密码忘记了,如何恢复?
如果Root密码丢失,但还可以进入Web管理界面,则可以在System->Platform界面重新设置Root密码。
如果Root密码丢失,且无法进入Web管理界面,则需要进入到单用户模式,重新设置Root密码。
方法请参考--ChangingaccountpasswordsforthecommandlineandConfigurationutility和
--BootingBIG-IPintosingleusermode
1.11默认的用户名和口令不安全,如何添加新用户或修改现有用户?
Web管理员的密码与命令行登陆root帐可以密码可以通过Web界面进行修改:
登录bigip的WEB管理界面时需使用Admin的用户名,登录bigip的命令行界面需要使用root的用户名,更改这个两个用户名的方法如下:
点击左侧导航条的System→platform
进入其属性页面:
在右侧的页面中,可以在UserAdministration中对这两个用户名的密码进行更改。
更改完毕后点击Update即可生效。
“root”用户也可以通过CLI“passwd”命令进行修改。
1.12BIG-IP系统如何进行配置备份和恢复?
可以通过以下WEB界面进行配置的备份与修改:
System->Archive
也可以在CLI使用“bconfigsave 如果不指定路径,默认保存在目录“/var/local/ucs”中。 1.13网络设备通常有收集系统信息的宏命令,F5有没有相应命令? 与华为路由器“displaybase-information”、华为交换机“displaydiagnostic-information”、思科“showtech-support”和NetScreen防火墙“gettech-support”命令类似,BIG-IP系统也有对应信息收集工具叫F5QkviewDiagnosticTool。 在CLI界面中执行“qkview”,Qkview工具执行完成后将输出信息保存在文件“/var/tmp/ 在进行故障诊断和寻求高级技术支持,别忘了执行本命令。 可以通过Web界面执行qkview命令全面采集系统日志信息并下载下来。 1.14如何使用TCPDUMP进行Troubleshooting? 当业务无法正常工作时,经常需要在BIG-IP上抓包进行分析定位是什么原因导致数据包没有被常转发。 BIG-IP上提供了TCPDUMP抓包分析工具。 TCPDUMP是Unix系统常用的报文分析工具,TCPDUMP经常用于故障定位,如会话保持失效、SNAT通信问题等。 本文讲述TCPDUMP命令的基本用法,更详细的使用说明请参见“mantcpdump”。 命令语法: tcpdump[-adeflnNOpqRStvxX][-ccount][-Ffile] [-iinterface][-mmodule][-rfile] [-ssnaplen][-Ttype][-wfile] [-Ealgo: secret][expression] 其中: Ø-i报文捕获监听的接口,如果不指定,默认为系统最小编号的接口(不包括loop-back接口),一般对指定Vlan名称进行监控,如-iexternal是对externalvlan进行监控;也可以对指定端口进行监控如–i1.1。 注意: 当vlan名称过长时,-i后面直接用vlan名称,tcpdump会出现错误提示,这时需要将vlan名改由vlan加vlanID代替。 如有一vlan名称为bip_external,vlanID为2022,如要对bip_externalvlan进行监听,需采用-ivlan2022的方式。 Ø-n不将IP地址或端口号转化为域名或协议名称 Ø-r从文件中读取(该文件由-w选项创建) Ø-s确定捕获报文大小 Ø-w直接将捕获报文写入文件,而不是对其进行解析并通过屏幕显示(与-r选项对应) Ø-x每个报文以十六进制方式显示 Ø-X每个报文同时以文本和十六进制显示 Øexpression匹配表达式的分组将进行解析。 如果不指定表达式,系统对所有分组进行捕获分析。 复杂表达式可以使用“and”与、“or”或以及“not”非操作进行组合。 表达式有三种: ✓type三种种类: host、net和port。 比如: host10.1.1.1。 如果不指定类型,默认为host。 ✓dir有src、dst、srcordst和srcanddst四种方向。 默认为srcordst,即双向。 ✓proto常见协议有: ip、arp、tcp、udp、icmp等。 如果不指定协议类型,默认为所有协议。 举例1: 对external接口主机139.212.96.2并且端口为1433的流量进行监控。 端口不指定tcp和udp,默认为同时对tcp和udp进行报文捕获。 本命令不解析IP地址/端口号为主机名/服务名称,同时显示报文十二进制和文本信息,报文最大为1500字节。 f5-1: ~#tcpdump-iexternal-n-X-s1500port1433andhost139.212.96.2 tcpdump: listeningonexternal 21: 48: 41.295546139.212.96.2.1201>10.75.9.44.1433: .302192826: 302192827 (1)ac k558871968win64360(DF) 0x0000012c08004500002938cf40007f06c3b2.,..E..)8.@..... 0x00108bd460020a4b092c04b10599120318ba..`..K.,........ 0x0020214fb5a05010fb68a926000000! O..P..h.&... 21: 48: 41.29601510.75.9.44.1433>139.212.96.2.1201: .ack1win64636(DF) 0x0000012c080045000028cb2d40007f063155.,..E..(.-@...1U 0x00100a4b092c8bd46002059904b1214fb5a0.K.,..`.....! O.. 0x0020120318bb5010fc7ca812000000000000....P..|........ 0x00300000.. 21: 48: 50.701130139.212.96.2.1206>10.75.9.44.1433: .304974934: 304974935 (1)ac k565108263win64882(DF) 0x0000012c08004500002938f740007f06c38a.,..E..)8.@..... 0x00108bd460020a4b092c04b60599122d8c56..`..K.,.....-.V 0x002021aede275010fd720a6b000000! ..'P..r.k... 21: 48: 50.70256710.75.9.44.1433>139.212.96.2.1206: .ack1win65267(DF) 0x0000012c080045000028d3a640007f0628dc.,..E..(..@...(. 0x00100a4b092c8bd46002059904b621aede27.K.,..`.....! ..' 0x0020122d8c575010fef308ea000000000000.-.WP........... 0x00300000.. 举例2: 对internal接口主机172.31.230.53和172.31.230.51之间端口8080的流量进行分组捕获。 本命令不解析IP地址/端口号为主机名/服务名称,报文最大为1600字节,捕获信息以“/var/tmp/intdump”文件保存: tcpdump-s1600-niinternal-w/var/tmp/intdump host172.31.230.53andhost172.31.230.51andport8080 如果查看该捕获文件,请用tcpdump–r/var/tmp/intdump命令。 也可以将捕获的文件下载下来用Ethereal工具解包分析。 1.15当现场工程师碰到了无法处理的故障时,如何寻求技术支持? F5第三方技术支持电话为: 深圳齐普生技术有限公司: 柏能、钱江。 寻求F5技术支持时要 1.16寻求F5技术支持时,要提供哪些信息与资料? 一般来说,如果要寻求F5的技术支持(不论是F5第三方技术支持中心或F5全球技术支持中心),都要准备以下信息: 1、产品序列号(在BIG-IP机架安装耳朵的边上以bip开头的字串),产品序列号是判断设备是否在服务有效期内; 2、Qkview输出文件: 里面包含了BIG-IP的配置信息及日志信息。 如果是双机,则两台机器的qkview输出文件都需要提供; 3、故障描述; 4、网络拓扑及IP地址说明; 5、如果必要,还需要提供TCPDUMP的抓包文件,并指出数据包异常现象; 6、如条件允许,对技术支持人员开放远程访问权限。 1.17如何获得更多关于F5产品的技术支持资料、如何查找故障处理办法? 登陆,只需简单注册一下即可下载F5产品的用户手册、并可以用提问的方法查找问题的答案。 其中常用的F5BIG-IP用户手册可以从中找到,例如BIG-IP网络与系统管理指南“BIG-IPNetworkandSystemManagementGuide”--, BIG-IP流量管理解决方法指南“SolutionsGuideforBIG-IPTrafficManagementSystems”--。 1.18如果BIG-IP系统损坏(非硬件故障),如何重装系统? 需要通过网络重装系统,安装方法请参考“”--Reinstallingsystemsoftwarefromanetworkbootserver。 1.19如何实时监视BIG-IP的连接状态? 请使用“bconn”命令,显示示例如下: 192.168.1.254: 46704<->any: any<->192.168.1.1: 8icmp 192.168.4.33: 41622<->any: any<->192.168.20.1: 8icmp 10.9.4.10: 1354<->10.10.4.33: ssh<->10.10.4.33: sshtcp 127.1.1.1: 33880<->127.1.1.2: nbp<->any6: anyudp 192.168.4.33: 36599<->any: any<->192.168.20.3: 8icmp 192.168.1.254: 35139<->any: any<->192.168.1.1: domainudp 192.168.1.254: 35140<->any: any<->192.168.1.1: domainudp 192.168.1.254: 35141<->any: any<->192.168.1.1: domainudp 192.168.1.254: 35142<->any: any<->192.168.1.1: domainudp 192.168.1.254: 35143<->any: any<->192.168.1.1: domainudp 1.20如何实时监视BIG-IP的流量情况? 请使用命令“bigtop–n–delay1”,显示示例如下: |bitssince|bitsinprior|current |Mar221: 17: 57|1seconds|time BIG-IPACTIVE|---In----Out---Conn-|---In----Out---Conn-|23: 48: 08 32.30G50.35G3.888M4324320 VIRTUALip: port|---In----Out---Conn-|---In----Out---Conn-|-NodesUp-- 10.10.4.100: 802189841.499M510003 NODEip: port|---In----Out---Conn-|---In----Out---Conn-|--State---- 192.168.1.1: 5330.57G40.71G3.257M000UP 192.168.20.2: 80996241.395M6000UP 192.168.20.1: 801315281.006M29000UP 192.168.20.3: 80120081371841000UP 192.168.1.2: 53000000NODEDOWN 其中bitsinprior1second列出的InOut是各VirtualServer及Node上的流量情况。 1.21如何监控BIG-IP的性能指标? 通过WEB界面的Overview→Perfrormance进行监控。 1.22BIG-IP发生硬件故障以后的更换流程?
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- F5 负载 均衡 产品 常见故障 处理 手册
![提示](https://static.bdocx.com/images/bang_tan.gif)