APV日常管理维护手册及应急方案.docx
- 文档编号:9209605
- 上传时间:2023-02-03
- 格式:DOCX
- 页数:20
- 大小:860.29KB
APV日常管理维护手册及应急方案.docx
《APV日常管理维护手册及应急方案.docx》由会员分享,可在线阅读,更多相关《APV日常管理维护手册及应急方案.docx(20页珍藏版)》请在冰豆网上搜索。
APV日常管理维护手册及应急方案
ArrayNetworks
APVSLB日常管理维护手册及应急方案
2011-8-8
目录
1.如何登陆Array设备进行管理1
1.1、通过CLI(命令行)方式1
1.2、通过WEB方式登陆1
2.如何处理cluster的主备状态2
2.1.Cluster的停止/启动2
2.2.Cluster中主备机切换2
2.3.监控Cluster运行状态3
2.4.双机配置同步3
3.如何备份和恢复配置文件4
3.1.配置备份、恢复4
4.如何监控服务健康情况5
5.如何监控系统的负载情况6
5.1.查看CPU、MEMORY等负载6
5.2.查看网络端口负载6
6.如何监控设备log信息7
7.如何定位处理服务中断的问题8
8.如何处理指示灯告警9
9.如何处理双机都不工作的情况10
10.如何恢复密码10
11.如何收集showtech信息12
11.1.通过webui方式12
11.2.通过命令行方式14
12.如何实时跟踪数据包17
12.1.WEBUI方式17
13.如果处理pingArray设备不通的问题17
14.LLB问题信息收集指导-debug18
前言,本手册主要是指导设备管理员对array的负载均衡设备进行有效的日常管理维护及应急方法,首先维护人员必须了解设备的工作原理,设备的网络拓扑结构、设备上的基本配置和操作。
1.如何登陆Array设备进行管理
1.1、通过CLI(命令行)方式
确认你的控制台终端为如下配置:
•支持VT100终端
•波特率为9600
•数据位为8位
•不设置奇偶校验
•停止位为1位
•没有控制位
通过SSH连接设备的接口IP地址,在连接成功建立以后,输入用户名和口令。
系统默认的用户名为array,密码是admin。
1.2、通过WEB方式登陆
打开IE浏览器,在地址栏中输入https:
//接口IP:
8888来登陆设备,系统默认的用户名为array,密码是admin。
2.如何处理cluster的主备状态
2.1.Cluster的停止/启动
在某些特殊情况下,需要停止Cluster。
在WEBUI下,通过选择左边菜单栏的Clutering子菜单进入以下配置界面,选择集群列表中的VCID。
通过点击红色圈中的立即关闭按钮来停止/启动Cluster。
在CLI方式下,可使用如下命令来完成与WEBUI方式相同的工作:
AN(config)#clustervirtualon“VID”(启动)
AN(config)#clustervirtualoff“VID”(停止)
2.2.Cluster中主备机切换
在WEBUI下,手工进行主备机切换的方式如下:
在主机上进入WEBUI,通过选择左边菜单栏的Clutering子菜单进入以下配置界面
先将红圈中的优先级设为1,并按下保持按钮,在设定的时间内,Cluster中现有的优先级最高的一台备机将自动升级为主机。
在CLI下可用如下命令:
AN(config)#clustervirtualpriority“interface”“VID”“priority”(priority=1~255,其中255表示永远为主机)
2.3.监控Cluster运行状态
在WEBUI下,通过选择左边菜单栏的Clutering子菜单进入以下配置界面,可以查看红色圈中的内容来监控Cluster的运行状态,主备机的工作状态等。
状态为master和backup,若为其他状态请检查cluster配置。
在CLI下的命令为:
AN(config)#showclustervirtualstatusall
2.4.双机配置同步
在修改了设备的配置后,可以对Cluster中主备机的配置进行同步,以保证双机的备置的一致。
在WEBUI下,通过选择左边菜单栏的“AdminTools”子菜单下的“ConfigManagement”进入以下配置界面,
注意选择红色圈中的to/from,并在Peer中选择需要同步的设备,然后选择“同步”按钮。
在CLI下的命令为:
AN(config)#synconfigtomachine2(将本机的配置同步至另外一台机器)
AN(config)#synconfigfrommachine1(将另外一台机器的配置同步至本机)
注意:
在每次进行配置同步之后,需要认真检查同步后的情况,如配置并未完全同步则需要手工添加相应的配置,因为某些特定的配置是不可以进行同步的。
3.如何备份和恢复配置文件
3.1.配置备份、恢复
在WEBUI下,通过选择左边菜单栏的“AdminTools”子菜单下的“ConfigManagement”下的“Advanced”菜单进入以下配置界面:
如上图所示,配置备份与恢复可通过三种方式来进行。
最上面一种是SCP方式,这种方式一般比较少用。
中间一种是TFTP,这种方式在大多数网络设备中均支持,是一种比较常用的方式。
下面一种是保存本地文件,将配置文件保存在APV的内部存储设备中。
注意:
在恢复配置之前最好先将现有配置清除。
在CLI下的命令为:
保存配置:
writememory
writefile
writenettftp
writenetscp
恢复配置:
configmemory
configfilefile_name
confignettftp
4.如何监控服务健康情况
当我们配置完毕后,发现服务并不能访问,这时需要检查后台服务的健康情况和array设备的配置对应关系,服务器的状态UP时为绿色,DOWN时为红色。
如果为红色,请查看服务器的IP+port是否正确,设备到后台server的路由是否可达,可以通过ping命令测试路由是否可达,telnet后台server的端口是否正常。
检查服务IP及VIP设置是否正常,通过监控可以看出。
5.如何监控系统的负载情况
5.1.查看CPU、MEMORY等负载
在WEBUI下,通过选择左边菜单栏的“AdminTools”子菜单下的“图形”进入以下配置界面:
红色圈中的按钮可以查看版信息、内存使用状况以及系统资源使用状况。
在CLI下的命令为:
AN(config)#showversion
AN(config)#showmemory
AN(config)#showstatisticssystem
5.2.查看网络端口负载
可以通过CLI方式来查看网络端口的状况:
AN(config)#showinterface“interface”
AN(config)#showipaddress
在WEBUI下,通过选择左边菜单栏的“系统配置”子菜单下的就“监控”进入以下配置界面,查看接口的负载情况
6.如何监控设备log信息
在WEBUI下,通过选择左边菜单栏的“Logging”菜单进入以下配置界面:
请注意下图中的红色圈,要注意选择合适的LOG级别,以确保获得足够的LOG信息。
另外,由于APV只支持在内存中保存1000条LOG信息,因此建议配置外部的LOG服务器来收集LOG信息。
在配置外部LOG服务器时要选择正确的协议与端口。
查看内存中保存1000条LOG信息:
在CLI下的命令为:
配置命令:
AN(config)#logon
AN(config)#loghost
AN(config)#loglevelerr
显示LOG信息:
AN(config)#showlogbufferbackward/forward
清除LOG信息:
AN(config)#clearlogbuffer
7.如何定位处理服务中断的问题
由于配置了双机,当在某一台设备出现故障时,将由备机进行接管运行,因此,在设备正常运转期间一般不会出现异常情况。
当然,如果网络环境有所调整或者管理员改动了APV的配置,则有可能出现一些意想不到的问题。
当这些问题出现时,则一定要先认真分析曾经做过的改动,以确认导致问题出现的原因,并对APV的配置做出相应的调整。
快速故障定位步骤:
▪当业务发生中断时,请通过ping等命令确定array路由可达(与防火墙,服务器等).
▪当某业务系统无法访问时,可以登录web管理界面或命令行方式查看后台服务器的健康状态,是UP或DOWN状态。
若DOWN请检查后台服务器。
直接访问后台server,检查是否可以正常访问,如果异常请检查服务器的配置。
▪如果状态为UP,从内网快速访问APV上的相关vip,如果可以正常访问,说明从APV到后台server是没有问题的。
▪外网无法访问,内网可以时,请定位其他设备的问题,例如防火墙,流控等相关设备。
▪如果后台服务是正常的,APV上的vip访问不正常,请检查配置及查看流量是否转发到后台sever,通过webui的监控可以看到流量。
▪如果发现有流量通过array设备,但是只有请求没有回复,请查看设备的工作模式(查看命令:
AN(config)#showsystemmode),如果为透明模式请确保后台server的网关指向array。
▪紧急情况第一时间通知厂商工程师协助。
▪24小时客户服务电话:
400-600-7878
8.如何处理指示灯告警
APV在前面板上配置了黄、绿、蓝三个LED灯,可以为用户提供一些设备运行状况信息:
黄灯(Fault):
如果在启动或运行过程中此灯长亮(超过30秒),则表示系统出现故障,不能正常运行,请及时联系技术支持人员进行设备维护。
绿灯(Run):
当系统空闲时,该灯每秒闪烁一次;当系统在工作中时此灯快速闪烁,闪烁越快表示系统负载越大。
蓝灯(Blue):
系统加电后,此灯长亮。
如果Fault长亮,并且伴有长鸣的笛声,可能电源出现故障,请关闭设备电源边上的黑色按钮禁止笛声并通知厂家。
9.如何处理双机都不工作的情况
由于配置了双机,当在某一台设备出现故障时,将自动由备机进行接管运行,如果没有自动切换,可以手工切换如拔掉网线,设备重启、关机等。
因此,在设备正常运转期间一般不会出现异常情况。
如果怀疑两台设备配置都有问题或有故障,不能正常处理用户的业务,但是要马上恢复业务时怎么办?
解决方法:
可以通过防火墙服务IP直接映射到后台服务,暂时绕过负载均衡设备。
10.如何恢复密码
10.1如果遗忘了账号array的密码,可以采用以下方式进行恢复:
a)用console线连接设备,在login提示符下输入:
recovery,这时系统会返回challenge,如下:
ArrayNetworksLogin(AN):
recovery
challenge:
ameneshabmeiogoumieach
response:
b)将challenge给厂家SE,然后获得response:
c)然后在console上将response输入,这时设备的口令会恢复到初始状态,即array/admin。
注:
此方法仅能恢复账号array的口令,无法恢复enable密码;如果用户已经将账号array删除,那也无法用此方法恢复。
10.2如果enable密码遗忘,目前必须登陆系统后台才能恢复,方法如下:
d)对于TMX/APV系列6.4及其以上版本中,可在AN>(用户模式)下输入:
enablerecovery获得challenge,
copychallenge内容给厂家
将challenge输入,然后获得response。
完成以上动作后,使用array账号登录,进入config模式下再使用命令enablepasswd重新设置密码然后保存即可。
11.如何收集showtech信息
当设备出现问题,需要收集showtech信息给厂家,下面介绍两种方式获得shtech信息。
11.1.通过webui方式
1).AccesstheWebUI.
2).ClickonSystemManagement
3).ClickonStatisticsontheright-handsidepanel.
4).Copytheoutputandpasteitintonotepad.Thensendusthetextfile.
11.2.通过命令行方式
CollectshowtechviaCLI.
1.SSHtotheboxusingPutty.
2.Getintoconfigmode.
a.login–username/password
b.enable–password
3.ClickonthelogattheupperleftcornerandselectChangeSettings…
4.SelectLoggingandAllsessionoutput.
5.ClickonBrowse…andchangethefilenametoshowtech.txt.Saveittodesktop.
6.Enterthecommandnopageandshowtech
12.如何实时跟踪数据包
当用户通过ArrayAPV访问后台server时,可以通过如下方式实现客户端到后台server的TCP包的跟踪。
注意:
命令为showslbserver.详解请查看APV使用手册。
12.1.WEBUI方式
登录设备,选择左边功能栏的管理工具------问题解决-----slb服务。
如下图:
13.如果处理pingArray设备不通的问题
如果用户pingarray设备发现不通,请查看以下建议:
1)查看Array设备的接口IP地址和路由及vlan是否配置或正确与否。
2)查看网线是否连接好、网卡的指示灯是否正常。
3)从array设备ping网关是否可达。
4)查看用户和Array设备之间是否有防火墙等安全设备阻挡。
5)通过console登录array设备,进入configmode执行如下命令,查看Array设备是否有回包。
enable
config
debugtraceliveoutside"-nicmp"
(判断路由可达array)
Sample:
backup(config)#debugtracelivetcpoutside"-nicmp"
tcpdump:
listeningonem0
05:
12:
55.376051192.168.1.30>192.168.1.4:
icmp:
echorequest(DF)
05:
12:
55.377309192.168.1.4>192.168.1.30:
icmp:
echoreply(DF)
05:
13:
05.376204192.168.1.30>192.168.1.4:
icmp:
echorequest(DF)
05:
13:
05.377585192.168.1.4>192.168.1.30:
icmp:
echoreply(DF)
05:
13:
08.882379192.168.1.150>192.168.1.30:
icmp:
echorequest
05:
13:
08.882426192.168.1.30>192.168.1.150:
icmp:
echoreply
05:
13:
09.884222192.168.1.150>192.168.1.30:
icmp:
echorequest
14.LLB问题信息收集指导-debug
part1问题描述
1.客户名称
2.问题详细描述
故障的现象描述
必须提供实际环境的网络拓扑图
part2信息收集
1.TMX的shtech信息
进入TMX的命令行下,执行命令showtech,然后将输出信息保存。
2.在出问题时,收集TMX上的trace信息
在进入到出错页面前,进入TMX执行下面的命令:
debugenable
debugtracetcpall
等待几分钟收集完毕后,执行命令:
debugdisable
debugftpuserIP
将抓取的文件上传到外部的一个Ftp服务器上。
3.收集LLB的相关统计信息
进入TMX的命令行下,执行以下命令,然后将输出信息保存。
shstatisticsllblink
showstatisticsrts
showstatisticsipflow
showstatisticseroute
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- APV 日常 管理 维护 手册 应急 方案