hpux日常维护手册.docx
- 文档编号:27706636
- 上传时间:2023-07-04
- 格式:DOCX
- 页数:12
- 大小:60.99KB
hpux日常维护手册.docx
《hpux日常维护手册.docx》由会员分享,可在线阅读,更多相关《hpux日常维护手册.docx(12页珍藏版)》请在冰豆网上搜索。
hpux日常维护手册
hp-ux日常维护手册
HP-UX日常检查
日常维护检查项目,主要由以下:
机房环境、硬件、操作系统、备份以及应用
硬件
1.硬件主要从面板指示灯和服务器中各个扩展卡的指示灯来查看:
面板指示灯:
在大多数的服务器中,都有一个液晶面板或多个指示灯,用来显示服务器的运行状态。
在系统出现故障时,液晶面板上会出现WARNING或FAULT的提示;WARNING或FAULT的指示灯会亮。
(1).服务器中的各个扩展卡的指示灯
在服务器中存在多种扩展卡,例如SCSI卡、以太网卡等。
这些卡上都有一个或多个指示灯,从这些指示灯可以了解这些卡的工作情况。
SCSI卡:
在正常情况下,自检灯(selftest)应该是暗的;终结电源指示灯(TerminatorPWR)应该是亮的。
以太网卡:
在正常情况下,自检灯(selftest)应该是暗的;连接灯(Link)是亮的。
(2).外设的状态
大部分外设也都有自己的状态指示。
下面是比较常见的几种:
RAID磁盘阵列:
该磁盘阵列有一个液晶面板。
如果出现故障,在面板上会出现WARNING提示信息。
磁带库:
磁带库一般也有一个液晶面板。
如果出现故障,在面板上会出现报错提示信息。
2.MP(管理处理器)是基于单元服务器的独立支持系统,可以连接到服务器组合系统。
同时,还可以执行服务器硬件的管理或监视任务。
主要功能包括:
(1).从MP上检查硬件—PS
ps:
显示详细的电源和硬件配置状态
(2).从MP上检查硬件—LS
ls:
显示Lan连接的控制台
(3).从MP上检查硬件—SYSREV
Sysrev:
显示组合系统中所有固件实体的版本
操作系统
在这一部分,通过一些实用、简单的命令,检查系统的运行情况。
在系统出现问题时,常常会在控制台上显示一些出错信息,应该定期检查这些信息,这往往是最便捷的方式。
•系统日志
syslog.log,ccerrlog,eventlog,dmesg
•系统运行状态
cmviewcl、bdf、ioscan、vgdisplay、top、sar、swapinfo、netstat
(1).系统日志--syslog.log
系统日志:
syslog是系统重起到当前的日志,重起后将自动保存为OLDsyslog.log
应检查的内容:
•有无SCSIReset告警(启动前后的SCSIreset信息可忽略)
•有无EMS告警。
如:
09:
43:
05bj_rz3EMS[2286]:
------EMSEventNotification------Value:
"SERIOUS(4)"forResource:
"/system/events/core_hw/core_hw"(Threshold:
>="3")Executethefollowingcommandtoobtaineventdetails:
/opt/resmon/bin/resdata-R149815298-r/system/events/core_hw/core_hw-n149815299-a
•凡是Value为Majorwarning、Serious或Critical的报警都应关注。
•有无“PVPowerfail、”IOerror报错
如有重起操作,建议保存当前的syslog日志
(2).系统日志---dmesg
驻留在内存中的系统最近一段时间的日志信息:
$Revision:
vmunix:
vw:
-projselectors:
CUPI80_BL2000_1108-c'VwforCUPI80_BL2000_1108build'--cupi80_bl2000_1108'CUPI80_BL2000_1108'WedNov819:
24:
56PST2000$
MemoryInformation:
physicalpagesize=4096bytes,logicalpagesize=4096bytes
Physical:
4177920Kbytes,lockable:
3859368Kbytes,available:
3859944Kbytes
Using3162bufferscontaining24576Kbytesofmemory.
常见的异常信息:
SCSIResetDetected
LPMCI-Cacheerror
FileSystemFull
发现后应及时察看syslog.log中的相应条目
(3).系统运行状态—cmviewcl
观察双机状态,执行cmviewcl–v,确认STATUS和STATE为up和running,同时包自动切换(AUTO_RUN)属性为enable
CLUSTERSTATUS
hpclusterup
NODESTATUSSTATEGMS_STATE
bjscp1auprunninghalted
Network_Parameters:
INTERFACESTATUSPATHNAME
PRIMARYup0/5/0/0lan1
PRIMARYup0/0/0/0lan0
STANDBYup1/12/0/0lan2
PACKAGESTATUSSTATEAUTO_RUNNODE
scppkguprunningenabledbjscp1a
厖
NODESTATUSSTATEGMS_STATE
bjscp1buprunninghalted
Network_Parameters:
INTERFACESTATUSPATHNAME
PRIMARYup0/5/0/0lan1
STANDBYup1/12/0/0lan2
PRIMARYup0/0/0/0lan0
(4).系统运行状态—bdf
检查文件系统的使用率
Filesystemkbytesusedavail%usedMountedon
/dev/vg00/lvol32048004816815542424%/
/dev/vg00/lvol12950243885622666415%/stand
/dev/vg00/lvol847063041523976315759233%/var
/dev/vg00/lvol7116326470830445146461%/usr
/dev/vg00/lvol42048009640810756847%/tmp
/dev/vg00/lvol6104857676602428036073%/opt
/dev/vg00/lvol51048576445610360240%/home
应检查有无使用率大于90%的文件系统
(5).系统运行状态--文件系统维护
发现文件系统已满,应及时删除无用文件或扩大文件系统。
可定期清理日志:
#/var/adm/syslog/syslog.log(系统日志)
#/etc/rc.log(运行日志)
#/var/adm/wtmp(登录成功日志)可清理(#>wtmp)
#/var/adm/btmp(登录失败日志)可清理(#>btmp)
core文件的清理(#find/-namecore-execrm{}\大文件(#find/-name-size+10000)
注:
以上文件确认无用后rm删除
/var/adm/crash:
内核的卸入卸出目录。
内核崩溃时映像文件会自动保存到这个目录下。
该目录下的文件建议应该由hp的工程师删除.
(6).系统运行状态--ioscan–fn
检察IO设备是否正常:
ClassIH/WPathDriverS/WStateH/WTypeDescription
======================================================================================
root0rootCLAIMEDBUS_NEXUS
ioa00sbaCLAIMEDBUS_NEXUSSystemBusAdapter(803)
ba00/0lbaCLAIMEDBUS_NEXUSLocalPCIBusAdapter(782)
lan00/0/0/0btlan3CLAIMEDINTERFACEHPPCI10/100Base-TXCore
/dev/diag/lan0/dev/ether0
ext_bus00/0/1/0c720CLAIMEDINTERFACESCSIC895UltraWideSingle-Ended
target00/0/1/0.1tgtCLAIMEDDEVICE
disk00/0/1/0.1.0sdiskNO_HWDEVICEHPDVD-ROM305
/dev/dsk/c0t1d0/dev/rdsk/c0t1d0
应检查有无状态为NO_HW的设备
(7).系统运行状态—vgdisplay
显示卷组状态,重点检查vg00,执行vgdisplay–vvg00
---Volumegroups---
VGName/dev/vg00
VGWriteAccessread/write
VGStatusavailable
MaxLV255
厖
--Logicalvolumes---
LVName/dev/vg00/lvol1
LVStatusavailable/syncd
LVSize(Mbytes)100
CurrentLE25
AllocatedPE50
UsedPV2
厖
---Physicalvolumes---
PVName/dev/dsk/c4t0d0
PVName/dev/dsk/c6t0d0AlternateLink
PVStatusavailable
TotalPE12992
FreePE0
AutoswitchOff
检查各项status值为available/sync,不是stale
(8).系统运行状态—top
观察CPU和内存使用情况
CPULOADUSERNICESYSIDLEBLOCKSWAITINTRSSYS
00.2820.2%0.0%2.6%77.2%0.0%0.0%0.0%0.0%
10.1714.6%0.0%3.4%82.0%0.0%0.0%0.0%0.0%
20.3318.6%0.0%3.0%78.4%0.0%0.0%0.0%0.0%
30.2013.0%0.0%4.2%82.8%0.0%0.0%0.0%0.0%
40.1114.4%0.0%2.0%83.6%0.0%0.0%0.0%0.0%
50.4419.8%0.0%4.2%76.0%0.0%0.0%0.0%0.0%
60.2813.2%0.0%11.2%75.6%0.0%0.0%0.0%0.0%
70.1714.8%0.0%1.8%83.4%0.0%0.0%0.0%0.0%
-----------------------------------------------
avg0.250.0%0.0%0.0%100.0%0.0%0.0%0.0%0.0%
Memory:
1106604K(999800K)real,1527608K(1362680K)virtual,1987924KfreePage#1/6
CPUTTYPIDUSERNAMEPRINISIZERESSTATETIME%WCPU%CPUCOMMAND
2?
18777informix156207404K5052Ksleep9233:
0230.4930.43oninit
6?
19002tellin1542029248K22572Ksleep5256:
0317.0517.02manager
1?
18779informix156207404K4784Ksleep1681:
279.629.60oninit
重点检查有无占用CPU过大的进程,并检查freememory是否足够
(9).系统运行状态--sar–u
观察CPU使用情况:
sar–u–M310
10:
02:
18cpu%usr%sys%wio%idle
10:
02:
210372160
1185175
21510272
394285
4213175
5232470
6104383
7155179
system195275
检查%idle是否足够(一般不小于25%)
(10).系统运行状态--sar–v
观察文件线程资源使用情况:
sar–v310
HP-UXbjscp1aB.11.00U9000/80007/07/03
10:
02:
48text-szovproc-szovinod-szovfile-szov
10:
02:
51N/AN/A189/66402119/736001127/120180
10:
02:
54N/AN/A188/66402102/736001121/120180
10:
02:
57N/AN/A187/66402067/736001114/120180
10:
03:
00N/AN/A187/66402037/736001108/120180
10:
03:
03N/AN/A187/66402033/736001108/120180
10:
03:
06N/AN/A187/66402036/736001108/120180
10:
03:
09N/AN/A187/66402033/736001108/120180
10:
03:
12N/AN/A188/66402032/736001113/120180
10:
03:
15N/AN/A187/66402032/736001108/120180
10:
03:
18N/AN/A187/66402032/736001108/120180
重点检查有无即将达到上限的值
(11).系统运行状态--sar–d
观察IO使用情况:
sar–d310
HP-UXbjscp1aB.11.00U9000/80007/07/03
10:
03:
18device%busyavquer+w/sblks/savwaitavserv
10:
03:
21c1t6d04.330.507495.975.57
c2t6d03.670.506435.864.78
c4t0d01.000.5010515.112.94
c4t0d11.670.5011534.493.27
c4t0d21.670.5010525.162.63
c4t0d31.670.5016755.012.97
重点检查有无%busy过大的设备
(12).系统运行状态—Swapinfo
观察交换区使用情况:
MbMbMbPCTSTART/Mb
TYPEAVAILUSEDFREEUSEDLIMITRESERVEPRINAME
dev3072030720%0-1/dev/vg00/lvol2
dev3000030000%0-0/dev/vg00/lv_swap
reserve-2161-2161
total60722161391136%-0-
通常swap区的使用率为0,如有0以上数值,需进行进一步检查
(13).系统运行状态--netstat–in
观察网络连接情况,检查有无网络连接中断,执行netstat-in
NameMtuNetworkAddressIpktsOpkts
lan1*1500192.9.200.0192.9.200.100
lan0150015.79.48.015.79.48.170745893334436
lo04136127.0.0.0127.0.0.12654026540
如在网卡后带*号则表示网络不通
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- hpux 日常 维护 手册