IBM小型机维护指导V100326B.docx
- 文档编号:9738266
- 上传时间:2023-02-06
- 格式:DOCX
- 页数:22
- 大小:64.61KB
IBM小型机维护指导V100326B.docx
《IBM小型机维护指导V100326B.docx》由会员分享,可在线阅读,更多相关《IBM小型机维护指导V100326B.docx(22页珍藏版)》请在冰豆网上搜索。
IBM小型机维护指导V100326B
资料编码
产品名称
IBM小型机
使用对象
产品线
产品版本
编写部门
集成产品部
资料版本
V1.0
IBMAIX系统管理日常工作
拟制:
日期:
审核:
日期:
审核:
日期:
批准:
日期:
华为技术有限公司
版权所有XX
修订记录
日期
修订版本
描述
作者
2005-3-28
V1.0
HACMP管理整合到该文档中
李静
目录
第1章IBMAIX系统管理日常工作(检查篇)2
1.1常用的命令2
1.2语法介绍2
1.2.1vmstat:
检查内存、CPU、进程状态2
1.2.2sar:
检查CPU、IO3
1.2.3PS:
检查进程状态命令4
1.2.4svmon:
显示进程占用内存4
1.2.5iostat:
显示磁盘IO5
1.2.6netstat,entstat:
显示网卡信息5
1.2.7no:
显示tcpip参数设置6
1.2.8其它命令6
第2章IBMAIX系统管理日常工作(LV篇)7
2.1IBMAIX系统管理的日常工作7
2.1.1开关机步骤7
2.1.2用户组及用户管理7
2.1.3文件系统维护7
2.1.4系统日常管理7
2.1.5系统备份7
2.1.6定时清洗磁带机8
2.1.7定时检查设备指示灯状态8
2.1.8简单故障的判断8
2.1.9熟悉ibmaix操作系统8
2.2关于IBMAIX的逻辑卷管理8
2.3LVM命令9
第3章IBMAIX(关键参数检查篇)11
3.1AIO参数检查11
3.2磁盘阵列queue_depth参数检查11
3.3用户参数检查12
3.4激活SSAFast-WriteCache12
3.5IO参数设置12
3.6syncddaemon的数据刷新频率13
3.7检查系统硬盘的镜像13
第4章IBMAIX系统管理日常工作(性能分析篇)14
4.1性能瓶颈定义14
4.2性能范围14
第5章IBMAIX系统管理日常工作(SHUTDOWN篇)15
5.1概念15
5.2关机命令15
第6章IBMAIX系统管理日常工作(备份与恢复篇)15
6.1用SMIT备份15
6.2手工备份15
6.3恢复系统16
第7章HACMP的双机系统的管理和维护16
7.1HACMP双机系统的启动16
7.2HACMP双机系统的关闭16
7.3察看双机系统的当前状态17
7.4HACMP环境下的排错18
7.4.1了解问题的存在18
7.4.2判断问题的出处19
关键词:
AIX系统管理IBM
摘要:
缩略语清单:
参考资料清单:
第1章AIX系统管理日常工作(检查篇)
1.1常用的命令
CPU
Memory
Disk
Network
标准UNIX命令(包括HP、SUN等)
vmstat,sar,ps
vmstat,ps
iostat,sar,vmstat,
netstat,nfsstat
AIX详细输出
tprof
svmon,rmss
filemon,fileplace
entstat
AIX非常详细输出
syscalls,trace,emstat
trace
trace
trace,iptrace
分析工具
topas
topas
topas
topas
1.2语法介绍
1.2.1vmstat:
检查内存、CPU、进程状态
#vmstat115
kthrmemorypagefaultscpu
---------------------------------------------------------------
rbavmfrerepipofrsrcyinsycsussyidwa
10281328127700000013237567651340
20281328127700000012733813199000
20281328127700000013231613199000
20281328127700000012031712699000
20281328127700000014631612799000
20281328127700000013031712599000
20281328127700000013531612799000
20281328127700000012931712499000
20281328127700000013330412799000
r:
正在运行的进程
b:
被阻挡的进程
avm:
活动的虚内存,单位4kb
fre:
自由列表,位4kb
po:
页换出
pi:
页换入
sy:
系统占用CPU
id:
空闲CPU
wa:
等待的CPU
1.2.2sar:
检查CPU、IO
例如:
sar-u130
sar-PALL110
语法:
sar-[abckmqruvwyA]intevalrepetition
-bbuffer活动
-c系统调用
-k内核进程统计.
-m消息及信号量活动
-q正在运行的队列数及等待队列数
-r页交换统计
-uCPU利用
-PCPU负载.
1.2.3PS:
检查进程状态命令
ps:
显示当前SHELL重所有进程
ps-ef:
显示系统中所有进程,-f显示更详细信息
ps-uoracle:
显示oracle用户进程
ps–emoTHREAD:
显示线程信息
psau;psvg:
按使用时间显示进程(最近一次调用)
psaux:
按使用时间显示进程(进程启动)
1.2.4svmon:
显示进程占用内存
svmon–G:
显示系统占用内存
svmon-Ccommand_name:
显示某个用户进程占用内存
svmon-Ppid
显示某个进程占用内存
svmon–S:
显示段占用内存
1.2.5iostat:
显示磁盘IO
tty:
tintoutavg-cpu:
%user%sys%idle%iowait
0.04.00.91.395.42.5
Disks:
%tm_actKbpstpsKb_readKb_wrtn
hdisk058.4218.341.2172920
hdisk116.885.621.44280
hdisk250.6223.955.6110020
hdisk316.885.621.44280
hdisk40.00.00.000
hdisk543.4279.169.813960
hdisk60.00.00.000
hdisk716.427.220.20136
hdisk80.00.00.000
hdisk99.4156.011.40780
hdisk1016.427.220.20136
cd00.00.00.000
1.2.6netstat,entstat:
显示网卡信息
netstaten0:
显示en0信息
netstat–s:
显示网络信息
netstat-m
显示网络buffers.
netstat-i
显示网卡状态
netstat-Ien01
显示eno网卡塞(1秒间隔)
1.2.7no:
显示tcpip参数设置
no–a:
显示tcpip所有参数当前设置
no-otcp_keepalivetime=7200000
设置tcp_keepalivetime等于3600000秒
no-d恢复默认值
注:
该方法在重启后失效
1.2.8其它命令
检查文件系统
df-k
检查设备
lsdev-C
检查物理卷
lspv
检查交换区
lsps-a
检查配置
lscfg-vp
检查软件
lslpp-l
检查用户
who
第2章AIX系统管理日常工作(LV篇)
2.1IBMAIX系统管理的日常工作
系统管理员对小型机系统的正确管理是系统稳定运行的保障,作为系统管理员应注意以下几个方面:
2.1.1开关机步骤
2.1.2用户组及用户管理
2.1.3文件系统维护
发现文件系统已满,应及时删除无用文件或扩大文件系统。
2.1.4系统日常管理
系统管理员最好用smit来进行系统管理。
Smit是以菜单方式工作的工具包,它包括了日常管理工作的所有命令,操作简便。
2.1.5系统备份
备份是保护用户数据不丢失的重要手段。
一般系统备份的要求如下:
A.每一台机器的操作系统至少有一个全备份。
B.每天备份用户数据。
C.操作系统配置修改后重新备份操作系统。
2.1.6定时清洗磁带机
2.1.7定时检查设备指示灯状态
2.1.8简单故障的判断
2.1.9熟悉ibmaix操作系统
2.2关于IBMAIX的逻辑卷管理
IBMAIX存储管理的五个基本概念:
物理卷PhysicalVolume,称为PV:
指物理上硬盘,一个硬盘就是一个PV,名字为HDISK0、HDISK1。
物理分区(PhysicalPartitions):
物理卷被划分成大小一样的物理分区PPs
逻辑卷组LogicalVolumeGroup,称为VG:
一个VG包含整数个PV,可理解为一个大硬盘。
逻辑卷LogicalVolume,称为LV:
相当于对大硬盘进行逻辑分区,一个VG里可有若干个LV,对用户讲,LV上的数据是连续的,但PV上的数据可能是分散的。
逻辑分区(LogicalPartitions):
每个LV有若干逻辑分区(LPs)组成,每个逻辑分区至少有一个PV组成。
文件系统FileSystem:
在逻辑卷的基础上,可建立文件系统JFS,然后MOUNT到一个目录下,这样就可以文件存取的方式来使用这块硬盘了。
当然,您也可以不建文件系统,而直接把LV当作裸设备,以TRUNK方式来存取数据,许多数据库都是用这种方式存取数据。
LVM的关系如下图:
2.3LVM命令
一般采用smit命令可对PV、VG、LV、JFS等进行图形化管理,命令如下:
smitlvm
屏幕显示如下:
AddaLogicalVolume
LogicalvolumeNAME[scratch]
*VOLUMEGROUPnametestvg
*NumberofLOGICALPARTITIONS[64]#
PHYSICALVOLUMEnames[hdisk1hdisk2hdisk3]+
LogicalvolumeTYPE[jfs]
POSITIONonphysicalvolumemiddle+
RANGEofphysicalvolumesminimum+
MAXIMUMNUMBERofPHYSICALVOLUMES[]#
touseforallocation
NumberofCOPIESofeachlogical2+
partition
MirrorWriteConsistency?
yes+
Allocateeachlogicalpartitioncopyyes+
onaSEPARATEphysicalvolume?
RELOCATEthelogicalvolumeduringyes+
reorganization?
LogicalvolumeLABEL[]
MAXIMUMNUMBERofLOGICALPARTITIONS[512]#
EnableBADBLOCKrelocation?
yes+
SCHEDULINGPOLICYforreading/writingparallel+
logicalpartitioncopies
EnableWRITEVERIFY?
no+
FilecontainingALLOCATIONMAP[]
StripeSize?
[64K]
行命令:
.lsvg:
查看vg名字
查看vg详细信息:
lsvg
查看vg内的LVs:
lsvg-l
查看vg内的PV:
lsvg-p
查看激活的VG:
lsvg–o
.lspv:
查看物理卷组pg名字
查看PV详细信息:
lspvhdiskN
查看PV内的LVslspv-lhdiskN
查看PV内的PP:
lspv-phdiskN
.lslv:
查看LV的信息
查看LV名字:
lsvg-l
查看LV详细信息:
lslv
查看PV内的LVs:
lslv-l
查看PV内的PP:
lslv-p
查看镜像的LV:
lslv-m
第3章AIX系统管理日常工作(关键参数检查篇)
3.1AIO参数检查
#lsattr-Elaio0
minserversXMINIMUMnumberofserversTrue
maxservers80MAXIMUMnumberofserversTrue
maxreqs4096MaximumnumberofREQUESTSTrue
kprocprio39ServerPRIORITYTrue
autoconfigavailableSTATEtobeconfiguredatsystemrestartTrue
fastpathenableStateoffastpathTrue
●MaxServers=10*numberofdisks
●MinServers=MaxServers/2
其中MaxServers最大为80
可用命令#smittyaioChange/ShowCharacteristicsofAsynchronousI/O
修改相应的值。
3.2磁盘阵列queue_depth参数检查
假设DATAVG的RAID盘为hdisk2
#lsattr-Elhdisk2
pvid00019081a0dc91ea0000000000000000PhysicalvolumeidentifierFal
queue_depth8QueuedepthTrue
queue_depth值设置为7133硬盘个数
可用命令#chdev–lhdisk2–aqueue_depth=x修改,但VG必须为VARYOFF状态。
3.3用户参数检查
#smittychlicense
修改MaximumnumberofFIXEDlicenses为10
#lsattr-Elsys0|grepmaxuproc
maxuproc200MaximumnumberofPROCESSESallowedperuserTrue
用#smittychgsys修改
利用lsattr-Elsys0检查maxuproc,minpout,maxpout等参数的大小。
maxuproc为每个用户的最大进程数,当应用涉及大量的顺序读写而影响前台程序响应时间时,可考虑将maxpout设为33,minpout设为16,利用smittychgsys来设置。
3.4激活SSAFast-WriteCache
利用smittyssafastw来激活每一个逻辑盘hdiskn的Fast-WriteCache:
选择硬盘后,把EnableFast-Write一项改为Yes后回车即可。
对于OPS必须关闭,对于GAILOVER或单机必须打开。
3.5IO参数设置
HighwatermarkforpendingwriteI/Osperfile(maxpout)和LowwatermarkforpendingwriteI/Osperfile
它们缺省值为0,在双机环境中一般应设Highwatermark为33,Lowwatermark为24,这两个参数可用smittychgsys来设置。
3.6syncddaemon的数据刷新频率
该值表示刷新内存数据到硬盘的频率,缺省为60,一般可改为20,也可根据实际情况更改。
该参数通过vi/sbin/rc.boot更改,其中一行如下:
nohup/usr/sbin/syncd60>/dev/null2>&1&
改为:
nohup/usr/sbin/syncd20>/dev/null2>&1&
3.7检查系统硬盘的镜像
#lsvg–lrootvg
rootvg:
LVNAMETYPELPsPPsPVsLVSTATEMOUNTPOINT
hd5boot122closed/syncdN/A
hd6paging48962open/syncdN/A
paging00paging32642open/syncdN/A
hd8jfslog122open/syncdN/A
hd4jfs122open/syncd/
hd2jfs32642open/syncd/usr
hd9varjfs5102open/syncd/var
hd3jfs482open/syncd/tmp
hd1jfs122open/syncd/home
注意:
PPs为LPs的两倍,PVs为2
如果系统盘未镜像,而系统盘为18G盘,用命令镜像
#mirrorvgrootvghdisk0hdisk1
(对rootvg进行镜像)
#bosboot–a
(在两块盘上重建bootimage)
#bootlist–mnormalhdisk0hdisk1
(设置机器的启动顺序)
第4章AIX系统管理日常工作(性能分析篇)
4.1性能瓶颈定义
项目检查命令判断标准
CPUvmstat%user+%sysgreater大于75%
DiskI/Ovmstat%iowait大于30%(AIX4.3.3orlater)
应用程序磁盘iostat%tm_act大于60%
交换区lsps-a大于60%
页交换数量iostatvmstat大于10×CPU数量
4.2性能范围
好坏极差
CPU60%75%90%+
Disk<30%<40%<50%+
Memory010pages/秒CPU>50
第5章AIX系统管理日常工作(SHUTDOWN篇)
5.1概念
IBMAIX的启动分为多用户(normal)和单用户(service)模式,在正常情况下,一般选择多用户模式。
5.2关机命令
快速关机,不警告用户
shutdown-F;halt
快速关机并重启
shutdown–Fr;reboot
警告一分钟后关机并重启
shutdown-r
发送关机命令,但不关机
shutdown-k
关机并警告用户推出
Shutdownnow
关机到单用户模式
Shutdown-m;inits;telinits
第6章AIX系统管理日常工作(备份与恢复篇)
6.1用SMIT备份
#smittymksysb进行系统备份
当COMMANDSTATUS页面中Command:
OK出现后,表示备份成功。
取出制作完毕的磁带,在磁带上的标签上注明备份机器的名称和序列号
6.2手工备份
#mksysb–i/dev/rmt0
6.3恢复系统
#bootinfo–e
检查系统所带的磁带机是否能启动系统,如果返回值是1,表示该磁带机支持启动系统,如果返回值是0,就是不支持。
插入备份带,检查设备启动顺序:
#bootlist-mservice-o
如果需要,将启动顺序改为从磁带启动:
#bootlist-mservicermt0
重启机器,系统从磁带读数据,根据提示恢复系统。
第7章HACMP的双机系统的管理和维护
7.1HACMP双机系统的启动
要启动HACMP双机系统必须要有root用户的特权分别进入到系统各节点主机在命令行上执行下述命令即可。
#smitclstart或
#/usr/sbin/cluster/etc/rc.cluster-boot-N-i
注:
在双机系统中HACMP双机软件先启动的节点将成为主节点拥有资源,后启动的节点将成为备用节点。
7.2HACMP双机系统的关闭
要关闭某节点上的HACMP双机软件必须要有该节点root用户的特权,以root用户进入到该节点主机在命令行上执行下述命令即可。
#smitclstop
或
#clstop-gr
说明:
若该节点是主节点并且备节点上的HACMP软件亦正常运行,则clstop关闭模式的三种选项行为不同。
。
forced:
是指立即关闭双机软件不调用任何客户应用的善后处理例程。
。
graceful是指在关闭双机软件时将调用客户应用预定义的善后处理例程。
。
takeover是指该节点将关闭双机软件并释放资源请求备节点进行接管。
检查HACMP双机软件在该节点是否已启,动命令如下:
#lssrc-gcluster
若是系统显示出下面类似的信息则说明HACMP双机软件已正常启动.
SubsystemGroupPIDStatus
Clstrmgrcluster22500active
Clsmuxpdcluster23674active
Clinfo
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- IBM 小型机 维护 指导 V100326B