05 IBM AIX系统管理.docx
- 文档编号:23368919
- 上传时间:2023-05-16
- 格式:DOCX
- 页数:30
- 大小:58KB
05 IBM AIX系统管理.docx
《05 IBM AIX系统管理.docx》由会员分享,可在线阅读,更多相关《05 IBM AIX系统管理.docx(30页珍藏版)》请在冰豆网上搜索。
05IBMAIX系统管理
目录
第1章例行检查1
1.1常用的命令1
1.2语法介绍1
1.3其它命令4
第2章逻辑卷相关工作6
2.1IBMAIX系统管理的日常工作6
2.2关于IBMAIX的逻辑卷管理6
2.2.1LVM命令7
第3章键参数检查9
3.1AIO参数检查9
3.2磁盘阵列queue_depth参数检查9
3.3用户参数检查9
3.4激活SSAFast-WriteCache10
3.5IO参数设置10
3.6syncddaemon的数据刷新频率10
3.7检查系统硬盘的镜像10
第4章性能分析12
4.1性能瓶颈定义12
4.2性能范围12
第5章SHUTDOWN13
5.1概念13
5.2关机命令13
第6章备份与恢复14
6.1用SMIT备份14
6.2手工备份14
第7章错误检测15
7.1故障信息的收集15
7.1.1错误信息检测15
7.1.2控制面板上的LED代码16
7.2其他用于收集系统信息的命令17
7.3硬件故障定位方法19
7.3.1系统的启动顺序20
7.3.2系统不能启动20
7.3.3系统停在551,555或55721
7.3.4CDE图形界面挂死22
7.3.5系统dump22
7.47133-D40SSA磁盘柜的故障定位24
7.5软件故障定位方法24
7.5.1文件系统空间不够24
7.5.2检查文件系统的完整性25
7.5.3查看卷组信息25
7.5.4检查内存交换区25
7.5.5小型机内存泄漏问题25
第1章例行检查
1.1常用的命令
CPU
Memory
Disk
Network
标准UNIX命令(包括HP、SUN等)
vmstat,sar,ps
vmstat,ps
iostat,sar,vmstat,
netstat,nfsstat
AIX详细输出
tprof
svmon,rmss
filemon,fileplace
entstat
AIX非常详细输出
syscalls,trace,emstat
trace
trace
trace,iptrace
分析工具
topas
topas
topas
topas
1.2语法介绍
1.vmstat
vmstat:
检查内存、CPU、进程状态等。
#vmstat115
kthrmemorypagefaultscpu
----------------------------------------------------------------
rbavmfrerepipofrsrcyinsycsussyidwa
10281328127700000013237567651340
20281328127700000012733813199000
20281328127700000013231613199000
20281328127700000012031712699000
20281328127700000014631612799000
20281328127700000013031712599000
20281328127700000013531612799000
20281328127700000012931712499000
20281328127700000013330412799000
r:
正在运行的进程
b:
被阻挡的进程
avm:
活动的虚内存,单位4kb
fre:
自由列表,位4kb
po:
页换出
pi:
页换入
sy:
系统占用CPU
id:
空闲CPU
wa:
等待的CPU
2.sar
sar:
检查CPU、IO
例如:
sar-u130
sar-PALL110
语法:
sar-[abckmqruvwyA]intevalrepetition
-bbuffer活动
-c系统调用
-k内核进程统计.
-m消息及信号量活动
-q正在运行的队列数及等待队列数
-r页交换统计
-uCPU利用
-PCPU负载.
3.ps
PS:
检查进程状态命令
ps:
显示当前SHELL重所有进程
ps-ef:
显示系统中所有进程,-f显示更详细信息
ps-uoracle:
显示oracle用户进程
ps–emoTHREAD:
显示线程信息
psau;psvg:
按使用时间显示进程(最近一次调用)
psaux:
按使用时间显示进程(进程启动)
4.svmon
svmon:
显示进程占用内存
svmon–G:
显示系统占用内存
svmon-Ccommand_name:
显示某个用户进程占用内存
svmon-Ppid
显示某个进程占用内存
svmon–S:
显示段占用内存
5.iostat
iostat:
显示磁盘IO
tty:
tintoutavg-cpu:
%user%sys%idle%iowait
0.04.00.91.395.42.5
Disks:
%tm_actKbpstpsKb_readKb_wrtn
hdisk058.4218.341.2172920
hdisk116.885.621.44280
hdisk250.6223.955.6110020
hdisk316.885.621.44280
hdisk40.00.00.000
hdisk543.4279.169.813960
hdisk60.00.00.000
hdisk716.427.220.20136
hdisk80.00.00.000
hdisk99.4156.011.40780
hdisk1016.427.220.20136
cd00.00.00.000
6.netstat,entstat
netstat,entstat:
显示网卡信息
netstaten0:
显示en0信息
netstat–s:
显示网络信息
netstat-m
显示网络buffers.
netstat-i
显示网卡状态
netstat-Ien01
显示eno网卡塞(1秒间隔)
7.no
no:
显示tcpip参数设置
no–a:
显示tcpip所有参数当前设置
no-otcp_keepalivetime=7200000
设置tcp_keepalivetime等于3600000秒
no-d恢复默认值
注:
该方法在重启后失效
1.3其它命令
检查文件系统
df-k
检查设备
lsdev-C
检查物理卷
lspv
检查交换区
lsps-a
检查配置
lscfg-vp
检查软件
lslpp-l
检查用户
who
第2章逻辑卷相关工作
2.1IBMAIX系统管理的日常工作
系统管理员对小型机系统的正确管理是系统稳定运行的保障,作为系统管理员应注意以下几个方面:
1.开关机步骤
2.用户组及用户管理
3.文件系统维护
发现文件系统已满,应及时删除无用文件或扩大文件系统。
4.系统日常管理
系统管理员最好用smit来进行系统管理。
Smit是以菜单方式工作的工具包,它包括了日常管理工作的所有命令,操作简便。
5.系统备份
备份是保护用户数据不丢失的重要手段。
一般系统备份的要求如下:
A.每一台机器的操作系统至少有一个全备份。
B.每天备份用户数据。
C.操作系统配置修改后重新备份操作系统。
6.定时清洗磁带机
7.定时检查设备指示灯状态
8.简单故障的判断
9.熟悉ibmaix操作系统
2.2关于IBMAIX的逻辑卷管理
IBMAIX存储管理的五个基本概念:
物理卷PhysicalVolume,称为PV:
指物理上硬盘,一个硬盘就是一个PV,名字为HDISK0、HDISK1。
物理分区(PhysicalPartitions):
物理卷被划分成大小一样的物理分区PPs
逻辑卷组LogicalVolumeGroup,称为VG:
一个VG包含整数个PV,可理解为一个大硬盘。
逻辑卷LogicalVolume,称为LV:
相当于对大硬盘进行逻辑分区,一个VG里可有若干个LV,对用户讲,LV上的数据是连续的,但PV上的数据可能是分散的。
逻辑分区(LogicalPartitions):
每个LV有若干逻辑分区(LPs)组成,每个逻辑分区至少有一个PV组成。
文件系统FileSystem:
在逻辑卷的基础上,可建立文件系统JFS,然后MOUNT到一个目录下,这样就可以文件存取的方式来使用这块硬盘了。
当然,您也可以不建文件系统,而直接把LV当作裸设备,以TRUNK方式来存取数据,许多数据库都是用这种方式存取数据。
2.2.1LVM命令
1.smit
一般采用smit命令可对PV、VG、LV、JFS等进行图形化管理,命令如下:
smitlvm
屏幕显示如下:
AddaLogicalVolume
LogicalvolumeNAME[scratch]
*VOLUMEGROUPnametestvg
*NumberofLOGICALPARTITIONS[64]#
PHYSICALVOLUMEnames[hdisk1hdisk2hdisk3]+
LogicalvolumeTYPE[jfs]
POSITIONonphysicalvolumemiddle+
RANGEofphysicalvolumesminimum+
MAXIMUMNUMBERofPHYSICALVOLUMES[]#
touseforallocation
NumberofCOPIESofeachlogical2+
partition
MirrorWriteConsistency?
yes+
Allocateeachlogicalpartitioncopyyes+
onaSEPARATEphysicalvolume?
RELOCATEthelogicalvolumeduringyes+
reorganization?
LogicalvolumeLABEL[]
MAXIMUMNUMBERofLOGICALPARTITIONS[512]#
EnableBADBLOCKrelocation?
yes+
SCHEDULINGPOLICYforreading/writingparallel+
logicalpartitioncopies
EnableWRITEVERIFY?
no+
FilecontainingALLOCATIONMAP[]
StripeSize?
[64K]
2.其他命令
lsvg:
查看vg名字
查看vg详细信息:
lsvg
查看vg内的LVs:
lsvg-l
查看vg内的PV:
lsvg-p
查看激活的VG:
lsvg–o
lspv:
查看物理卷组pg名字
查看PV详细信息:
lspvhdiskN
查看PV内的LVslspv-lhdiskN
查看PV内的PP:
lspv-phdiskN
lslv:
查看LV的信息
查看LV名字:
lsvg-l
查看LV详细信息:
lslv
查看PV内的LVs:
lslv-l
查看PV内的PP:
lslv-p
查看镜像的LV:
lslv-m
第3章键参数检查
3.1AIO参数检查
#lsattr-Elaio0
minserversXMINIMUMnumberofserversTrue
maxservers80MAXIMUMnumberofserversTrue
maxreqs4096MaximumnumberofREQUESTSTrue
kprocprio39ServerPRIORITYTrue
autoconfigavailableSTATEtobeconfiguredatsystemrestartTrue
fastpathenableStateoffastpathTrue
MaxServers=10*numberofdisks
MinServers=MaxServers/2
其中MaxServers最大为80
可用命令#smittyaioChange/ShowCharacteristicsofAsynchronousI/O
修改相应的值。
3.2磁盘阵列queue_depth参数检查
假设DATAVG的RAID盘为hdisk2
#lsattr-Elhdisk2
pvid00019081a0dc91ea0000000000000000PhysicalvolumeidentifierFal
queue_depth8QueuedepthTrue
queue_depth值设置为7133硬盘个数
可用命令#chdev–lhdisk2–aqueue_depth=x修改,但VG必须为VARYOFF状态。
3.3用户参数检查
#smittychlicense
修改MaximumnumberofFIXEDlicenses为10
#lsattr-Elsys0|grepmaxuproc
maxuproc200MaximumnumberofPROCESSESallowedperuserTrue
用#smittychgsys修改
利用lsattr-Elsys0检查maxuproc,minpout,maxpout等参数的大小。
maxuproc为每个用户的最大进程数,当应用涉及大量的顺序读写而影响前台程序响应时间时,可考虑将maxpout设为33,minpout设为16,利用smittychgsys来设置。
3.4激活SSAFast-WriteCache
利用smittyssafastw来激活每一个逻辑盘hdiskn的Fast-WriteCache:
选择硬盘后,把EnableFast-Write一项改为Yes后回车即可。
对于OPS必须关闭,对于GAILOVER或单机必须打开。
3.5IO参数设置
HighwatermarkforpendingwriteI/Osperfile(maxpout)和LowwatermarkforpendingwriteI/Osperfile
它们缺省值为0,在双机环境中一般应设Highwatermark为33,Lowwatermark为24,这两个参数可用smittychgsys来设置。
3.6syncddaemon的数据刷新频率
该值表示刷新内存数据到硬盘的频率,缺省为60,一般可改为20,也可根据实际情况更改。
该参数通过vi/sbin/rc.boot更改,其中一行如下:
nohup/usr/sbin/syncd60>/dev/null2>&1&
改为:
nohup/usr/sbin/syncd20>/dev/null2>&1&
3.7检查系统硬盘的镜像
#lsvg–lrootvg
rootvg:
LVNAMETYPELPsPPsPVsLVSTATEMOUNTPOINT
hd5boot122closed/syncdN/A
hd6paging48962open/syncdN/A
paging00paging32642open/syncdN/A
hd8jfslog122open/syncdN/A
hd4jfs122open/syncd/
hd2jfs32642open/syncd/usr
hd9varjfs5102open/syncd/var
hd3jfs482open/syncd/tmp
hd1jfs122open/syncd/home
注意:
PPs为LPs的两倍,PVs为2
如果系统盘未镜像,而系统盘为18G盘,用命令镜像
#mirrorvgrootvghdisk0hdisk1
(对rootvg进行镜像)
#bosboot–a
在两块盘上重建bootimage
#bootlist–mnormalhdisk0hdisk1
设置机器的启动顺序
第4章性能分析
4.1性能瓶颈定义
项目
检查命令
判断标准
CPU
vmstat
%user+%sysgreater大于75%
DiskI/O
vmstat
%iowait大于30%(AIX4.3.3orlater)
应用程序磁盘
iostat
%tm_act大于60%
交换区
lsps–a
大于60%
页交换数量
iostatvmstat
大于10×CPU数量
4.2性能范围
好
坏
极差
CPU
60%
75%
90%+
Disk
<30%
<40%
<50%+
Memory
0
10
pages/秒CPU>50
第5章SHUTDOWN
5.1概念
IBMAIX的启动分为多用户(normal)和单用户(service)模式,在正常情况下,一般选择多用户模式。
5.2关机命令
快速关机,不警告用户
shutdown-F;halt
快速关机并重启
shutdown–Fr;reboot
警告一分钟后关机并重启
shutdown-r
发送关机命令,但不关机
shutdown-k
关机并警告用户推出
Shutdownnow
关机到单用户模式
Shutdown-m;inits;telinits
第6章备份与恢复
6.1用SMIT备份
#smittymksysb进行系统备份
当COMMANDSTATUS页面中Command:
OK出现后,表示备份成功。
取出制作完毕的磁带,在磁带上的标签上注明备份机器的名称和序列号。
6.2手工备份
#mksysb/dev/rmt0
第7章错误检测
7.1故障信息的收集
7.1.1错误信息检测
errdemon进程在系统启动时自动运行,记录包括硬件、软件及其他操作信息故障记录文件为/var/adm/ras/errlog。
使用errpt命令,列出简短出错信息:
#errpt|more
ERROR_IDTIMESTAMPTCRESOURCE_NAMEERROR_DESCRIPTION
192AC0710723100300T0errdemonErrorloggingturnedoff
0E017ED10720131000PHmem2Memoryfailure
9DBCFDEE0701000000T0errdemonErrorloggingturnedon
038F25800624131000UHscdisk0UNDETERMINEDERROR
AA8AB2410405130900TOOPERATOROPERATORNOTIFICATION
TIMESTAMP:
MMDDHHMMYY(月日时分年)
T(类型):
P永久;T临时;U未知(永久性的错误应引起重视)
C(分类):
H硬件;S软件;O用户;U未知
#errpt-dH列出所有硬件出错信息
#errpt-dS列出所有软件出错信息
#errpt-ajERROR_ID列出详细出错信息
#errpt-aj0502f666<---ERROR_ID用大小写均可
例:
LABEL:
SCSI_ERR1
ID:
0502F666
Date/Time:
Jun1922:
29:
51
SequenceNumber:
95
MachineID:
123456789012
NodeID:
host1
Class:
H
Type:
PERM
ResourceName:
scsi0
ResourceClass:
adapter
ResourceType:
hscsi
Location:
00-08
VPD:
<---VirtalProductData
DeviceDriverLevel.........00
DiagnosticLevel............00
DisplayableMessage.........SCSI
ECLevel....................C25928
FRUNumber..................30F8834
Manufacturer................IBM97F
PartNumber.................59F4566
SerialNumber...............00002849
ROSLevelandID............24
Read/WriteRegisterPtr.....0120
Description
ADAPTERERROR
ProbableCauses
ADAPTERHARDWARECABLE
CABLETERMINATORDEVICE
FailureCauses
ADAPTER
CABLELOOSEORDEFECTIVE
RecommendedActions
PERFORMPROBLEMDETERMINATIONPROCEDURES
CHECKCABLEANDITSCONNECTIONS
DetailData
SENSEDATA
000000000000
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 05 IBM AIX系统管理 AIX 系统管理