巧用SAR命令维护linux系统.docx
- 文档编号:11457273
- 上传时间:2023-03-01
- 格式:DOCX
- 页数:11
- 大小:24.46KB
巧用SAR命令维护linux系统.docx
《巧用SAR命令维护linux系统.docx》由会员分享,可在线阅读,更多相关《巧用SAR命令维护linux系统.docx(11页珍藏版)》请在冰豆网上搜索。
巧用SAR命令维护linux系统
在使用UNIX操作系统的过程中,我们常常会用到各种各样的问题,比如系统运
行速度突然变慢,系统容易死机或者主机所带的终端常出现死机,这时我们常常猜测,是硬盘空间太小,还是内存不足?
I/O出现瓶颈,或者是系统的核心参数出
了问题?
这时,我们应该考虑使用系统给我们提供的sar命令来对系统作一个了解,该命令是系统维护的重要工具,主要帮助我们掌握系统资源的使用情况,特别
是内存和CPU的使用情况,是UNIX系统使用者应该掌握的工具之一。
sar命令行的常用格式:
sar[options][-A][-ofile]t[n]
在命令行中,n和t两个参数组合起来定义采样间隔和次数,t为采样间隔,是必须有
的参数,n为采样次数,是可选的,默认值是1,-ofile表示将命令结果以二进制格式
存放在文件中,file在此处不是关键字,是文件名。
options为命令行选项,sar命令
的选项很多,下面只列出常用选项:
-A:
所有报告的总和。
-u:
CPU利用率
-v:
进程、I节点、文件和锁表状态。
-d:
硬盘
使用报告。
-r:
没有使用的
内存
页面和硬盘块。
-g:
串口I/O的情况。
-b:
缓冲区使用情况。
-a:
文件读写情况。
-c:
系统调用情况。
-R:
进程的活动情况。
-y:
终端设备活动情况。
-w:
系统交换活动。
下面将举例说明。
例一:
使用命令行sar-utn
例如,每60秒采样一次,连续采样5次,观察CPU的使用情况,并将采样结果以二进制
形式存入当前目录下的文件zhou中,需键入如下命令:
#sar-u-ozhou605
屏幕显示:
SCO_SV scosysv 3.2v5.0.5 i80386 10/01/2001
14:
43:
50 %usr %sys %wio %idle(-u)
14:
44:
50 0 1 4 94
14:
45:
50 0 2 4 93
14:
46:
50 0 2 2 96
14:
47:
50 0 2 5 93
14:
48:
50 0 2 2 96
Average 0 2 4 94
在显示内容包括:
%usr:
CPU处在用户模式下的时间百分比。
%sys:
CPU处在系统模式下的时间百分比。
%wio:
CPU等待输入输出完成时间的百分比。
%idle:
CPU空闲时间百分比。
在所有的显示中,我们应主要注意%wio和%idle,%wio的值过高,表示硬盘存在I/O瓶颈,
%idle值高,表示CPU较空闲,如果%idle值高但系统响应慢时,有可能是CPU等待分配内存,
此时应加大内存容量。
%idle值如果持续低于10,那么系统的CPU处理能力相对较低,表
明系统中最需要解决的资源是CPU。
如果要查看二进制文件zhou中的内容,则需键入如下sar命令:
#sar-u-fzhou
可见,sar命令即可以实时采样,又可以对以往的采样结果进行查询。
例二:
使用命行sar-vtn
例如,每30秒采样一次,连续采样5次,观察核心表的状态,需键入如下命令:
#sar-v305
屏幕显示:
SCO_SVscosysv3.2v5.0.5i8038610/01/2001
10:
33:
23proc-szovinod-szovfile-szovlock-sz (-v)
10:
33:
53 305/ 321 0 1337/2764 0 1561/1706 0 40/ 128
10:
34:
23 308/ 321 0 1340/2764 0 1587/1706 0 37/ 128
10:
34:
53 305/ 321 0 1332/2764 0 1565/1706 0 36/ 128
10:
35:
23 308/ 321 0 1338/2764 0 1592/1706 0 37/ 128
10:
35:
53 308/ 321 0 1335/2764 0 1591/1706 0 37/ 128
显示内容包括:
proc-sz:
目前核心中正在使用或分配的进程表的表项数,由核心参数MAX-PROC控制。
inod-sz:
目前核心中正在使用或分配的i节点表的表项数,由核心参数
MAX-INODE控制。
file-sz:
目前核心中正在使用或分配的文件表的表项数,由核心参数MAX-FILE控
制。
ov:
溢出出现的次数。
Lock-sz:
目前核心中正在使用或分配的记录加锁的表项数,由核心参数MAX-FLCKRE
控制。
显示格式为
实际使用表项/可以使用的表项数
显示内容表示,核心使用完全正常,三个表没有出现溢出现象,核心参数不需调整,如
果出现溢出时,要调整相应的核心参数,将对应的表项数加大。
例三:
使用命行sar-dtn
例如,每30秒采样一次,连续采样5次,报告设备使用情况,需键入如下命令:
#sar-d305
屏幕显示:
SCO_SVscosysv3.2v5.0.5i8038610/01/2001
11:
06:
43device %busy avque r+w/s blks/s avwaitavserv(-d)
11:
07:
13wd-0 1.47 2.75 4.67 14.73 5.503.14
11:
07:
43wd-0 0.43 18.77 3.07 8.66 25.111.41
11:
08:
13wd-0 0.77 2.78 2.77 7.26 4.942.77
11:
08:
43wd-0 1.10 11.18 4.10 11.26 27.322.68
11:
09:
13wd-0 1.97 21.78 5.86 34.06 69.663.35
Averagewd-0 1.15 12.11 4.09 15.19 31.122.80
显示内容包括:
device:
sar命令正在监视的块设备的名字。
%busy:
设备忙时,传送请求所占时间的百分比。
avque:
队列站满时,未完成请求数量的平均值。
r+w/s:
每秒传送到设备或从设备传出的数据量。
blks/s:
每秒传送的块数,每块512字节。
avwait:
队列占满时传送请求等待队列空闲的平均时间。
avserv:
完成传送请求所需平均时间(毫秒)。
在显示的内容中,wd-0是硬盘的名字,%busy的值比较小,说明用于处理传送请求的有
效时间太少,文件系统效率不高,一般来讲,%busy值高些,avque值低些,文件系统
的效率比较高,如果%busy和avque值相对比较高,说明硬盘传输速度太慢,需调整。
例四:
使用命行sar-btn
例如,每30秒采样一次,连续采样5次,报告缓冲区的使用情况,需键入如下命令:
#sar-b305
屏幕显示:
SCO_SVscosysv3.2v5.0.5i8038610/01/2001
14:
54:
59bread/slread/s%rcachebwrit/slwrit/s%wcachepread/spwrit/s(-b)
14:
55:
29 0 147 100 5 21 78 0 0
14:
55:
59 0 186 100 5 25 79 0 0
14:
56:
29 4 232 98 8 58 86 0 0
14:
56:
59 0 125 100 5 23 76 0 0
14:
57:
29 0 89 100 4 12 66 0 0
Average 1 156 99 5 28 80 0 0
显示内容包括:
bread/s:
每秒从硬盘读入系统缓冲区buffer的物理块数。
lread/s:
平均每秒从系统buffer读出的逻辑块数。
%rcache:
在buffercache中进行逻辑读的百分比。
bwrit/s:
平均每秒从系统buffer向磁盘所写的物理块数。
lwrit/s:
平均每秒写到系统buffer逻辑块数。
%wcache:
在buffercache中进行逻辑读的百分比。
pread/s:
平均每秒请求物理读的次数。
pwrit/s:
平均每秒请求物理写的次数。
在显示的内容中,最重要的是%cache和%wcache两列,它们的值体现着buffer的使用效
率,%rcache的值小于90或者%wcache的值低于65,应适当增加系统buffer的数量,buffer
数量由核心参数NBUF控制,使%rcache达到90左右,%wcache达到80左右。
但buffer参数
值的多少影响I/O效率,增加buffer,应在较大内存的情况下,否则系统效率反而得不到
提高。
例五:
使用命行sar-gtn
例如,每30秒采样一次,连续采样5次,报告串口I/O的操作情况,需键入如下命令:
#sar-g305
屏幕显示:
SCO_SVscosysv3.2v5.0.5i80386 11/22/2001
17:
07:
03 ovsiohw/s ovsiodma/s ovclist/s(-g)
17:
07:
33 0.00 0.00 0.00
17:
08:
03 0.00 0.00 0.00
17:
08:
33 0.00 0.00 0.00
17:
09:
03 0.00 0.00 0.00
17:
09:
33 0.00 0.00 0.00
Average 0.00 0.00 0.00
显示内容包括:
ovsiohw/s:
每秒在串口I/O硬件出现的溢出。
ovsiodma/s:
每秒在串口I/O的直接输入输出通道高速缓存出现的溢出。
ovclist/s:
每秒字符队列出现的溢出。
在显示的内容中,每一列的值都是零,表明在采样时间内,系统中没有发生串口I/O溢
出现象。
sar命令的用法很多,有时判断一个问题,需要几个sar命令结合起来使用,比如,怀疑
CPU存在瓶颈,可用sar-u和sar-q来看,怀疑I/O存在瓶颈,可用sar-b、sar-u和
sar-d来看
Sar
-A所有的报告总和
-a文件读,写报告
-B报告附加的buffercache使用情况
-bbuffercache使用情况
-c系统调用使用报告
-d硬盘使用报告
-g有关串口I/O情况
-h关于buffer使用统计数字
-mIPC消息和信号灯活动
-n命名cache
-p调页活动
-q运行队列和交换队列的平均长度
-R报告进程的活动
-r没有使用的内存页面和硬盘块
-uCPU利用率
-v进程,i节点,文件和锁表状态
-w系统交换活动
-yTTY设备活动
-a报告文件读,写报告
sar–a55
SCO_SVscosvr3.2v5.0.5PentII(D)ISA06/07/2002
11:
45:
40iget/snamei/sdirbk/s(-a)
11:
45:
45622
11:
45:
50912028
11:
45:
551592018
11:
46:
001572119
11:
46:
051773035
Average1181820
iget/s每秒由i节点项定位的文件数量
namei/s每秒文件系统路径查询的数量
dirbk/s每秒所读目录块的数量
*这些值越大,表明核心花在存取用户文件上的时间越多,它反映着一些程序和应用文件系统产生的负荷。
一般地,如果iget/s与namei/s的比
值大于5,并且namei/s的值大于30,则说明文件系统是低效的。
这时需要检查文件系统的自由空间,看看是否自由空间过少。
-b报告缓冲区(buffercache)的使用情况
sar-b23
SCO_SVscosvr3.2v5.0.5PentII(D)ISA06/07/2002
13:
51:
28bread/slread/s%rcachebwrit/slwrit/s%wcachepread/spwrit/s(-b)
13:
51:
303821380721312735200
13:
51:
32378516276227200
13:
51:
341723234739573200
Average31073958581175000
bread/s平均每秒从硬盘(或其它块设备)读入系统buffer的物理块数
lread/s平均每秒从系统buffer读出的逻辑块数
%rcache在buffercache中进行逻辑读的百分比(即100%-bread/lreads)
bwrit/s平均每秒从系统buffer向磁盘(或其它块设备)所写的物理块数
lwrit/s平均每秒写到系统buffer的逻辑块数
%wcache在buffercache中进行逻辑写的百分比(即100%-bwrit/lwrit).
pread/sgu平均每秒请求进行物理读的次数
pwrit/s平均每秒请求进行物理写的次数
*所显示的内容反映了目前与系统buffer有关的读,写活。
在所报告的数字中,最重要的是%rcache和%wcache(统称为cache命中率)两列,它们具体体现着系统buffer的效率。
衡量cache效率的标准是它的命中率值的大小。
*如果%rcache的值小于90或者%wcache的值低于65,可能就需要增加系统buffer的数量。
如果在系统的应用中,系统的I/O活动十分频
繁,并且在内存容量配置比较大时,可以增加buffercache,使%rcache达到95左右,%wcache达到80左右。
*系统buffer
cache中,buffer的数量由核心参数NBUF控制。
它是一个要调的参数。
系统中buffer数量的多少是影响系统I/O效率的瓶颈。
要增加系统
buffer数量,则要求应该有较大的内存配置。
否则一味增加buffer数量,势必减少用户进程在内存中的运行空间,这同样会导致系统效率下降。
-c报告系统调用使用情况
sar-c23
SCO_SVscosvr3.2v5.0.5PentII(D)ISA06/07/2002
17:
02:
42scall/ssread/sswrit/sfork/sexec/srchar/swchar/s(-c)
17:
02:
4422621691410.000.0013125022159
17:
02:
46141661380.000.004372796464
17:
02:
48182543250.000.0010939742331
Average183491680.000.0022597523651
scall/s每秒使用系统调用的总数。
一般地,当4~6个用户在系统上工作时,每秒大约30个左右。
sread/s每秒进行读操作的系统调用数量。
swrit/s每秒进行写操作的系统调用数量。
fork/s每秒fork系统调用次数。
当4~6个用户在系统上工作时,每秒大约0.5秒左右。
exec/s每秒exec系统调用次数。
rchar/s每秒由读操作的系统调用传送的字符(以字节为单位)。
wchar/s每秒由写操作的系统调用传送的字符(以字节为单位)。
*如果scall/s持续地大于300,则表明正在系统中运行的可能是效率很低的应用程序。
在比较
典型的情况下,进行读操作的系统调用加上进行写操作的系统调用之和,约是scall的一半左右。
-d报告硬盘使用情况
sar-d23
SCO_SVscosvr3.2v5.0.5PentII(D)ISA06/07/2002
17:
27:
49device%busyavquer+w/sblks/savwaitavserv(-d)
17:
27:
51ida-06.931.0013.86259.410.005.00
ida-10.991.0017.33290.100.000.57
17:
27:
53ida-075.501.0054.00157.000.0013.98
ida-19.501.0012.0075.000.007.92
17:
27:
55ida-07.461.0046.77213.930.001.60
ida-117.411.0057.71494.530.003.02
Averageida-029.851.0038.14210.280.007.83
ida-19.291.0029.02286.900.003.20
device这是sar命令正在监视的块设备的名字。
%busy设备忙时,运行传送请求所占用的时间。
这个值以百分比表示。
avque在指定的时间周期内,没有完成的请求数量的平均值。
仅在队列被占满时取这个值。
r+w/s每秒传送到设备或者从设备传送出的数据量。
blks/s每秒传送的块数。
每块512个字节。
avwait传送请求等待队列空闲的平均时间(以毫秒为单位)。
仅在队列被占满时取这个值。
avserv完成传送请求所需平均时间(以毫秒为单位)
*ida-0和ida-1是硬盘的设备名字。
在显示的内容中,如果%busy的值比较小,说明用于处理
传送请求的有效时间太少,文件系统的效率不高。
要使文件系统的效率得到优化,应使%busy的数值相对高一些,而avque的值应该低一些。
-g报告有关串口I/O情况
sar-g33
SCO_SVscosvr3.2v5.0.5PentII(D)ISA06/13/2002
11:
10:
09ovsiohw/sovsiodma/sovclist/s(-g)
11:
10:
120.000.000.00
11:
10:
150.000.000.00
11:
10:
180.000.000.00
Average0.000.000.00
ovsiohw/s每秒在串囗I/O硬件出现的溢出。
ovsiodma/s每秒在串囗I/O的直接输入,输出信道高速缓存出现的溢出。
ovclist/s每秒字符队列出现的溢出。
-m报告进程间的通信活动(IPC消息和信号灯活动)情况
sar-m43
SCO_SVscosvr3.2v5.0.5PentII(D)ISA06/13/2002
13:
24:
28msg/ssema/s(-m)
13:
24:
322.249.95
13:
24:
362.2421.70
13:
24:
402.0036.66
Average2.1622.76
msg/s每秒消息操作的次数(包括发送消息的接收信息)。
sema/s每秒信号灯操作次数。
*信号灯和消息作为进程间通信的工具,如果在系统中运行的应用过程中没有使用它们,那么由sar命令报告的msg
和sema的值都将等于0.00。
如果使用了这些工具,并且其中或者msg/s大于100,或者sema/s大于100,则表明这样的应用程序效率比较
低。
原因是在这样的应用程序中,大量的时间花费在进程之间的沟通上,而对保证进程本身有效的运行时间必然产生不良的影响。
-n报告命名缓冲区活动情况
sar-n43
SCO_SVscosvr3.2v5.0.5PentII(D)ISA06/13/2002
13:
37:
31c_hitscmisses(hit%)(-n)
13:
37:
35124671(94%)
13:
37:
39185381(95%)
13:
37:
4396956(94%)
Average135669(95%)
c_hitscache命中的数量。
cmissescache未命中的数量。
(hit%)命中数量/(命中数理+未命中数量)。
*不难理解,(hit%)值越大越好,如果它低于90%,则应该调整相应的核心参数。
-p报告分页活动
sar-p53
SCO_SVscosvr3.2v5.0.5PentII(D)ISA06/13/2002
13:
45:
26vflt/spflt/spgfil/srclm/s(-p)
13:
45:
3136.2550.200.000.00
13:
45:
3632.1458.480.000.00
13:
45:
4179.8058.400.000.00
Average49.3755.690.000.00
vflt/s每秒进行页面故障地址转换的数量(由于有效的页面当前不在内存中)。
pflt/s每秒来自由于保护错误出现的页面故障数量(由于对页面的非法存,取引起的页面故障)。
pgfil/s每秒通过”页—入”满足vflt/s的数量。
rclm/s每秒由系统恢复的有效页面的数量。
有效页面被增加到自由页面队列上。
*如果vflt/s的值高于100,可能预示着对于页面系统来说,应用程序的效率不高,也可能分页参数需要调整,或者内存配置不太合适。
-q报告进程队列(运行队列和交换队列的平均长度)情况
sar-q23
SCO_SVscosvr3.2v5.0.5PentII(D)ISA06/13/2002
14:
25:
50runq-sz%runoccswpq-sz%swpocc(-q)
14:
25:
524.050
14:
25:
549.0100
14:
25:
569.0100
Average7.3100
runq-sz准备运行的进程运行队列。
%runocc运行队列被占用的时间(百分比)
swpq-sz要被换出的进程交换队列。
%swpocc交换队列被占用的时间(百分
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 巧用 SAR 命令 维护 linux 系统