nmon工具的利用和案例分析.docx
- 文档编号:22807762
- 上传时间:2023-04-28
- 格式:DOCX
- 页数:27
- 大小:1.13MB
nmon工具的利用和案例分析.docx
《nmon工具的利用和案例分析.docx》由会员分享,可在线阅读,更多相关《nmon工具的利用和案例分析.docx(27页珍藏版)》请在冰豆网上搜索。
nmon工具的利用和案例分析
操作系统监控工具
Nmon利用与介绍
起草部门:
第三方性能测试部
管理部门:
第三方性能测试部
撰写人:
审核人:
批准人:
发布日期:
修订页
编号
章节名称
修订内容简述
修订日期
修订前版本号
修订后版本号
修订人
批准人
1.目的
本文介绍操作系统监控工具Nmon的概念、利用方式及利用参数。
指导运维人员通过nmon工具监视AIX/Linux操作系统资源利用情形,搜集监控结果及产生的数据文件,制作相关系统性能分析报告。
2.Nmon简介
Nmon(Nigel’sMonitor)是由IBM提供、免费监控AIX系统与Linux系统资源的工具。
该工具可将效劳器系统资源耗用情形搜集起来并输出一个特定的文件,并可利用excel分析工具(nmonanalyser)进行数据的统计分析。
2.1软件特性
nmon工具能够在一个屏幕上显示所有重要的性能优化信息,并动态地对其进行更新。
那个高效的工具能够工作于任何哑屏幕、telnet会话、乃至拨号线路。
另外,它可不能消耗大量的CPU周期,通常低于百分之二(在更新的运算机上,其CPU利用率将低于百分之一)。
nmon利用哑屏幕,在屏幕上对数据进行显示,而且每隔两秒钟对其进行更新。
用户能够很容易地将那个时刻距离更改成更长或更短的时刻段。
若是拉伸窗口,并在XWindows、VNC、PuTTY或类似的窗口中显示这些数据,nmon工具能够同时输出大量的信息。
nmon工具还能够将相同的数据捕捉到一个文本文件,便于以后对报告进行分析和绘制图形。
输出文件采纳电子表格的格式(.csv)。
目前nmon已开源,以sourceforge为依照地,网址是。
2.2软件组成
Nmon利用需要nmon工具和nmonanalyser分析程序二者配合利用。
nmon工具生成性能数据文件,然后monanalyser以nmon生成的数据文件作为输入,输出为Excel电子表格,并自动地生成相应的图形,使得咱们能够直观地观看OS性能(CPU、IO和内存等)的转变进程。
2.3运行环境
nmon工具运行于:
∙AIX®、、和(nmonVersion9a:
该版本的功能已经确信,而且可不能对其进行进一步的开发。
)
∙AIX、和(nmonVersion10:
该版本此刻支持AIX和基于POWER5™处置器的运算机,而且提供了SMT和共享CPU微分区的支持。
)
∙pSeries®p5和OpenPower™上的Linux™SUSESLES九、RedHatEL3和4、Debian
∙LinuxSUSE、RedHat和许多最新的x86(32位模式的Intel和AMD)上的发布版
∙zSeries®或mainframe上的LinuxSUSE和RedHat
nmon工具大约每六个月更新一次,或在可用的新的操作系统发布版中对其进行更新。
2.4软件功能
nmon工具能够为AIX和Linux性能专家提供监视和分析性能数据的功能,其中包括:
∙CPU利用率
∙内存利用情形
∙内核统计信息和运行队列信息
∙磁盘I/O速度、传输和读/写比率
∙文件系统中的可用空间
∙磁盘适配器
∙网络I/O速度、传输和读/写比率
∙页面空间和页面速度
∙CPU和AIX标准
∙消耗资源最多的进程
∙IBMHTTPWeb缓存
∙用户自概念的磁盘组
∙运算机详细信息和资源
∙异步I/O,仅适用于AIX
∙工作负载治理器(WLM),仅适用于AIX
∙IBMTotalStorage®EnterpriseStorageServer®(ESS)磁盘,仅适用于AIX
∙网络文件系统(NFS)
∙动态LPAR(DLPAR)更改,仅适用于面向AIX或Linux的pSeriesp5和OpenPower
2.5软件获取
nmon工具和nmonanalyser工具都能够在IBM的Wike页面上下载到。
1)Nmon下载:
2)位置:
可从IBMWiki上下载
3)
4)下载页面如下:
5)
KB)2020-2-2223:
49
例如测试的系统是,那么就能够够下载,下载后能够看到紧缩包里是一些文件,如下:
KB)
2020-2-2223:
49
其实nmon确实是shell脚本,nmon文件运行时挪用其他的文件,生成性能数据,那个工具运行时也是通过执行nmon脚本同意参数。
6)Nmonanalyser下载:
7)位置:
可从可从IBMWiki上下载
8)
下载页面如下:
KB)
2020-2-2223:
49
例如下载版本的Nmonanalyser。
3.Nmon利用
3.1下载软件
1)下载之前须确信操作系统内核版本,本文以公司效劳器为例。
登录效劳器利用命令获取操作系统版本信息:
查看可知为EnterpriseLinuxServerrelease。
2)登录IBM官方网站()下载相应版本的nmon工具:
3.2安装软件
1)用root用户登录系统,成立目录:
#mkdir/nmon
2)通过FTP将下载的nmon工具上传至效劳器目录/nmon下。
3)修改tar包权限:
#chmod+x
4)解压文件:
#tarxvfZ
5)执行授权命令:
#chmod+xnmon_x86_rhel54
3.3运行界面
1)运行./nmon_x86_rhel54,即可进入nmon的监控界面,如以下图:
2)键入“c”查看系统CPU利用情形
3)键入“m”查看系统内存利用情形
4)键入“d”查看系统磁盘I/O情形
5)键入“h”查看帮忙信息
3.4利用方式
3.4.1实时监控
在完成配置后,只需要“#./nmon”命令即可运行程序,通过一些快捷键调取关切的系统资源指标进行显示,如按键“C”能够查看CPU相关信息;按键“D”能够查看磁盘信息;按键“T”能够查看系统的进程信息;“M”对应内存、“N”对应网络等等,完整的快捷键对应内容可以通过帮忙(按键“H”)查看,能够显示Linux系统CPU、内存、进程信息,包括了CPU的用户、系统、等待和空闲状态值,可用内存、缓存大小和进程的CPU消耗等详细指标。
该种方式显示信息实时性强,能够及时把握系统经受压力下的运行情形,每颗CPU利用率是多少、内存利用多少、网络流量多少、磁盘读写……这些数据均是实时刷新,一目了然。
3.4.2后台监控
为了配合性能测试,咱们往往需要将一个时刻段内系统资源消耗情形记录下来,这时能够利用命令在远程窗口执行命令:
./nmon_x86_rhel5-f-N-t-m/opt/soft/nmon/log/-s30-c120
其中各参数表示:
-f 按标准格式输出文件:
-N includeNFSsections
-m 切换到途径去保留日记文件
-s 每隔n秒抽样一次,那个地址为30
-c 掏出多少个抽样数量,那个地址为120,即监控=120*(30/60/60)=1小时
依照小时计算那个数字的公式为:
c=h*3600/s,比如要监控10小时,每隔30秒采样一次,那么c=10*3600/30=1200
该命令启动后,会在nmon所在目录下生成监控文件,并持续写入资源数据,直至360个监控点搜集完成——即监控1小时,这些操作均自动完成,无需手工干预,测试人员能够继续完成其他操作。
若是想停止该监控,需要通过“#ps–ef|grepnmon”查询进程号,然后杀掉该进程以停止监控。
3.4.3按时任务
除配合性能测试的短时间监控,咱们也能够实现对系统的按期监控,作为运营保护时期的参考。
按期监控实现如下:
1)执行命令:
#crontab–e
2)在最后一行添加如下命令:
3)08**1,2,3,4,5/nmon/nmon_x86_rhel5-f-N-m/nmon/log-s30-c1200
4)表示:
5)周一到周五,从早上08点开始,监控10个小时(到18:
00整为止),输出到/nmon/log
4.Nmon监控结果介绍
4.1生成结果文件
通事后台监控和按期监控,咱们能够取得扩展名为nmon的监控文件,这些文件记录着系统资源的数据,需要配合分析工具(nmonanalyser)进行解读。
1)利用FTP工具从效劳器上取下生成结果文件/nmon/log/到本机。
2)打开包下的nmonanalyser文件,点击Analysenomndata按钮,选择之前get下来的文件。
Excel可能禁止运行宏了,点“平安警告隔壁的选项”,许诺运行宏:
1)生成份析结果文件,并生成统计图,直观显示系统资源情形。
4.2要紧性能参数介绍
◆系统汇总(对应excel标签的‘SYS_SUMM’):
其中蓝线为cpu占有率转变情形;粉线为磁盘IO的转变情形。
◆磁盘读写情形汇总(对应excel标签的‘DISK_SUMM’):
其中蓝色为磁盘读的速度KB/sec;紫色为磁盘写的速度KB/sec。
◆内存情形汇总(对应excel标签的‘MEM’):
曲线表示内存剩余量(MB)
4.3页面介绍
简单介绍生成结果的各个页面:
1)系统汇总页面:
对应标签页(SYS_SUMM)
页面显示项要紧有主机名,执行日期,系统cpu利用情形(蓝线),系统I/O情形(粉红线),其中坐标左纵轴为系统cpu(user%+sys%)利用率,横轴为运行时长(以下图为一个小时),右纵轴为系统磁盘传输(Diskxfers),坐标下侧为统计信息:
系统I/O情形(一个周期内的平均值、最大值、显现最大值的时刻),系统CPU利用情形。
选项
说明
备注
User%
用户进程时间在CPU开销时间百分比
如果一个CPU被充分使用,利用率分类之间均衡的比例应该是:
65%-70%UserTime
30%-35%SystemTime
0%-5%IdleTime
Wait%
所有进程线程被阻塞等待完成一次IO请求所占CPU开销idle的时间百分比
Sys%
线程和中断在CPU开销时间百分比
Idle%
CPU空闲时间的百分比
CPU%
CPU利用率的百分比
注释:
若是系统CPU有IOwait存在,说明可能IO或内存方面存在瓶颈,其中要紧致使IOWait的要紧缘故如下:
✓内存不够而引发频繁的的数据互换,致使数据存取存在互换空间的I/O瓶颈
✓硬盘数据散布不合理
2)系统信息:
标签页(AAA)
页面信息要紧包括:
执行命令,主机CPU数(4),操作系统内核版本信息,主机名等信息。
1)系统详细信息:
标签页(BBBP)
页面信息要紧包括:
操作系统版本,主机磁盘信息,主机CPU型号、主频信息,内存信息,网卡信息等。
2)CPU利用情形:
标签页(CPU_ALL,CPU_SUMM,CPU001,CPU002,CPU003,CPU004)
主机CPU利用情形汇总和单颗CPU的运行情形。
1)磁盘读写情形汇总:
标签页(DISK_SUMM,DISKBSIZE,DISKBUSY,DISKREAD,DISKWRITE,DISKXFER)
磁盘的读、写及I/O统计信息,系统各磁盘分区的读写情形。
其中DISKBUSY页要紧反映系统本地磁盘利用,DISK_SUMM包括本地和存储(ESS,EMC,FASt及HDS)上所有磁盘利用情形。
1)内存利用情形:
标签页(MEM)
系统内存空闲、利用,swap、cached等统计信息。
2)系统网络情形:
标签页(NET,NETPACKET)
反映系统的网络运行情形,系统各个网络适配器读写的数据包数
3)系统进程:
标签页(PROC)
反映系统运行线程及等待切换的线程平均数。
其中RunQueue-每一个处置器应该运行队列不超过1-3个线程。
1)活动虚拟内存总量:
标签页(VM)
Linux操作系统特有指标,要紧包括系统/proc/vmstat文件中信息,两张图片要紧显示系统分页文件(pagefile)和swap分区运行情形。
若是系统老是存在大量换出页(pgpgout/s)KB数,说明系统需要更多内存。
1)页式调度:
标签页(PAGE)
记录系统(AIX)页式调度的情形。
这一栏要紧记录系统换页(paging)情形和页面扫描:
自由比率(pagescan:
freeratio)。
其中系统换页频率应该不大于5次/秒,而当页面扫描:
自由比率持续大于4时,需要重点关注下系统内存和分页空间的利用情形。
说明:
大量的内存互换操作会极大地阻碍系统的性能,尤其是在当数据库文件创建在文件系统上时(JFSandJFS2)。
在这种情形下常常访问的数据,即在SGA中存在,也一样在文件的缓存中存在。
这种相同的数据在内存中缓存两次的情形,会降低内存的利用效率,从而使内
存频繁进行互换操作,造成系统的I/O瓶颈,降低整个系统的性能。
3)搜集时刻:
标签页(ZZZZ)
记录nmon工具搜集系统信息的时刻点。
5.Nmon监控案例介绍
本节介绍通过nmon工具发觉系统性能下降问题的常见现象和处置流程。
5.1常见现象和产生缘故
性能下降(PerformanceDegradation),主若是指系统的性能随时刻而慢慢下降(那个地址假定在系统性能下降的进程中系统的负载状况没有明显转变)。
系统运行进程中占用的CPU或内存随时刻增加也属于广义的性能下降问题。
在生产环境中,通常由终端客户最先感觉到并报告性能下降问题。
因此狭义的性能下降问题主若是指系统运行指标随时刻转变,比如吞吐率随时刻下降或页面响应时刻随时刻上升,或二者兼而有之。
下面列举一些引发性能下降问题的缘故:
✓应用程序资源利用问题。
主若是内存利用问题,即由于应用效劳器的内存碎片问题或内存泄漏问题,致使垃圾回收的开销随时刻增大。
也有可能是因为磁盘临时文件积存造成磁盘访问开销增大。
✓应用程序设计问题。
由于应用程序的设计存在可扩展性或靠得住性问题,致使运行开销随时刻或业务对象的积存而增大。
✓数据库访问问题。
该问题又能够分为许多类型,如调优参数问题、表结构或索引设计问题、垃圾数据问题等。
其一起特点是致使应用程序利用特定操作访问数据库的开销随时刻而增大。
✓效劳器软件资源利用问题。
尽管可能性很小,可是应用效劳器、数据库效劳器等效劳器程序也是软件程序,也有可能存在性能下降问题。
这些效劳器程序在自身测试进程中可能遗漏了某些性能问题,而在用户特定的执行状况下触发了这些问题,结果致使这些效劳器程序利用的操作系统资源泄漏而显现性能下降问题。
✓测试用例设计问题。
性能测试中有可能发觉一些“假”的性能下降问题。
比如测试用例设计时假设在测试执行进程中系统负载维持恒定,但实际的测试用例实现致使系统负载或特定页面的处置内容随时刻增多,也可能致使测试工具的测试报告中显现性能下降问题。
5.2实例介绍
5.2.1例如一
图5-1 nmon操作系统监视汇总信息图
由此信息图可发此刻12小时测试进行进程中,系统的磁盘传输(Diskxfers)慢慢增大,与此同时系统CPU占用率慢慢下降。
进一步检查单个CPU的利用情形,发觉1号CPU的Wait状态占用率明显增大,如图5-2所示。
这说明CPU占用率慢慢下降是由于等待
磁盘I/O引发的。
图5-2 nmon单个CPU利用情形图
接下来分析磁盘传输汇总信息,如图5-3所示,能够看出磁盘写数据量没有明显增加,可是磁盘读数据量明显随时刻而增加。
图5-3 nmon磁盘传输汇总情形图
凭磁盘传输汇总信息,在排除由应用效劳器读取致使的性能下降问题后,大体能够确信不断增加的磁盘读取操作是由数据库引发的。
随后,分析DB2的快照监视器的监视结果,能够发觉DB2的缓冲池(Bufferpool)的数据和索引物理读(physicalread)的比例超级高。
如下例所示:
Bufferpooldatalogicalreads =5502388
Bufferpooldataphysicalreads =430671
Bufferpooltemporarydatalogicalreads =0
Bufferpooltemporarydataphysicalreads =0
……
能够看到缓冲池的物理读比例(即缓冲池不命中率)高达7%,这远远大于1%的警戒线。
而且物理读比例有随时刻增加的趋势(通过不同时刻的快照信息对照发觉)。
至此能够疑心性能下降问题是由于DB2的缓冲池配置参数设置不妥引发的。
考察数据库配置参数信息发觉,该数据库的BUFFPAGE参数值为10000。
与该测试用例利用的数据规模相较,那个参数值明显偏小。
于是将BUFFPAGE参数值增大10倍,变成100000,从头运行性能测试,发觉性能下降问题大体消失。
5.2.2例如二
本实例为通过nmon监控河北税源治理平台数据仓库搜集的数据。
对照nmonanalyser工具生成结果进行分析。
1)搜集效劳器大体信息
通过以上数据能够明白河北数据仓库效劳器大体配置信息如下:
✓主机名:
HE_SSGLY_DB_01
✓操作系统版本:
AIXbuild5300-04
✓操作系统内核:
HW-type=CHRP=CommonH/WReferencePlatformBus=PCILPAR=DynamicMulti-Processor64bit
✓主机型号:
IBMp5595(9119-595)
✓网络配置:
IPAddress:
SubNetmask:
Gateway:
主机存储:
EMC存储
✓主机物理内存:
49152MB
✓网卡信息:
2块网卡速度为1024M/S
2)文件系统利用情形
通过以上数据能够明白河北数据仓库效劳器文件系统相关信息如下:
✓文件系统分区大小及利用情形
✓文件系统挂载点信息
✓文件系统类型为JFS2(JournaledFileSystem2)文件系统
3)系统资源利用情形
观看上图,能够发觉效劳器cpu利用率较高的时段为8:
00-11:
30、14:
00-17:
20,而系统I/O开销较高的时段均出此刻21:
00-第二天5:
50。
以上信息大体符合效劳器晚上进行数据ETL
处置、白天工作时段多进行平台一样事务处置的情形。
进一步观看效劳器cpu利用情形:
发觉CPU利用率较高均为用户进程,单独查看CPU-11注意到22:
00-0:
00那个时段内CPU的Wait状态占用率明显增大,user状态占用率却很低,现在系统I/O明显升高,说明那个时段内有大量磁盘I/O发生,CPU占用率慢慢下降是由于等待磁盘I/O引发的。
实际情形中,那个时段效劳器正在进行ETL数据处置,的确有大量数据传输和磁盘读写发生。
5.2.1例如三
介绍个利用nmon进行系统实时监控的例子。
把nmon脚本上传到效劳中,直接运行即可,执行命令如下:
#./nmon或#/tmp/nmon/nmon
以下是下利用nmon的一些截图:
别离输入c、t、n、m,能够了解系统cpu,内存,消耗资源最高的线程的利用情形。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- nmon 工具 利用 案例 分析