zbixx运维监控管理平台使用手册NEW.docx
- 文档编号:28536665
- 上传时间:2023-07-18
- 格式:DOCX
- 页数:18
- 大小:25.71KB
zbixx运维监控管理平台使用手册NEW.docx
《zbixx运维监控管理平台使用手册NEW.docx》由会员分享,可在线阅读,更多相关《zbixx运维监控管理平台使用手册NEW.docx(18页珍藏版)》请在冰豆网上搜索。
zbixx运维监控管理平台使用手册NEW
xxxx运维监控管理平台
操作手册V1.0
xxxx(天津)科技有限公司
变更记录
序号
版本
变更说明
修改人/日期
01
V1.0
新建
张冠洲/2017年1月
1.平台简介4
1.2平台功能4
1.3优劣势4
2.1服务端环境准备5
2.2数据库准备5
2.3编译安装6
2.4配置文件及web前端文件修改6
2.5web前端安装配置6
2.6启动Server7
3.配置使用9
3.1添加Hosts9
3.2添加Items10
3.3添加Triggers11
3.4添加Actions11
3.5添加Medias12
3.6添加Users13
3.7添加WEBMonitorings13
3.8添加Graphs16
3.9添加Screens17
3.10添加Maps18
3.11添加SNMP监控19
3.12添加自定义监控19
3.13添加Templates19
3.14添加Reports(定制报表)20
3.15添加Macros21
3.16添加自动发现设备22
3.17添加Inventory22
3.18Export/ImportXML22
3.19Maintenance(维护时间)23
1.平台简介
概述
xxxx运维监控管理平台根据自身业务需求进行开发以满足平台监控业务需要。
平台通过C/S模式采集数据,通过B/S模式在web端展示和配置。
被监控端:
主机通过安装agent方式采集数据,网络设备通过SNMP方式采集数据
Server端:
通过收集SNMP和agent发送的数据,写入MySQL数据库,再通过php+apache在web前端展示。
平台运行条件:
Server:
Server端需运行在LAMP(Linux+Apache+Mysql+PHP)环境下,对硬件要求低
Agent:
目前已有的agent基本支持市面常见的OS,包含Linux、HPUX、Solaris、Sun、windows
SNMP:
支持各类常见的网络设备
平台功能
具备常见的商业监控软件所具备的功能(主机的性能监控、网络设备性能监控、数据库性能监控、FTP等通用协议监控、多种告警方式、详细的报表图绘制)
支持自动发现网络设备和服务器
支持分布式,能集中展示、管理分布式的监控点
扩展性强,server提供通用接口,可以自己开发完善各类监控
2.安装部署
服务端环境准备
平台Server端需要运行在CentOS、RedHatLinux、Debain等Linux平台上,这里以RHELAS5作为部署环境。
Root用户安装必须的包,建议配置好yum,通过yum安装下列包,解决包的依赖关系。
LAMP环境
#yuminstallmysql-serverhttpdphp
其他需要用到的包:
#yuminstallmysql-develgccnet-snmp-develcurl-develperl-DBIphp-gdphp-mysqlphp-bcmathphp-mbstringphp-xml
解压
#tarzxvfethane
增加用户和组
#groupaddethane
#useradd–gethane–methane
数据库准备
启动MySQL数据库:
#servicemysqldstart
修改MySQLroot用户密码(默认密码为空)
#mysqladmin–urootpasswordroot
测试能否正常登陆数据库
#mysql–uroot–proot
创建平台数据库
Mysql>createdatabaseethanecharactersetutf8;
Mysql>grantallonethane.*TOethane@'localhost'identifiedby'ethanepass';
Mysql>flushprivileges;
导入数据库sql脚本
#cdethane-1.8.1
#cat./create/schema/mysql.sql|mysql-uroot–prootethane
#cat./create/data/data.sql|mysql-uroot-prootethane
#cat./create/data/images_mysql.sql|mysql-uroot-prootethane
编译安装
配置编译,prefix是安装后程序目录
#./configure--with-mysql--with-net-snmp--with-libcurl--enable-server--enable-agent--enable-proxy--prefix=/usr/local/ethane
#./configure--with-mysql=/usr/local/mysql/bin/mysql_config--with-net-snmp--with-libcurl--enable-server--enable-agent--enable-proxy--prefix=/usr/local/ethane//mysql编译安装
#make
#makeinstall
配置文件及web前端文件修改
添加服务端口,添加后如下
#grepethane/etc/services
ethane-agent10050/tcp#EthaneAgent
ethane-agent10050/udp#EthaneAgent
ethane-trapper10051/tcp#EthaneTrapper
ethane-trapper10051/udp#EthaneTrapper
添加配置文件
#mkdir-p/etc/ethane
#cp./misc/conf/*/etc/ethane
#chown-Rethane:
ethane/etc/ethane
修改Server配置文件
基本不用修改,用默认配置即可,只需修改一项DBPassword=密码
#vi/etc/ethane/ethane_server.conf
修改Agentd配置文件,更改HOSTNAME为本机的hostname就好了
#vi/etc/ethane/ethane_agentd.conf
添加web前端php文件
#cdfrontends/
#cp-rfphp/var/www/html/
#cd/var/www/html
#mvphpethane
#chown-Rethane:
ethaneethane
web前端安装配置
修改php相关参数
#vi/etc/php.ini找到如下几项,改成下面的值,前面有;号的要删掉
max_execution_time=300
max_input_time=300
memory_limit=128M
date.timezone=Asia/Shanghai
post_max_size=32M
mbstring.func_overload=2
重启apache
#servicehttpdrestart
在本地浏览器上访问Serve地址开始web前端配置ethane
按提示一步步next,其中Step3Checkofpre-requisites必须全部项目OK后才能继续配置,如有提示fail,去server上检查是否安装这个包或配置是否按上述更改。
图1
Step4填入Server登陆mysql的用户和密码
Step7按提示下载配置文件到Server的/var/www/html/ethane/conf下,名字一定要是ethane.conf.php
配置完成后,出现登陆界面,默认的用户为:
admin,密码为:
ethane
启动Server
安装完成后的server程序在/usr/local/ethane/sbin/目录下,可以直接启动
#/usr/local/ethane/sbin/ethane_server
为了便于启停Server,我们做一些小配置
复制控制程序
#cp./misc/init.d/redhat/ethane_*/etc/init.d/
修改配置目录,将如下两个文件中的BASEDIR=改为/usr/local/ethane,下面两个配置中的bin改为sbin,ETHANE_AGENTD,ETHANE_SUCKERD
#vi/etc/init.d/ethane_server_ctl
#vi/etc/init.d/ethane_agentd_ctl
加入开机启动
#echo'/etc/init.d/ethane_server_ctlstart&'>>/etc/rc.local
#echo'/etc/init.d/ethane_agentd_ctlstart&'>>/etc/rc.local
创建快键方式
#ln-s/etc/init.d/ethane_server_ctl/usr/bin/ethane_server_ctl
#ln-s/etc/init.d/ethane_agentd_ctl/usr/bin/ethane_agentd_ctl
启动Server和Agentd(可以通过startstoprestart来操作)
#ethane_agentd_ctlstart
#ethane_server_ctlstart
检查启动是否正常,查看进程是否起来,分server和agentd
#ps–ef|grepethane
如果进程没起来,可以查看对应的日志错误,默认在/tmp/ethane-*.log
至此平台Server端的安装已完成
在hosts上配置agent
平台需要在被监控的host上安装agent,把相应平台的agent包部署到各被监控端,按如下方式在被监控上运行agent。
Linux、UX:
Linux、UX上的agent是编译好了的,不用安装
#useraddethane
#cd/usr/local/ethane
#tarzxvfethanegz
取一份server上的ethane_agentd.conf到本地,然后按说明修改,一般我们只需修改如下5个参数:
Server=EthaneServerIP
Hostname=本机名
LogFile=本机agentd日志保存文件
SourceIP=本机IP
ListenPort=10050
修改完成后,运行agentd
#/usr/local/ethane/sbin/ethane_agentd-c/usr/local/ethane/ethane_agentd.conf&
#ps–ef|grepethane_agentd
如果进程没起来,可查看agentd.log日志来排查问题。
(注:
启动时建议用全路径,否则可能会出错)
加入开机运行
#echo'/usr/local/ethane/sbin/ethane_agentd-c/usr/local/ethane/ethane_agentd.conf&'>>/etc/rc.local
Windows:
Windows下解压客户端包到c:
下载修改好的ethane_agentd.conf文件也放到c:
打开cmd命令行,执行
C:
>ethane_agentd–install
安装后会在平台服务里添加一个ethane_agentd服务,会自动开机运行
如果需要将客户端和配置文件放在其他目录,请执行
C:
>DIR/ethane_agentd–cDIR/ethane_agentd.conf–install
启动agentd服务
C:
>ethane_agentd–start
或是通过管理->服务找到ethane_agentd来启动
3.配置使用
通过本地浏览器访问来开始配置和使用平台。
使用平台进行监控之前,要理解监控的流程。
一次完整的监控流程可以简单描述为:
HostGroups(设备组)->Hosts(设备)->Applications(监控项组)->Items(监控项)->Triggers(触发器)->Actions(告警动作)->Medias(告警方式)->UserGroups(用户组)->Users(用户)
添加Hosts
Host是平台监控的基本载体,所有的监控项都是基于host的。
通过Configuration->Hosts->CreateHost来创建监控设备
图2
按提示填入Name、Groups、IP,其他选项默认即可,LinkTemplates处选择一个模板,save即可成功添加设备。
(注:
如果host上没安装agent,添加后的状态会是unmonitor,会采集不到值,平台自带大量的设备监控模板,我们添加主机时通过link到这些模板,就可以快速添加主机的监控项和告警触发条件)。
一类的hosts可以归属到同一个HostGroup,便于分类管理同一类设备,在Configuration->HostGroup->CreateHostGroup可以添加设备组。
添加Items
Item是监控项,是监控的基本元素,每一个监控项对应一个被监控端的采集值。
在Configuration->Hosts界面,我们能看到每个host所包含的items总数,点击对应主机的items项,可以看到具体的每个item信息,这些items可以引用自templates,也可以自己创建。
图3
通过点击具体item名字可以修改已有监控项的属性,点击Satus的链接可以禁用/启用这个监控项。
(注:
我们可以通过新建一个template,在template中禁用掉所有不需要用到的items,然后把同一类hostslinkto这个template,就不用一台台主机去更改items)
新增item可以通过点击右上角的createitem来创建
图4
按提示逐项填入相关信息即可,其中key是平台已经自带的取值方法,Application类似于hostgroups,是item的组。
(itemkey也可以自定义,后面会讲到如何自定义监控项)
平台自带非常多的监控采集项及方法,基本能满足当前所有的监控功能,这些都包含在item的itemkey中了。
添加Triggers
Trigger是触发器,当Items采集值满足triggers的触发条件时,就会产生actions。
每一个trigger必须对应一个item,但一个item可以对应多个trigger。
同样,通过点击Configuration->Hosts->Triggers中某个trigger的名字,可以修改trigger的属性。
(注意:
引用自template的trigger触发值是不能单独修改的,必须在template中修改,或是复制一个同样的trigger再修改,然后禁用掉之前的)
新增trigger可以通过点击右上角的createtrigger来创建
图5
Expression中选择对应的item、触发方式及触发值,Severity是告警级别,根据trigger的严重性来选择。
平台提供多种trigger触发方式供选择,常用的我们可以选择lastvalue>/=/#/N(最近一次采集值),或是选择maximalvalueforperiodoftime(一段时间内的最大值),等等。
可以根据实际需要来设定触发方式。
添加Actions
Action是告警动作,当触发器条件被满足时,就会执行指定的action。
通过Configuration->Actions->CreateAction来创建Action
图6
Eventsource:
来源
triggers,即所有的triggers条件满足时都会执行这个action
Discovery:
自动发现模块
Autoregistration:
事件产生记录
Escalations:
告警是否升级,及升级时间
Subject、Message:
告警标题和内容,此处可引用平台的宏变量;例如{{HOSTNAME}:
{TRIGGER.KEY}.last(0)}表示最后一次采集值。
RecoveryMessage:
告警恢复信息,不勾选平台会用默认的,勾选后自定义
Conditions:
trigger产生的条件,条件可以多选
Operation:
选择media及user
添加Medias
Media,即告警方式,平台可以提供四类Media:
Email/SMS/Jabber/Script,通过Administrator->MediaType来修改或新增告警方式
Email方式最常用的,填入相关的SMTP信息,即可通过邮件方式发送告警。
图7
SMS方式要在server主机上接入短信modem。
Jabber方式是一种linux下的即时通讯工具,通过Jabber发送即时消息。
Script方式可以通过自己编写程序或脚本的方式发送告警信息。
添加Users
在Administrator->Users可以添加用户和用户组
通过UserGroup可以限制用户的权限,ethane自带的用户组的权限限制基本能满足我们的要求。
创建用户时可以根据用户的不同作用划分到不同的组,media中填入告警接受地址及告警接受时间等信息。
图8
添加WEBMonitorings
WebMonitoring是用来监控web程序的,可以监控到web程序的下载速度、返回码及响应时间,还支持把一组连续的web动作作为一个整体来监控。
下面我们以监控登陆平台的web程序为例,来展示如何使用webmonitoring。
Configuration->web->CreateScenario创建一个Scenario(注:
必须选择host后才能创建scenario,平台的所有items都必须创建在hosts上)
图9
Application:
选择这个scenario所在的application组
Name:
scenario的名字
Basicauthentication:
鉴权
Updateinterval:
监控频率,s为单位
Agent:
选择要使用的浏览器客户端,可能同样的web程序对不同的客户端展示的内容会不一样
Status:
默认为active
Variables:
变量定义,这里定义的变量可在后续的steps中使用,这里我们定义了用户和密码的变量
Steps:
web程序的各个步骤,选择add新增一个Login的step,来模拟用户登陆,传递用户和密码给index.php页面
图10
URL:
监控的web页面(注:
必须是全路径带页面名)
Post:
传递给页面的参数,多个参数之间用&连接,此处可引用前面定义的变量
Timeout:
超时时间
Required:
页面中能匹配到字符,匹配不到即认为错误
Statuscodes:
页面返回码
添加完step后,我们在Monitoring->web页面即能看到监控的状态和图示
图11
创建完scenario后,平台server会自动创建相关的items,所以我们只需为这些items添加triggers即可让webscenario出错时产生告警
Configuration->hosts->点击scenario所在的host条目的trigger,直接createtrigger,在selectitems的时候就可以看到平台自动创建的items(注:
自动创建的items在host的items列表中直接是看不到的,需要在创建trigger时选择items时才能看到)
图12
可以在items列表中看到,平台为每个step创建了3个item,DownloadSpeed/ResponseCode/ResponseTime,为整个scenario创建了一个test.fail的item,可以分别为其创建trigger
下例我们创建一个Login页面返回码的trigger,大于等于400即为错误
图13
再创建一个整个scenario所有step运行是否成功的trigger,采集值为0表示整个scenario的所有step都执行成功了,第几步的step执行失败就返回数字几,且后续的step都不会继续执行下去。
图14
这样,一个完整的webmonitoring就配置完成了。
Webmonitoring还有更多强大的功能,未能一一研究了解,有待挖掘
添加Graphs
平台的Graphs功能很强大,可以为每一个item绘制图,也可以把多个items绘制在一张图内。
通过configuration->hosts选择要绘制图的host,点击graphs,creategraphs即可创建图。
图15
Graphtype:
图样式,有线状、柱状、饼状
还可以自定义图大小,及Y轴最大最小值
通过additems可以添加在同一个图中展示的多个items(注:
注意每个item的颜色及取值范围,范围相差太大图会显示不全)
配置好的graphs在monitoring->graphs中查看
在monitoring->lastdata下能快速查看每个host的每个item的graph
添加Screens
Screen将多种信息放在一起展示,便于集中展示某个host的多个信息,或是比较多个hosts的同一种信息,这些信息可以为graphs、maps、serverinfos等等,几乎涵盖平台所有的监控信息。
通过configuration->screen->creatscreen来创建,创建时定义screen的行数和列数,点击对应单元格内的change,添加相应的信息
图16
通过monitoring-screen,可以查看之前配置好的信息。
添加Maps
这里可以添加关于主机的拓扑图:
configration-maps,在右上角可以createmaps或者importmap
这里我们点击cratemaps点save保存。
图17
然后编辑保存好的maps
图18
上面加号和减号可以增加主机link说明主机的连接情况,可以进行自定义。
图20
添加SNMP监控
snmp的监控要在configration中hosts中添加相关主机的模板和snmp版本,一般用snmp监控网络设备就可以了。
平台对server的监控一般是用agent来做的,所以不提供snmp对server的监控,这一点和cacit有本质的区别,因为cacti主要是通过snmp对主机和网络设备进行监控的。
图21
添加自定义监控
对于平台功能上无法实现的监控,可以通过自己编写程序或脚本来辅助完成,并将脚本的结果通过agent递
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- zbixx 监控 管理 平台 使用手册 NEW