网络设备管理平台系统解决方案Word文档格式.docx
- 文档编号:14182067
- 上传时间:2022-10-19
- 格式:DOCX
- 页数:43
- 大小:5.85MB
网络设备管理平台系统解决方案Word文档格式.docx
《网络设备管理平台系统解决方案Word文档格式.docx》由会员分享,可在线阅读,更多相关《网络设备管理平台系统解决方案Word文档格式.docx(43页珍藏版)》请在冰豆网上搜索。
2.网络设备。
包括各机房路由、交换和防火墙、负载均衡等网络设备的运行状态、性能、流量的监控。
3.服务器。
包括服务器硬件状态、linux、windows、AIX、HPUX、Solaris以及Vmware虚拟化操作系统运行状态(cpu、内存、磁盘空间、网口流量等)的监控,以及所运行的进程和服务的监控。
4.存储。
对IBM、NetAPP、HPStorageWorks等存储系统进行运行状态监控。
5.数据库和应用系统。
包括Oracle、Sqlserver、mysql、DB2、sybase、postgreSQL等常用数据库,WebSphere、Weblogic、Tomcat等中间件系统的监控。
IIS、nginx等应用和服务器上运行的用户各种通用和专用业务系统的监控。
6.机房动力环境。
可分阶段实施对机房的动力环境进行监控,包括温湿度监控、烟雾监控、漏水监控、市电监控、空气开关监控以及UPS、精密空调或民用空调监控,门禁、红外、门磁等安防监控,以及机房其他设施的监控管理。
2系统综述
2.1建设背景
集团经过多年的信息化及信息安全建设,集团有大量的服务器,安装各样的操作系统,从事各种信息应用服务。
对于这些服务器及应用系统服务,管理员在运维中只有通过登录服务器检查系统,才能发现服务器、应用系统的故障并进行处理。
在网络建设方面,建设了为数不少的防火墙,还有IPS、负载均衡等网络设备。
这些设备产生大量的工作、访问日志基本上以孤岛的形式存在各自的系统中,有网管平台管理一般的网络交换机、路由器等设备,但网管平台功能平平,设备覆盖面窄。
目前系统运维监控的效率比较低,不能及时发现系统的异常以迅速解决隐患,若系统故障出现的出报高峰期,可能导致比较大的影响。
2.2建设目标
通过部署整体运维解决方案,对网内基础设施、服务器、数据库、中间件以及业务应用系统等进行有效管理,为达到100%正常运行率以及网络使用的畅通、机房安全提供可靠保证,降低业务故障风险,提高IT部门事故处理质量、效率,由被动管理转化为主动管理,增加业务使用者的满意度,提升部门价值。
2.3建设原则
1、安全生产的原则:
由于网络系统的重要性,各种技术方案、产品、客户化工作的实际实施必须经过充分的测试和验证,并需精心设计实施方案,以保证不会对用户现有网络的正常运行和业务系统的正常使用造成任何影响;
同时,应充分考虑工程实施过程中的回退和应急方案,以保证在最短时间内恢复由于新系统的实施对网络造成的影响。
2、开放性原则:
网络系统管理平台需要基于开放的管理平台,遵循业界标准,并提供开放、灵活的信息交互及管理接口,能提供开发接口,方便扩展管理功能,并且支持第三方厂商的应用集成,为产品的选型提供更高的灵活性。
3、可用性原则:
网络系统管理平台的部署不需对原有的网络系统结构、安全策略等方面做较大修改和调整,对原有网络系统性能影响最小化,尽量少的占用网络资源、被监控服务器资源不得超过现有资源的百分之五,可定期自动清除“垃圾”文件和“垃圾”数据。
4、健壮性原则。
网络系统管理平台具有较强的免维护能力,能够长时间稳定运行,自身维护要求简单,具有快速恢复功能。
5、扩展性原则:
网络系统管理平台具有较强的扩展性,能够在包括管理范围、管理功能、管理数量等方面提供灵活、多样的扩展能力。
6、展示形式多样性原则:
网络系统管理平台能够对收集的数据进行分析处理,生成技术、运维管理等层面的相关报表、视图等,根据不同级别用户的实际需求,提供灵活、多样的展示形式,能提供中文界面。
7、可定制原则:
提供灵活的部署方式,在客户化、管理策略、事件关联、报警方式、报表生成、信息展示、管理流程等方面可以按实际需求进行定制,并支持用户的二次开发。
8、成熟优先、适度超前原则:
系统整体设计应该统一规范,模块设计清晰合理,通信接口明确透明,能够有效地实现后台一体化管理。
在此基础上,该网络管理系统应具有适度的先进性。
3解决方案
3.1监控系统简介
“网络管理平台”是创新和领先的综合IT运维管理产品。
“极简”的设计,提供机房IP网络全面监控预警解决方案。
监控内容包括DDN专线和VPN隧道等通信线路、服务器的硬件及各种操作系统、数据库、中间件和应用系统、网络设备的运行状态和性能,IP和应用流量分析,机房动力环境等。
3.2架构
“网络管理平台”专用系统基于高效安全Linux内核,全web配置管理,运行更稳定可靠,监控预警更快速准确。
优化的核心程序,对网络带宽占用极低,同时对目标网络设备和服务器性能影响极低。
系统主要由数据采集、数据储存和分析处理、B/S可视化人机界面、报警等模块组成,并提供多种扩展组件。
系统架构
3.2.1数据采集模块
数据采集模块通过SNMP、WMI、SYSLOG、SnmpTrap、IPMI、各种应用层协议(ICMP、HTTP、FTP、SSH、TELNET、SMTP、POP3等)及私有协议,对网络专线(DDN、VPN)、网络设备、服务器、各种应用和数据库系统、机房环境等进行各种数据采集,提交到数据储存和分析模块处理。
3.2.2数据储存和分析模块
数据储存和分析处理模块对采集模块提交的的数据进行分析,确定监控目标的状态(正常、一级和二级告警、错误等),向B/S可视化人机界面模块提交状态信息。
同时,将数据储存到数据库中,提供接口供人机界面模块进行历史数据查询。
3.2.3B/S可视化人机界面模块
B/S可视化人机界面模块通过web对用户提供配置、管理和告警接口。
用户通过web进行系统配置、监控目标配置,查看网络拓扑图和监控目标的状态,查询历史数据生成详尽的性能曲线图、故障和告警历史记录,生成报表。
人机界面也提供完整的管理员操作日志查询、配置备份和恢复、系统手动和自动升级等多种管理功能。
3.2.4预警模块
预警模块通过人机界面的弹出窗口和声音进行声光预警,同时支持通过发送电子邮件、手机短信、微信、手机APP等多种手段进行预警。
3.2.5扩展组件
系统提供流量分析、机房动力环境、设备日志储存管理、IPMAC管理、网络设备配置管理等多种组件,根据需要可灵活扩展。
●流量分析组件通过netflow/sflow/抓包分析等收集网络设备数据流信息。
并能进行分析、汇总,图形化输出制定时间范围和流向的汇总表、用户IP流量TOPN饼图、TCP/UDP/ICMP等协议流量TOPN饼图,输出各类应用的流量详细情况和TOPN列表等。
通过上述手段进行流量相关的故障分析和定位。
●机房动力环境组件结合动力和环境探测设备,可支持温湿度、普通漏水、定位漏水、烟雾、电量、空开状态、UPS、电池组、精密空调、普通家用空调、红外、消防、防雷、新风机、加湿机和门禁等机房动力环境参数的监控。
●日志储存服务组件通过SYSLOG协议接收和储存被监控的网络设备、服务器的日志。
提供查询、管理功能。
支持设置日志告警通知策略,将包含指定关键字的日志信息发送给指定管理员。
支持设置报表策略,将包含不同关键字(如error,warning,failed等)的日志进行分类,形成日志分类库,并根据分类库对日志进行分析汇总,形成分类日志报表。
●IPMAC管理组件可实时显示网内计算机、服务器、其他IP设备与交换机关系的详细信息表,包括IP、MAC、设备名称、所连交换机的IP、名称、端口、VLANID和VLAN名称等。
并能动态实时更新。
可设置动态更新的时间间隔,最低为秒级。
能快速查询IP地址、MAC地址等所连交换机的端口。
能通过实时表添加或者手动加入的方式建立基准表信息表、合法的IP、MAC信息表。
系统能自动比较实时表、基准表、合法MAC表信息,通过IP变更表、新增MAC表、端口变更表等实时记录异常信息。
可为不同的异常信息(IP变更、新增MAC、端口变更)单独设置告警策略,通过系统支持的电子邮件、短信、微信、人机界面弹窗等方式,向指定的管理员发送告警通知。
●网络设备配置管理可对CISCO、H3C、华为、锐捷等网络设备的配置,按照设定的备份计划进行备份。
支持telnet/ssh和SNMP的备份手段。
3.3建议方案
3.3.1方案
整体运维方案图
在中心机房部署高可靠和高性能的“网络管理平台”硬件设备。
如上图所示。
设备为旁路接入,对原网络没有任何影响。
3.3.2方案说明和应用价值
1.用户中心机房部署“网络管理平台”IT整体运维平台,旁路接入核心交换机。
2.大屏显示整网拓扑,3D视图展示机房动力和环境状况。
通过网络拓扑展示的带宽使用状况和流量分析功能,容易发现网内异常的流量,易于管理。
可通过更多的大屏实时显示整体的状态分布、汇总分类列表信息、重要的设备状态列表、重要的曲线图、实时故障告警列表等。
3.实现对接近400台左右的重要服务器、存储、核心和汇聚层交换机、安全设备,网内承载接近100个左右的数据库、中间件及用户专用业务应用系统的全面监控管理。
4.扩展支持SYSLOG日志分析管理、IP和应用流量分析管理、IP-MAC管理、动环监控、网络设备配置管理。
5.扩展支持云端管理功能。
用户部署的一个或者多个监控系统可接入云端平台。
用户登录云端平台,可以实时查看每个监控系统的监控整体状况、实时故障通知信息等。
用户系统通过云端系统实时推送微信告警通知。
6.灵活的日志和报表,大大减轻日常运维管理工作量。
7.支持短信、电子邮件、微信、手机APP和声光、UI界面快速预警。
提前发现信息化系统运行存在的问题、网络存在的问题,提升使用者的满意度,提升信息中心管理水平。
3.4产品选型
3.4.1监控对象要求
以下为系统运维监控的主要需求描述,需优先实现的核心需求标为黑体。
监控对象
监控内容
服务器
支持CPU、内存、磁盘空间、服务、进程、网卡、物理/逻辑端口等运行状态的监控
操作系统
支持windows、linux各主流版本操作系统的监控功能
中间件
支持对IIS、resin、tomcat、weblogic、Apusic、nginx等各主流版本中间件的监控功能
数据库
支持对oracle、sqlserver、mysql、sybase、postgreSQL等各主流版本数据库的监控功能
应用系统
对全媒体一体化平台、图片系统、OA系统等重要业务系统环节实现监控,能够模拟系统重要工作过程(如新华社稿件、图片入库情况监控等),异常时发出预警。
存储设备
支持对HDS、Netapp、IBM、EMC等存储设备的监控功能
安全设备
支持对Checkpoint、Mcafee、F5、WAF(绿盟)等各大主流的防火墙、安全网关等安全设备的监控功能
数量说明:
服务器(总数约300),数据库、中间件(总数约100),安全设备(总数约30台),存储设备(总数约10台)。
3.4.2监控功能要求
1.拓扑管理:
自动生成应用系统拓扑图,可以以业务系统为单位对监控节点进行分组,展示各业务系统的拓扑结构,每台服务器的健康状态,并可以通过拓扑图逐层找到故障点。
2.日志审计:
各监控对象的统一日志审计。
(操作系统各类日志、中间件各类日志、数据库各类日志、应用系统服务的各类日志)
3.性能监控:
实现对系统性能的统一监控,需监控并记录系统内存使用率、cpu使用率、存储空间使用情况、网络流量状态等,并能够设定阀值,超过阀值时自动告警。
4.应用系统业务环节监控:
对重要应用系统环节实现监控,能够模拟系统重要工作过程。
任务名称
监控要点
OA系统
模拟系统重要工作过程,
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 网络设备 管理 平台 系统 解决方案