网络运维方案.docx
- 文档编号:3138138
- 上传时间:2022-11-17
- 格式:DOCX
- 页数:14
- 大小:93.87KB
网络运维方案.docx
《网络运维方案.docx》由会员分享,可在线阅读,更多相关《网络运维方案.docx(14页珍藏版)》请在冰豆网上搜索。
网络运维方案
1综合管理的必要性2系统概述3系统结构
系统逻辑结构系统组网
集中管理模式分级管理模式
4主要功能
网络拓扑管理
网络拓扑发现
IP地址分布图及管理
支持跨地域的多层网络监控
链路的管理
故障检测
性能监测管理
网络性能参数的监视服务器性能监测管理数据库性能监测管理网络设备监测管理性能参数的统计图表及报表
性能预警性能监视参数的拓展
故障管理
警的自动通知告警分析与统计告警处理
故障告警源
设备管理
形象直观的设备图标
设备快照及设备管理提示信息
设备活动进程及安装软件的查看
设备机架面板
网络设备端口分布管理查询
交换机端口详细信息查询
桌面安全管理
储存设备管理终端外设控制终端操作监控
报表管理
5系统特点
1综合管理的必要性
随着IT的不断发展,众多行业从其自身业务发展的角度出发,加强了网络信息
化建设力度,在其网络基础上开展电子商务、企业资源计划(ERP)、办公自动化(OA)等业务内容。
而在这一发展过程中,逐步发现除了要依靠网络设备本身和网络架构的可靠性之外,管理和安全成为了关键环节。
当前,网络系统的结构复杂和规模庞
大,即要保证网络系统的正常运作,又需要保证业务系统的正常工作,传统的各自独立的“分立式”系统已经无法满足复杂的IT系统的管理要求,综合管理平台已经成为大势所趋的方向。
2系统概述
内网运维综合管理系统是我司完全自主开发的一套全中文网络运维与安全管理
是一套在充分调研了国内网络现状以及网络管理方式,采用目前为止最先进
的网络管理技术,以用户的网络、线路以及服务器、路由器、交换机、计算机等等的日常运作管理为着眼点,独立研发的完全适应于高、中端网络管理软件领域需求的一套优秀、可靠、先进的网络设备资源与应用服务资源、全中文、通用管理系统,为广大客户从根本上解决了困扰已久的网络管理难的棘手问题,并且很有效的帮助
网络管理人员从根本上提高网络利用率和网络服务的质量。
3系统结构
系统逻辑结构
系统监测层包括网络管理、应用管理、设备管理、桌面管理,是监测底层的被
管对象层,实现对网络、主机、存储设备、安全设备、数据库、中间件及应用软件等IT资源的全面监控管理;同时自动收集、过滤、关联和分析各种管理功能产生的故障事件,实现对故障的快速定位和处理;对网络和业务应用等IT资源的性能进行监控,定期提供性能报表和趋势报表,为网络性能优化提供科学依据。
用户层是整个系统呈现,是运维管理平台的人机交互接口,系统集中运行展现提供集中的直观的监控呈现、快速发现和分析各类运行隐患,提供了运行一览、网络拓扑、业务拓扑、负载分析、告警台、统计分析等多种监测视图,通过集中化的有机的组合各种视图,为不同角色的人员提供完整的运维管理工作界面。
运维服务
管理层将人、技术与流程进行有效地融合,实现日常运维工作的自动化、信息化和
统一数据接口
网维管淫应用管理设各管理桌面管理数据接口
标准化。
人的依赖。
至上而下的IT运维管理平台能为IT服务管理提供足够的管理元素,帮助管理者从不同的角度、不同层面去了解系统运维状况,为领导决策提供科学依据,同时生成多种工作记录,领导可对IT运维管理人员的绩效进行客观的评估,从而帮助用户实现对IT服务基础支撑系统的透彻管控。
监测层和用户层通过统一的资源库和子系统接口来进行有机的融合,同时系统提供了单点登录和统一认证的支持,确保从上到下的操作是必须经过统一登录认证和操作审计的。
其他集成接口系统包括系统数据交换接口和分布式数据采集接口,通过系统数据交换接口,可以建立多层系统部署的数据交换,同时也可以和异构系统集成,通过分布式数据采集接口可以实现数据的远程采集。
图1系统逻辑结构框图
系统组网
系统能够方便地满足用户在网络运维管理中的组网需求。
依据目前的管理要求,在网络运维管理系统实施过程中通常采用的组网模式有两种:
集中管理模式和分级管理模式。
集中管理模式适用于统一网管中心的网络,这个网络可能规模很大,也可能是一个园区网络,但其只有一个管理中心。
分级管理模式则是针对企业级、电信级网络建设和管理的实际需求提供的一种分布式管理模式,在这种模式中,网络管理不仅有中心,而且还有各级分中心,管理过程也是实行分级分范围管理,以满足实际运行维护的需求。
系统很容易实现上述两种网络运维管理的组网模式,依据实际需求构架不同的网管结构,两种组网模式分别如下图所示。
集中管理模式
图2系统集中管理示意图
分级管理模式
图3系统分级管理示意图
4主要功能
网络管理
网络拓扑发现
系统能够采用多种算法、迅速搜索整个网络内的所有节点、自动勾画出整个网络的准确物理拓扑图,包括设备间的冗余连接、备份连接、均衡负载连接,网络用
户可以为每条设备间连接加以注释,为每台设备设置中文设备名称,监测网络中每台设备的名称、IP地址、类型、厂商等,并能够自动辨别线路连接类型。
提供拓扑图的编辑功能,可以在已发现的拓扑图上进行编辑修改连接关系。
同时,根据拓扑
所反应的对象,系统呈现给用户的拓扑分为网络拓扑、物理拓扑和子网拓扑。
网络拓扑是根据网络层的角度来分析和展现的,表达了被管网络各个子网之间的连接关系
图4系统网络拓扑图示例
物理拓扑是反映被管网络的实际连接的二层网络拓扑图。
图5系统物理拓扑图示例
子网拓扑是从网络链路层角度进行分析并给出的逻辑拓扑结构。
图6系统子网拓扑图示例
链路状态显示
系统在网络拓扑发现结束后,会自动地画出设备间的连接关系,即链路,同时对链路的连接状态进行监视和管理,可对指定链路设定告警阈值,如链路带宽占用率阈值、链路速率阈值等,在链路连接发生故障或达到告警阈值时时,链路以颜色的改变提醒网络管理人员,并产生相关告警。
用户可直观的从链路提示信息中获取到该链路的基本信息,包括:
该链路的源设备IP地址、源端口、目的设备的IP地址、目的端口以及该链路实时的进出流量、错误率、丢包率等。
如下图所示:
图7系统链路及相关参数显示示例
故障显示
拓扑图上所显示的各被管对象的颜色可以直接反映出其内部被监控对象的状态。
如绿色表示用户所关心的对象正常运行,黄色表示警告信息,红色表示严重错误。
图7系统拓扑图故障显示示例
4.1.4跨地域的多层网络监控
通过采用多层网络管理机制,可以在总部网络管理中心直接调阅各下属单位的网络实时物理网络拓扑结构,各个层次相对独立,上级部门在需要时可以对下级部门进行管理,保证了整个网络管理的统一性和完整性。
性能监测管理
性能监测管理能够帮助网络管理员监测网络及设备的性能,分析和确定网络及设备的性能瓶颈,为网络及设备的性能优化提供可行的参考。
例如可以对指定的端口进行流量监视,从而判断出网络流量瓶颈等问题。
系统能够监视的性能参数包含:
网络设备性能参数:
包括路由器、交换机、防火墙等网络设备的CPU内存使用率,各端口进出流量、丢包率、错包率、带宽使用率、设备响应时间等
信息;
服务器性能参数:
包括各类应用服务器设备的CPU内存、硬盘空间使用率
如应用和服务
等运行信息,以及其上运行的应用程序和相关服务性能信息,的响应时间、系统资源使用情况、自身性能指标、服务可用性等;
数据库性能参数:
包括对各种主流数据库(如ORACLEDB2SybaseSQL
server、Mysql等)的基本参数、文件系统、表空间、碎片、死锁、消耗大cpu的SQL占用长时间的SQL等状态信息。
网络设备监测管理
从各个方面对网络设备进行监测和管理,包括网络设备的可用性、设备性能、
VoIP
流量管理和业务分析等。
网络设备包括各种类型的交换机、路由器、防火墙、网关设备和其他启用了SNM协议的网络设备。
(1)设备基本信息
设备的基本信息包括设备名称、设备类型、设备厂商、设备节点合法性(是否登记为合法设备)、IP状态(是否在线)、是否支持SNMP及设备OID等信息不可修改;允许用户修改的基本信息有:
设备别名、主标识IP、设备等级(是否重要设备)、只读Community可写Community设备描述等。
图9设备基本信息图示
(2)设备流量监测
监测设备端口的数据流量情况,及时发现异常的网络流量。
监视对象包括端口入速率、端口出速率、端口入单播帧速、端口出单播帧速、端口入广播帧速、端口出广播帧速等。
图10监测设备端口的数据流量情况
图11设备端口的实时流量图示
(3)端口丢包率监测
可通过检测端口通讯链路的稳定性、抖动率,及时发现系统隐患,保证业务正常。
图12端口丢包率监测情况
服务器监测管理
为确保企业关键主机、服务器设备的高速、稳定运转,系统可从多个方面对主机服务器的硬件设备及操作系统进行监控管理和性能管理。
系统通过高度集成的服务器管理模块对服务器的CPU内存、硬盘、网卡等硬件的关键运行参数,以及软件和应用程序的进程、服务、端口等的运行状况,对系统日志进行分类扫描查询。
通过数据采集和分析,系统能够及时对影响服务器运行性能的故障事件发送报警,并采取相应的故障处理措施,保证服务器的正常安全运行。
(1)基础性能监测
CPU性能监测
通过线性指标能够了解到服务器系统CPI资源占用情况。
图13服务器CPU资源占用情况
内存使用情况监测
通过线性指标能够了解到服务器系统内存资源占用情况。
图14服务器内存使用情况
磁盘使用情况监测
通过柱状图能够了解到服务器系统磁盘空间占用情况。
图14服务器磁盘使用情况
(2)服务进程监测
服务监测
监控服务的运行及变化情况,用来判断服务是否正常
图15服务运行状态监测图示
进程监控
监控进程中线程的性质,CPU内存的使用情况,分析进程的安全状态。
图16进程运行状态监测图示
数据库监测管理
全面智能的监测各种与数据库应用相关的服务。
对Oracle、SQLServer、Mysql等数据库从应用可用性、系统资源占用和数据库性能指标三个方面提供全面的监测管理策略,确保数据库的运行正常。
可监测数据库的关键参数,如数据库系统设计的文件存储空间、系统资源的使用率、配置情况、数据库当前的各种资源情况、监控数据库进程的状态、进程所占内存空间、可用性等。
(1)数据库基本信息
包括文件系统、碎片、死锁、消耗大cpu的SQL占用长时间的SQL等。
图17数据库基本信息监测图示
2)数据库表空间
数据库表空间的使用信息。
图18数据库表空间监测图示
3)数据库文件I/O
数据库的文件读写信息。
图18数据库文件I/O监测图示
性能实时和历史图表
系统对于所监视设备性能参数,均提供两种性能图表(历史性能图表和实时性能
图表)供用户查看及分析。
图19历史CPI利用率统计示意图
图20实时CP利用率示意图
图20历史端口接收流量示意图
图21实时端口接收流量示意图
系统同时为用户提供了多种性能参数的统计报表,便于网络管理员获悉网络及设备的各种性能情况,以便更有效地评估和优化网络及设备的性能。
详情请参看“报表”章节。
性能预警
对于网络及设备的性能监视是网络管理的一个重要的功能,同时如何做好故障发生前的性能预警,在故障发生前通知网管人员及时予以处理,也是网管性能管理的一个关键环节。
系统的性能管理功能和故障管理功能的结合,可以为网络及设备的性能做相应的预警,在监视某性能参数超过预置的门限时,产生告警,及时地通知网络管理人员。
系统可以针对主机资源参数,如CPU使用率,内存使用率等设定合理的门限值,在性能越界的时候给出性能预警。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 网络 方案