通信设备告警系统的设计与实现毕业设计论文Word格式文档下载.docx
- 文档编号:22844450
- 上传时间:2023-02-05
- 格式:DOCX
- 页数:50
- 大小:2.07MB
通信设备告警系统的设计与实现毕业设计论文Word格式文档下载.docx
《通信设备告警系统的设计与实现毕业设计论文Word格式文档下载.docx》由会员分享,可在线阅读,更多相关《通信设备告警系统的设计与实现毕业设计论文Word格式文档下载.docx(50页珍藏版)》请在冰豆网上搜索。
第1章绪论
1.1系统开发背景
近年来,随着电信业的不断发展,移动通信网络建设越来越受到重视。
通信网络的管理也更加细致和复杂的。
这就要求加强网络管理的建设。
网管系统,指的是管理网络,所以网络的高效是需要建立网络应用的目的的正常操作。
纳入IT网络管理系统的所有对象有网络设备(包括路由器、交换机、防火墙等)、服务器(包括操作系统、CPU、内存、磁盘空间等)、服务应用和业务系统。
完成对上述设备的管理是我们的最终目的。
按照功能划分,网络管理系统可分为性能管理、配置管理、故障管理、安全管理、账务管理五大部分。
绩效管理(PerformanceManagement):
是评估设备的性能,并给出了评估报告管理功能。
其中排除的性能数据,设定性能阀值,支持网络分析和网络规划的集合。
配置及资源管理(ConfigurationManagement):
是对配置网络单元,投入业务,开关业务及网络的状态进行管理。
故障管理(FaultManagement):
运行的电信网络异常及异常设备的安装环境,管理网络状态状态管理。
故障管理包括告警的收集,分析,告警,告警转发。
安全管理(SecurityManagement):
用户管理,权限和网络安全设备。
其中,故障管理(faultmanagement)属于众多功能中最重要最基本的功能一个。
因为随着企业网络规模的扩大,网络设备的增多,网络结构变得错综复杂,企业需要IT部门能够及时的发现系统中发生或即将发生的故障并解决故障,需要能够对网络中有可能出现的故障进行事先判断,减少对企业造成损失。
所以,对故障告警进行研究时非常有必要的。
目前,在网络管理系统的问题。
1.有多家厂商使用多种技术开发网管系统,使网管系统数量众多。
2.网管系统不同,其使用方法也有差异,系统的管理难度变大,白白浪费人力和物力。
3.目前的网管,釆集告警的方式不同,釆集到的信息比较分散,导致告警格式不同,不方便读取处理。
4.缺少对告警集中处理的方法,采集到的告警中有许多无效告警,使维护人员不能及时处理重要告警信息,效率降低。
5.不能做到个性化的监控查询告警,无法判断告警对客户的影响,做到告警的主动式管理。
在这种环境下,运营商需要一个网络监控、维护平台,可以兼容各厂家设备,对故障做到统一监控。
形成多方位、监控、报障、处理、销障的及时、准确、方便的闭环维护流程。
浪潮公司要进军海外移动通讯网管软件市场,迫切的需要一套网管监控软件来完善现有的软件产品线。
目前,虽然公司在开发以前项目中已经有一套网络监控系统,但是在功能方面、技术选型、易集成性、可配置性、灵活构建方面已经不能适应时代发展的需求,需要在总结现有软件系统的经验基础上,结合海外市场的特点进行有针对性的开发新的系统。
整个公司的新网管系统需要用统一的用户和权限配置,实行统一的管理。
其中故障告警系统能够具有更丰富的功能、能够与其它网管产品容易集成、可配置性强,能够快速实现新需求的定制,组件化及具有松稱合的特性,能够灵活的利用已有组建构建新的系统,这就需要技术选择性以及架构方面重新设计,因此新的系统需要能够适应现有以及将来一定时期内需求的发展,应用先进的设计理念来重新架构,能够满足海外移动通讯网管市场的需要。
1.2国内外研究现状
1.2.1国内研究现状
国内有很多公司、企业和高校做基站告警信息管理方面的研究和工作,但就目前的情形来看主要分为软件和硬件两个大方向。
在软件应用方向主要围绕告警信息的三个方面:
(1)告警信息采集
主要是通过TCP/IP协议技术或网络接口技术下从所述网络管理系统收集的报警信息收集报警信息。
告警采集有三种常见方式,即主动获取、定时轮询和订购,简介如下。
①主动获取:
主动获取是通过一次网络连接如利用Telnet、FTP或TCP/IP协议等从网管系统获取告警信息。
主动获取需要用户维护彼此的心跳违接。
②定时轮询:
同样的时间主动询问每一个采集,可以主动获得归为一类。
③订购:
消息订购也被称作异步采in,是利用网管接口技术,例如SyslogI2、SNMPI3’41和C0RBA151等采集告警信息。
在3G网络系统中,如华为和中兴提供的北向接口,大部分通过CORBA(CommonObjectRequestBrokerArchitecture)实现,这种方式获取的告警信息和网管系统上的保持同步,所以实吋性较好。
主动获取或定时轮询通过运营商或设备厂商提供的网元IP、.登陆账号、密码和端1-1等信息连接网管系统,并将网管返回的告警信息保存即可。
(2)告警信息处理
告警信息处理分为预处理和数据分析两个部分。
预处理足将采集到的告警信息根据告警关键字或文件格式解析成用户能够识别和区分的分段格式,存入数据库;
数据分析则是利用一些数学方法、模型和算法等针对告替信息的某个方而做深入的分析和研究,得出潜在的关联性规则或实现故障定位等。
(3)告警信息管理
告警信息的管理又称作信息显示层,主要足根据业务需要完成古齊信总的资询、统计分析和导出报表等工作,并通过不同的方式将这些工作结果反馈给工作人W。
目前,主要有三种常见的现方式:
①利用VisualC++、java或VisualBasic等语言进行开发的C/S结构。
这种结构的呈现方式比较直观,操作容易,速度快,开发成本低。
这种方式对数据操作(插入、更新和删除)S大的移动公来说是个不错的选择,但;
要客户安装软件,如来软件也新则需大面积的替换,维护成本高且不容易部署。
②利用ASP、JSP、HTML、AJAX等语言间或基于MVC框架进行开发的B/S结构。
利用B/S的好处是不用客户安装软件,只需在服务端更新,客户端的所有界面就都保持最新状态。
③其他方式,如Excel、PowerPoint样式等,额外需要如做数据处理、统计分析等功能之用,这些主要是为了满足需要而自行选择的呈现方式。
1.2.2国外研究现状
国外有很多公司已经开发了告警系统。
他们的特点如下所示。
1.SiteViewECC(游龙)。
SiteViewECC故障管理系统管理各层次网络的设备、网络自身和具体业务所产生的故障,帮助管理员收集来自网络的所有方面统计信息和告警分析和故障信息,准确预警,定位和解决网络故障。
产品特点如下。
(1)跨平台全面监控。
内置1000多种不同类别设备专用的监测器,能对各种操作对象进行深层次的监测管理。
(2)直观的拓扑视图。
有良好的结合与Visio,可能反映了网络基础设施的连接性,同时反射的动作流程,数据库,中间件的应用。
(3)实时预警和定位。
故障管理功能强大,处理经验能够存储在知识库中以便以后使用,也可选择多种告警的前转方式。
(4)完善的分析报告。
采用最新的Portal技术,报表形式丰富。
(5)报警及时、报告丰富。
能提供短信、声音、邮件、脚本等多种警报形式,而且可以根据用户需求,自动生成各种界面美观的图形、报表分析报告。
2.Cacti0Cacti是一套网络流量监测图形分析工具,它主要通过snmpget来获取数据,使用RRDtool绘画图形,也可外挂Scripts及加上Templates来作出各式各样的监控图,它的缺点是功能较少,主要实现性能管理和故障提醒功能等。
在Cacti系统中并不存在告警数据这个概念,而是指超过所设阀值的实时采集到的性能数据。
被存储在实时位置告警收集的性能数据的存储位置的数据。
3.HPOpenview软件(C/S结构)是一个综合的故障管理平台,0V0采用Manager/Agent结构,0V0能够自动收集网络中的各种系统事件,并集中到Manager端的事件控制台中然后进行处理,0V0同时提供网络设备、操作系统、应用软件的性能监控。
它的优点是具有管理大型网络的能力,能够在多厂商平台设备、多操作系统的复杂环境下运行。
需要有功能很大、简单容易操作的二次开发能力。
缺点是系统太过于复杂,分不清服务故障与设备故障,分不清网络设备之间的关系。
4.IBMNetcool(B/S结构)。
提供超过300种探针深入细则文件,打开规则可定做;
事件压缩,灵活的定制相关的处理,灵活的报警重新定义;
基于拓扑的关联分析。
1.3解决的主要问题
通信网络设备告警系统是建立在浪潮公司网管系统上的子系统,该系统通过与本公司的权限系统、性能管理系统、配置管理系统和工单系统结合,来实现对网络设备产生故障的告警处理,并能够把告警信息进行整理优化,将其通过工单、短信等方式发送给故障维修人员,使其能够正确迅速的判断出故障类型、地点、严重程度,并及时修复。
在需求分析方面,注意三大核心问题:
不丢告警、精炼告警、快速处理告警。
要在充分理解告警产生原因、告警之间关系的基础上,获取用户需求和业务流程,需求分为功能需求和非功能需求。
总结思路,通过分析和设计的发展思路。
在设计方面,考虑以上的网络设备告警的数量,在故障现场条件的特征的每个大的差别,设计,以满足系统的可维护性,灵活性和可扩展性。
在实现,主要是为了满足正确的技术选择,该接口可以是互动的。
1.4本文的主要工作
本人参与了通信网络设备告警系统的需求分析、架构设计、详细设计、系统实现及部分测试。
主要包括实时告警监控模块、概况监控模块、告警查询模块、过滤器配置模块和告警关联模块。
本文的主要工作有:
1.确定系统的功能需求。
并通过对例图的使用来分析各个模块的功能需求。
2.提出系统的设计方案。
该系统采用B/S架构。
使用MVCJT-头发模型采用半自动化的对象关系映射iBATIS的持久层的Web应用服务层,数据服务层使用orade。
设计该系统的的接口和数据流图表示的功能结构。
3.每个模块的系统的详细设计的功能。
结合类图,序列图,活动图,该模型结构的数据库表结构图的UML图和详细设计每个模块的数据库。
4.最终完成系统实现。
实现了对告警的过滤、关联、展示、前转派发。
合并的采集分析模块系统,能够提醒的各种不同的设备的厂商统一处理,从而简化了操作者的工作。
完整的系统测试任务。
第2章系统需求分析
“该系统必须做什么”的需求分析是系统的研究。
它要做的工作是通过与客户讨论、在现场分析现状,从而深入了解系统所需的功能和性能,确定系统设计的限制和系统同其它系统元素的接口细节。
2.1系统概述
通信网络设备告警系统是浪潮公司海外事业部为了拓展海外市场而设计的故障告警系统的英文新版本。
在整个公司的网络管理系统中,该系统与性能管理系统、网元配置管理系统、工单管理系统等其他系统相结合,共同保障通信网络的正常运行。
目的是监控各个网络设备的故障,并精简出有价值的故障告警,通知相关维修人员及时处理故障,维持正常运行。
与旧版本相比,新系统采用B/S结构。
能够处理不同厂商、不同电信网络设备上的告警,使用范围广。
同时,各种配置都能够简单操作,减少了之前配置的复杂度和对人员经验的要求。
希望达到的目标是丰富的监控手段,智能的业务关联,完美的Web用户体验,高效的配置管理。
首先,来解释下系统中所用的关键术语。
故障,是设备发生异常时自身产生的,它使得通信设备不能完成规定的功能,影响客户的正常使用。
告警,是移动通讯网络中各网络元素在服务过程中发生异常时所报告的异常信息,通信模块、电源、存储、电路、风扇等部件不正常都可能是产生告警的原因。
告警包括历史告警和活动告警。
对活动告警的监控是为了对实时告警进行处理。
对历史告警的监控是为了统计报表,分析故障发生率等。
只有在某些情况下得到满足,才能反映故障报警。
反映相关的故障报警数。
因此,关联到线分析可以基于一系列警告报警,找到真正的设备故障。
监控对象,如下。
1.交换子系统:
MSC等设备。
2.基站子系统:
基站控制器(BSC)、基站(BTS)、小区(CELL)。
3.中继路由:
中继群等一系列设备。
4.厂家操作维护中心(OMC)。
5.GPRS系统
6.移动智网设备
网络设备故障实时告警系统是为了能及时发现网络设备上的各种故障,或者预测即将发生的故障,及时通知到相关人员,使其能及时准确的修复故障,保障整个通信网络正常工作而设计的。
因为是针对海外市场设计,整个系统页面为英文。
电信网络管理系统采用B/S架构,以应用服务器、WEB服务器和数据库服务器进行部署,用户只需通过WEB浏览器进行网络管理的一切操作。
为了协助监控人员进行网络操作和管理,系统提供了监控报表、监控查询、各种规则配置页面,同时,设置工单和短信派发形式派发给维修人员。
整个过程可以实现告警的实时监控和操作的高效性。
流程图如图2-1。
图2-1告警处理流程图
1.首先,通过采集调度系统可以实时的采集网络告警,这些采集多是从OMC侧进行采集,资源采集告警信息在网络设备上获取,少数OMC管理不到的网元可以直连网元进行告警的采集。
此系统告警采集支持众多厂商的多种接口方式,例如CORBA,Q3/CMIP,SNMP。
覆盖了不同的网络类型,如PSTN,CDMA,GSM,3Q,IP。
2.收集到的报警信息被存储在消息队列中。
由于采集出来的是原始信息,有的是二进制格式,有的是xml格式,无法读取有价值信息,所以需对其解析,使之成为系统能看懂的标准数据文件。
有些告警是没有作用的告警,这种告警需要进行屏蔽。
3.解析屏蔽后的信息再存放在消息队列中。
由于不同厂商不同设备采集出信息的格式不同,要对其进行归一化。
根据不同的用户,其工作重心不一样,对告警类型和级别进行重定义,是按照可以许多种条件和各种不同条件的组合。
然后设置与其关联的配置信息。
4.处理过的信息再次被放置在消息队列中。
然后,相关这些报警进行分析。
可以根据不同的关联规则,以特定种类的报警关联的配置。
协会类型的父子报警,报警和衍生品同源报警。
这样,当采集到很多告警时,根据它们之间的关系,就能智能判断出最重要的告警是哪个,方便操作人员处理告警。
5.做好告警的分析处理后,可以将其展现在前台界面上,进行告警的监控和查询,也可以进行告警的派发。
派发方式有工单和短信两种。
它假设已经有了采集、解析、归一化等过程,直接假设告警数据从数据库中获取。
从而只需完成存在后面的告警处理过程就可以了。
2.2业务需求分析
2.2.1移动网络设备监控系统组成
目前,某市移动网络设备监控系统的工作流程和组成主要分为实网设备、监控中心和维护中心三个部分。
①实网设备:
由GSM和TD-SCDMA两套移动通信网络系统组成。
GSM系统中,BSC数量为63个,基站数量大约3000个,小区数量大约9000个,覆盖市里和周边的所有区域。
TD-SCDMA系统中,RNC数量为15个,基站数量大约500个,小区数量大约1700个,仅覆盖全市的热点区域。
②监控中心:
用于监控GSM和TD-SCDMA网络中的各种设备产生的告警信息。
③维护中心:
实现对有故障基站的维修和基站设备的日常维护,例如配电和自然灾害,抢修等。
2.2.2告警监控系统现状
基于移动网络设备监控系统工作流程,基站告警监控系统的一期监控软件己经运行一年多,其具备的功能为:
①BTS设备告警的监控:
监控GSM网络中BTS设备产生的告警信息,告警信息的采集周期为SMins。
②告瞥倍息的存储:
将2万条/天的告警信息存储在MicrosoftSQLServer2008数据库中,保留6个月,共360万条。
③故障信息的短信通知:
在基站设备出现停站故障吋,通过短信实时发送到监控和维护人员手机中。
2.2.3告瞥监控系统新任务
随着移动业务的发展,对告警综合管理系统提出了新的要求,主要包括以下方面:
①监控GSM网络中BSC设备产生的告警和故障信息。
②监控TD-SCDMA网络中的RNC设备产生的告警和故障信息。
③实现告警的智能化分析。
④实现停站告警的自动通知,提高维护及修理的效率。
2.3功能性需求
告警管理在通信网络的运营维护中处理核心地位,网络维护人员需要实时监控各种告警,提取出关键的告警,查找到根本原因,找到发生故障的设备,并及时维修,以保持通信网络的正常运行。
因此,客户对于告警的展现和告警的提取有很高的要求。
2.3.1实时告警监控
实时告警监控能可以详细描述为显示当的前产生的告警。
能够对告警进行操作。
告警展示需求如下。
1.监控窗口能够展现实时告警,告警默认顺序为最新告警排在最前面。
2.展示告警的详细字段,字段可以添加、删除、调换位置。
3.按照一个或多个字段的顺序排列,可分为升序和降序。
4.告警统计面板,显示当前监控窗口中的各级别告警数量。
5.告警关联关系可以通过监控窗口显示。
告警操作需求如下。
1.可以选中并导出告警。
2.当选择某一告警时,能够将告警的详细信息展现出来。
如告警各字段内容、告警对应网元信息、告警处理流程信息、关联告警列表、关联工单信息、关联SME信息、关联维护人信息等。
3.支持告警锁定、解锁。
锁定即将关注的告警锁定在监控列表的最前列。
解锁即将其回复到应在的列表位置。
4.支持告警过滤。
包括先进的过滤,过滤速度快,过滤模板设置,二次过滤。
其中,先进的过滤器是用户自定义的过滤器。
快速过滤系统过滤器的候选设置过滤器。
两个滤波器可以组合形成自己的过滤器过滤报警。
5.过滤模板。
通常,您可以使用过滤器,将其保存为模板。
当所选择的过滤器模板,模板会自动过滤启用。
6.二次过滤。
支持过滤以及二次过滤,即用户可以进行再次过滤。
监控窗口点击Title进行二次过滤,类似excel的过滤功能
7.清屏。
之前的告警可能已没有监控价值,可以将整个告警列表删除,当产生新告警时,会重新在列表中显示。
8.告警确认及反确认。
确认一个告警,即表示此用户对此告警进行跟踪,不让其他操作人员同时对其进行操作。
进行告警确认时,数据库中自动存储确认人员和确认时间,并在告警列表中显示此告警的确认状态。
9.告警清除。
告警清除即手动对无用的告警进行清除,此告警不会再在列表中显示,但能通过告警查询来查询到。
10.告警前转。
即将告警信息以短信或工单形式发送给维修人员用于处理。
短信可以用短信模板。
工单需要与工单系统进行关联。
图2-2实时告警监控的例子图
2.3.2概况监控
功能详细描述:
用户有时不需要监控所有告警,只需观察自己所关注的告警。
概况监控就是设置监控条件,使用户能监控自己关心的告警。
在整个公司的权限系统中,用户被设定为不同的权限,同时被设定成在不同的域中,不同区域看到的告警不一样,用户只能看到自己所在域内的告警。
1.概况监控配置:
支持对概况监控专题的添加、修改、删除。
配置概况监控的条件有:
监控域、行条件、行展示值、列展条件和列展示值。
都可多选。
2.概况监控展示。
(1)多个概况监控以树形结构组织(加上域的判断,满足域配置的时候显示)。
每个概况监控包含两部分:
概况信息展示(按厂商分布、按级别分布、按网元分布等的告警数量)和告警展示窗口(展示符合上述条件的告警)。
(2)告警信息展示窗口,显示出的是告警数量,此窗口数据可设定多少秒更新一次,如30秒,如果告警数量多于30秒前,应显示为红色。
如果小于30秒前,应为绿色。
数量不变,显示为白色。
(3)点击概况信息展示窗口中的数字可以关联到告警展示窗口。
如果是点击一行,就展示此行条件下的告警,如果是点击某个节点上的数字,显示符合此节点条件的告警。
(4)点击概况信息展示的内容可将此查询条件显示在左下方的窗口。
(5)告警展示窗口中可做的操作大致与实时告警监控中窗口的功能相同,工具栏上增加“查看所有告警”功能,即展示用户所在域内的所有告警,与监控专题无关。
概况监控用例图如图2-3。
图2-3概况监控用例图
2.3.3告警关联规则设置
系统能够提供基本的告警关联性规则或由用户定义关联规则,对入库的告警信息按规则进行相应的告警相关性分析。
按照设定的告警之间的关联规则,系统可推测出新来的一组告警中的决定性告警,根据它定位故障的根源原因,使用户能够查到故障所影响的设备和链路信息,和其影响的业务。
所有相关告警可以通过决定性告警可以链接查询到。
关联告警的类型如下。
1.主次告警:
由于A告警的发生,在一定时间内产生了B、C等告警,那么A、B、C等是主次关系。
其中,A告警是主要的告警(根本原因的告警),B、C等属于次要告警。
2.同源告警:
由于某种故障的发生,产生了B、C等告警,那么B、C告警属于同源关系。
需要衍生出代表故障根源的A告警。
3.频次告警:
当一条告警来到后不立即展现,当这种告警又发生了一定门限次数后,将此告警上报。
原来的告警都是这条告警的子告警。
对告警进行关联配置,就是设定告警之间的关系,使之成为一个规则。
功能详细描述。
1.支持用户对规则的添加,修改,删除,启动和停止操作。
包括规则基本条件设置和规则告警条件设置。
规则基本条件设置包括规则名称、规则生效时间段、规则是否启用。
规则告警条件设置表示满足什么样条件的告警才进入此规则。
规则允许设置多种动作(Action)。
Action条件包括:
告警发生后立即执行或告警发生N分钟之后执行,N可配置。
可选的Action有:
自动发送短信、自动派单、告警抑制、告警延时上报、入库不前转。
2.支持用户查询的规则。
您可以根据查询的名称和关联规则等规定类型的规则设定的时间。
关联规则的用例图如下图2-4示:
图2-4关联规则用例图
2.4非功能性需求
2.4.1可靠性
网络设备都是24小时工作,所以此故障监控系统也需支持7x24的运行模式,系统性能应该支持高并发条件下的操作功能和快速的响应。
本系统应该具备的非功能性指标包括一下几条。
1.系统能够通过原有硬件升级、增加/更换硬件的方式实现系统扩容。
2.系统能够对程序、配置数据进行自动备份与手动恢复,当系统损坏时,能够在要求时间内恢复系统和数据。
支持定义系统备份具有三天的周期。
3.该系统可以
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 通信 设备 告警 系统 设计 实现 毕业设计 论文