IT运维技术方案设计.docx
- 文档编号:27803596
- 上传时间:2023-07-05
- 格式:DOCX
- 页数:48
- 大小:4.80MB
IT运维技术方案设计.docx
《IT运维技术方案设计.docx》由会员分享,可在线阅读,更多相关《IT运维技术方案设计.docx(48页珍藏版)》请在冰豆网上搜索。
IT运维技术方案设计
IT运维综合监管系统软件
技术方案
索科维尔(北京)软件系统有限公司
2015年08月03日
总体设计
1.1设计原则
系统设计要遵循以下原则:
✓实用性和易用性的原则
作为一个应用系统,实用性是直接影响系统的运行效果和生命力的最重要因素,也是一个严谨的系统开发者要无条件遵循的原则。
系统建设必须充分考虑使用人员的特点和习惯设计软件系统及用户的实际需求。
系统应注重成果的可应用性和可操作性。
以满足用户需求为目标,方便用户使用为基本原则。
✓先进性和创新性原则
在技术上,采用当前先进而且成熟的技术,使得设计更加合理、更为先进,同时借鉴成熟的经验。
选用的软件平台不仅是现阶段成熟的先进产品,而且是同类产品的主流,符合今后的发展方向;在软件开发思想上,严格按照软件工程的标准和面向对象的理论来设计,管理和开发,保证系统开发的高起点。
✓一致性和完整性原则
本项目涉及到数据采集、数据入库、数据查询等功能,为使系统协调一致的开发和运行,整个系统所有数据采用统一的编码、统一的数据存储格式、统一的用户界面。
✓标准化和规范化原则
标准化、规范性是一个信息系统建设的基础,也是系统与其他系统兼容和进一步扩充的根本保证。
高性能和稳定性原则
在系统设计、开发和应用时,将从系统结构、技术措施、软硬件平台、技术服务和维护相应能力等方面综合考虑,确保系统较高的性能和较低的故障率。
系统建成后能长期运行,数据库的维护具有专门的更新途径和配套的业务流程。
✓开放性和可扩充性原则
系统设计和实现过程中需要预留与第三方系统的接口,对外发布系统的接口标准与措施。
✓安全性和可靠性原则
系统的安全性是一个优秀系统的必要待征,是整个系统建设的关键。
本系统能够对系统主要的信息实行备份,以保证系统在出现异常情况下的补救措施。
✓经济和时效性原则
系统建设尽可能利用现有的资源条件(软件、硬件、数据和人员),按“统筹规划、分步实施”的原则在规定的时间内高质量、高效率实现系统建设目标。
1.2开发环境
系统开发基于WindowsVisualStudio2010,采用C#/WCF/WPF等技术进行开发。
系统运行环境为Windows7/2003及以上版本;.Net3.5框架及以上版本;支持主流的Oracle数据库。
1.3总体架构
IT运维综合监管系统的总体架构如下所示:
图表1:
系统架构
数据层
数据层负责管理各种类型数据的获取、存储和访问,包括机房环境设备、网络设备、服务器、第三方系统对接等。
数据存储采用分布式,中心数据库负责元数据、资源信息、网络拓扑等信息的存储,为了降低中心数据库的访问压力,系统支持将采样数据存储在单独的数据库中。
设备访问控制接口支持对主流环境设备、网络设备等的远程监控及性能数据采集,同时也支持与第三方系统的对接;通用数据访问接口支持对主流数据库的访问,包括Oracle、SQLServer等,也支持数据文件的读写。
业务层对数据层的访问通过微软的WCF技术实现,同时支持数据加密和压缩机制。
业务层
业务层负责实现用户业务需求,包括资源管理、机房管理、网络管理、维护管理、环境设备管理、告警管理、三维仿真、告警策略等。
这一层也包含整个系统平台的组织与管理机制,如插件管理、用户管理、权限管理、索引服务等。
同时,系统支持事件服务组件,实现后台服务对前端应用的异步消息通知机制。
展现层
展现层支持C/S客户端软件。
客户端软件利用C/S程序的技术优势,实现系统的所有界面展现、控制和管理功能。
软件采用仿Office2007界面风格,方便用户熟悉和操作使用。
客户端基于微软的WPF技术实现。
通过三维机房仿真和交互,在现有资产管理数据库的基础上,以三维仿真方式展现数据中心的运行情况,实现IT设备可视化管理和服务器等设备物理位置的精确定位。
通过三维仿真方式实现对机房、IT设备的部署情况的直观展示。
系统能够实现机房设备的360度视角手动调整。
基于Windows平台及.Net框架,利用微软成熟的WPF三维建模技术进行开发,开发语言为C#。
1.4系统部署
根据用户需求,应用服务、监控服务将部署在Windows2008或更高系统平台上,并安装.Net3.5或.Net4.0框架。
利用数据库服务器(可利旧)进行数据的永久存储和管理。
客户端软件安装在用户的Windows7操作系统上。
系统保证在如下配置的硬件上能长期稳定运行。
服务器端:
一般服务器,2颗IntelXeon2.0GHzCPU,8G内存,千兆网卡。
客户端:
台式或笔记本电脑,4G内存,独立显卡,百兆网卡。
图表2:
系统部署
第2章数据库设计
2.1数据内容设计
根据信息系统运维管理平台需求,结合未来扩展需要,建立一套较完善的信息系统运维管理平台数据体系。
2.1.1数据内容分类设计
与信息系统运维管理平台相关的数据内容主要包括环境设备、网络设备、软件系统的属性数据、实时监控数据和告警数据等数据,数据内容如下:
1.网络设备的属性数据
网络设备的属性数据包括:
Ø静态属性数据
包括设备名称、资产编号、购买日期、产品型号、生产厂家、使用人、固件版本号、IP地址、物理地址等。
这些信息一部分可以自动获得,其余需要用户手工录入。
Ø三维建模数据
包括设备的长、宽、高,所属区域,所属机房、前后面板图片等。
系统利用这些数据动态生成无线网络设备的三维模型,并显示在三维视图的指定空间位置。
2.软件系统的属性数据
软件系统的属性数据包括:
Ø静态属性数据
包括软件系统名称、资产编号、购买日期、软件厂家、版本号、许可编号、所属设备等。
这些信息一部分可以自动获得,其余需要用户手工录入。
1、实时监控数据
包括网络设备的运行时间、数据流量、连接设备信息、CPU利用率、内存利用率等,软件系统的CPU利用率、硬盘利用率、内存利用率、运行时间、运行状态等。
2、告警数据
包括告警类型、告警时间、告警级别、告警内容、告警设备编号等。
2.1.2数据量分析
数据量的分析是建立数据库系统、硬件支持平台、网络交换平台的主要依据。
信息系统运维管理平台的主要数据量来源于实时监控。
按照5000个设备和软件系统的监控量,每分钟采样一次,每次采样数据量150字节估算,每天的数据在1GB左右。
考虑到设备和软件系统的监控数据不需要长期存储,假设存储时间为三个月,则总数据量在100GB左右。
超过三个月的数据自动清除。
因此,普通的500GB硬盘足够满足存储要求。
2.2元数据管理设计
为了实现信息系统运维管理平台的属性管理的灵活性和可扩充性,在系统设计上采用了元数据的概念。
所有设备的类型定义、属性标识、可进行的操作等信息均存储在数据库中。
系统根据元数据自动生成管理界面中的元素及可进行的操作选项。
这种设计极大的增加了系统的灵活性。
例如,增加一个设备属性字段,只需要在数据库的属性表中增加一个字段,不需要修改任何代码。
2.3数据采集与维护设计
数据采集由专门的监控服务进行采集。
采集到的数据先进行告警检测,然后入库。
检测到告警时会产生告警事件并入库。
同一个告警事件重复发生时,系统更新告警时间,不会重复发送告警通知。
告警事件会长期保存。
考虑到对被监控设备及软件系统的影响,采集时间间隔不易过短。
综合监控效果及性能影响等因素,设置为1分钟比较合适。
用户可以自行修改时间间隔配置。
除了实时监控数据外,其它的数据所需磁盘容量有限,主要考虑的是数据表的定义。
第3章软件系统设计
3.1系统概述
我公司的IT运维综合监管系统软件是一套先进的IT运维管理系统,可以对XXX大厦(上海)进行统一管理,包括IT资源管理、IT机房的三维仿真交互、网络管理、监控管理、维护管理、统计分析、权限管理等。
通过该系统,可以实现对机房的精细化、可视化、标准化、实时化、透明化管理,有效提升XXXIT信息化的管理水平,助力XXXIT信息化的建设,提升XXX节能减排的水平,实现XXX绿色机房的目标。
本系统采用C/S的方式。
系统后台服务基于Windows2008Server运行,.Net3.5框架及以上版本;数据库支持Oracle10G,采用C#开发。
系统C/S客户端基于Windows7运行,采用C#开发。
系统基于WindowsVisualStudio2010进行开发,采用C#/WCF/WPF等技术进行开发。
系统开发遵循CMMI及ISO9001相关软件流程。
考虑到未来还可能要增加其它的系统模块,因此应用系统的开发设计必须基于项目运行环境要求并充分考虑可扩展性。
3.2主要技术应用
3.2.1基于C/S的架构
C/S结构,即大家熟知的客户机和服务器结构。
它是软件系统体系结构,通过它可以充分利用两端硬件环境的优势,将任务合理分配到Client端和Server端来实现,降低了系统的通讯开销。
目前大多数应用软件系统都是Client/Server形式的两层结构,由于现在的软件应用系统正在向分布式的Web应用发展,Web和Client/Server应用都可以进行同样的业务处理,应用不同的模块共享逻辑组件;因此,内部的和外部的用户都可以访问新的和现有的应用系统,通过现有应用系统中的逻辑可以扩展出新的应用系统。
系统采用C/S架构,能够对外提供数据接口,同时能够通过SNMPTRAP发出事件告警信息。
3.2.2基于C/S架构的三维仿真机房展示、管理功能
三维是指在平面二维系中又加入了一个方向向量构成的空间系。
三维既是坐标轴的三个轴,即x轴、y轴、z轴,其中x表示左右空间,y表示上下空间,z表示前后空间,这样就形成了人的视觉立体感。
三维建模技术
WPF缩写为WindowsPresentationFoundation的缩写,其原来代号为“Avalon”。
WPF是微软新一代图形系统,运行在.NETFramework3.0架构下,为用户界面、2D/3D图形、文档和媒体提供了统一的描述和操作方法。
基于DirectX9/10技术的WPF不仅带来了前所未有的3D界面,而且其图形向量渲染引擎也大大改进了传统的2D界面,比如Vista中的半透明效果的窗体等都得益于WPF。
WPF相对于Windows客户端的开发来说,向前跨出了巨大的一步,它提供了超丰富的.NETUI框架,集成了矢量图形,丰富的流动文字支持flowtextsupport,3D视觉效果和强大无比的控件模型框架。
基于WPF技术,对3D机房进行建模,其中包括3D模型库的设计开发、3D对象抽象类的构建、3D对象事件处理机制的设计开发、对象数据抽象类的构建等。
根据不同类型IT设备的特性,进行3D建模,除3D外形外,关联前后面板图片,同时关联事件处理方法,如显示属性、复制粘贴、旋转、3D定位等功能。
一个好的系统,友好便捷的用户界面是非常重要的。
由于企业的IT资源天生所具有的复杂特性,如何将IT资源展现给用户是许多软件企业一直在探寻的。
3D机房的概念,早在2006年就由微软提出来了。
当时微软为了推广其WPF三维呈现技术,开发了一个演示版的3D机房管理系统,在当时引起来广泛的关注。
然而,由于相关技术的不成熟,到目前为止,还没有一款类似的产品出现。
以3D机房的形式来管理IT资源,并不仅仅是锦上添花。
通过对真实机房的三维仿真,可以对整个机房的布局一目了然;在三维机房中,可以对机房布局进行规划,从而达到合理利用机房空间的效果;通过在三维机房中整合各种信息,使得使用人员能够以最快捷的方式获取各类信息,如设备信息、告警信息等;通过操作模拟设备来实现对IT设备及系统的信息管理,如日常维护、属性变更、日常巡检等;通过3D定位功能,可以随时随地准确快捷地在三维机房中定位某个设备,真正解决了很多企业用户面临的设备定位问题。
机房管理人员的主要日常工作是对机房的巡查。
通常的做法是IT管理人员每天按时进入机房,对机房内部设备及环境进行巡视。
这种巡查方法的缺点是耗费人力,而且达不到很好的巡查效果,往往发现不了潜在的一些问题。
通过机房三维仿真、大屏幕自动展示、视频图像结合、设备环境监控信息集成,可以保证IT管理人员在大屏幕面前就能够掌握机房内部所有细节,实现了足不出户,全面掌控机房的目的!
系统通过全屏自动播放的方式,逐一显示3D机房内各个设备的实时信息,如设备名称、CPU利用率、硬盘利用率、内存利用率等。
同时,将环境温湿度信息、各种告警信息叠加到3D显示界面上,使IT管理人员不需要置身机房,就能够实时获取IT机房的全貌。
用户可以通过系统界面来定义展示方案,包括哪些机房的哪些设备参与展示,展示方式等。
图表3:
三维机房仿真
3.2.3分布式监控与自动负载均衡
在70年代计算机网络出现之前,信息处理采用集中式处理或分散式处理。
集中式处理把各信息包括远程信息都传输到统一的信息处理系统中进行处理。
采用集中式处理可以达到设备利用率高的目的,并能保证被处理信息的完整性和有效性。
一个下设许多工厂的公司采用集中式信息处理可以得到整个公司的最佳结果,不像各工厂分散处理那样,考虑的只是每个工厂的优化。
集中处理需要的设备比分散处理所用的设备复杂得多,但它可为大部分工厂所共享,避免设备的重复。
分散式处理的最大优点是简单,能就地提取数据、变换格式并进行加工,最后输出决定。
要把这些工作集中于统一的程序中是非常困难和代价昂贵的。
分散程度越大,满足部门的特殊信息处理要求的可能性也越大,但统一和控制信息流的困难也越大。
由于要求在数据产生场所进行局部处理的数据比重不断增加,要求应答时间缩短和计算机的处理能力不可能无限增强等原因,常把分散设置的各计算机组合成计算机网,形成分布式处理系统。
这样既能克服分散处理的缺点,又可避免集中的困难。
70年代以来,随着计算机日益广泛地应用于各个领域,全国性与国际性的计算机网相继出现,这种信息处理系统的功能和结构也越来越复杂。
分布式处理将装备从集中的处理系统中分散开来,便能直接从信息源取得信息并进行相互协调的处理。
由于IT机房的设备多、类型复杂、监控指标多等特点,要求信息系统运维管理平台能够实时并发处理大量的监控数据。
这些指标包括服务器、交换机、路由器、防火墙、KVM、磁盘阵列等。
要实现实时并发处理大量的监控指标,需要在信息系统运维管理平台的架构设计上充分采用分布式监控和自动负载均衡技术。
系统由应用服务、监控服务、代理程序、客户端构成,其中监控服务负责监控各种指标。
为了应对海量的监控数据,监控服务理论上可以分布式部署任意多个实例。
每个监控服务实例可以配置监控指标。
比如,监控服务实例A可以监控服务器性能指标,监控服务实例B可以监控数据库和中间件性能指标,而监控服务C可以监控机房的环境温湿度等信息。
另外,为了减少对中心数据库的压力,每个监控服务在本地缓存一定时间的监控数据。
客户端在请求实时监控数据时可以从相应的监控服务实例获取,这样大大减轻了对应用服务和后台数据库的访问压力。
同时,也使系统对网络带宽的占用降到最低。
XXX(上海)的软硬件环境是动态变化的,这就要求运维系统能够自动适应这种变化。
例如,增加了一台服务器,运维系统可以自动将其分配给某个监控服务实例。
如果某个监控服务实例退出,系统会自动将该监控服务实例负责监控的指标转移到其它监控服务实例上,实现平滑切换。
在批量购进新资产后,可以通过增加监控服务实例的方式自动进行负载均衡,避免出现某一个监控服务实例负担过重,影响监控任务的情况发生。
IT运维综合监管系统体系结构是一种C/S模式。
其中,基于C/S的客户端软件;服务层包含负责性能监控的监控服务以及应用服务。
应用服务是系统的核心,负责数据库的连接管理、元数据的管理、各种用户的权限控制,事件通道、监控服务的负载均衡调度管理等。
数据层采用Oracle10g或以上,为整套系统提供永久数据存储服务,另外还有若干配置文件,用于系统配置参数的存储以及网络设备特征数据的存储。
系统包括IT资源管理、环境监控、设备监控、网络管理、系统管理、三维机房仿真视图及交互、三维快速定位、性能监控、事件管理、配置管理、统计分析、日志管理、用户管理、权限管理等,实现了系统的主要功能。
技术框架采用微软的.Net框架,远程对象访问采用微软的WCF技术,三维技术基于微软的WPF技术。
系统支持两种数据接口:
WCF远程对象接口和标准数据接口。
WCF远程对象接口为内部接口,用于客户端与应用服务、监控服务与应用服务、WEB服务与应用服务等之间的远程过程调用。
标准数据接口基于TCP/IP连接,使用Socket进行数据交换。
数据请求包和响应包采用XML格式,实现了平台无关性。
3.3系统功能列表
根据用户需求,IT运维综合监管系统的基本功能列表如下:
功能模块
功能描述
是否支持
备注
统一监控管理系统平台
提供统一的IT运维综合监管系统平台,使机房管理人员通过一个系统即可以对机房进行全面的管理。
支持
系统界面仿MSOffice2007,操作极为便利。
资源管理
提供资产容器、IT设备、环境设备、软件、配件等资产属性信息的基本信息、基本配置、监控配置、归属信息等的管理;支持资源导入、导出操作。
支持
支持与第三方系统对接,实现资源共享
监控管理
支持动环系统、服务器、网络设备、软件系统、操作系统、数据库、中间件等的监控。
支持
支持与第三方动环监控软件对接,集成告警信息;华为语音交换机监控。
三维机房管理
支持多个三维仿真机房建设;支持三维交互;支持仿真设备方位旋转;支持仿真机柜、地板的显示隐藏操作;支持仿真机房旋转展示、俯视图展示、远近方位拖动等;支持三维设备定位;支持各种监控信息的整合;支持光标移动到设备告警信息展示;
支持
维护管理
强大的数据维护管理功能,完整的记录机房维护人员对机房内任何一台设备的属性变更和设备维护记录,并提供查询,打印,导出维护记录;并支持维护费用管理,合同管理。
支持
统计分析
支持设备、系统的多维度统计分析;支持多视图;报表打印输出;
支持
根据用户需求支持定制报表
网络管理
网络拓扑;交换机面板仿真;交换机脚本管理;流量监控;网段管理等;自动发现网络设备(PING等);阈值告警;IP地址管理;
支持
系统管理
支持用户管理、角色管理、权限管理等。
支持
要求指定单位只能管理归属于本单位的设备
3.4系统功能划分
3.4.1统一的IT运维综合管理系统平台
根据XXX大厦(上海)的实际需求,我公司基于已有IT运维系统进行二次开发和功能扩展,在最短周期内开发形成基于C/S架构的管理系统平台。
这样,可以充分利用各种软件系统架构的优势,为用户提供最佳的IT运维管理手段。
系统集成IT资源管理、监控管理、三维机房、维护管理、统计分析、网络管理、系统管理等功能模块,并能实现资源管理与三维机房、维护管理和统计分析的无缝关联。
系统提供三维机房仿真及交互功能,充分利用C/S客户端软件的性能优势,实现对IT机房的透明化、全方位管理。
3.4.2基于C/S的客户端软件
客户端软件是信息系统运维管理平台的主要功能集合体,支持系统的绝大部分功能,主要的使用对象是运维工程师、社会化运维工程师和运维管理人员。
客户端软件运行在Windows7操作系统下,集成了系统绝大部分管理功能,包括:
配置管理:
提供对IT资源静态和动态属性的精细化管理。
监控管理:
提供对环境设备、网络设备、操作系统、数据库、中间件、系统软件等的综合监控,对各种性能指标进行实时监控,自动产生告警事件,通过预先设置的告警方式通知管理人员。
支持对事件进行分级管理。
三维机房仿真及交互:
动态建立机房三维仿真视图,支持管理人员对三维机房及内部各种设备、系统的交互式操作和管理。
3.4.3三维机房管理
系统以C/S架构实现三维机房仿真和交互功能。
C/S客户端基于微软的WPF技术实现。
通过三维机房仿真和交互,在现有资产管理数据库的基础上,以三维仿真方式展现数据中心的运行情况,实现IT设备可视化管理和服务器等设备物理位置的精确定位。
通过三维仿真方式实现对机房、IT设备的部署情况的直观展示。
能够实现机房设备的360度视角手动调整。
具体功能如下:
Ø动态创建机房及机房内部各种硬件设施;
Ø建立软件系统与硬件设备的关联关系;
Ø对三维机房中的设备进行三维操作,如选中、方向旋转、拖动、复制、粘贴、增加、删除、编辑属性、放大还原等;可对机柜进行横向对齐、纵向对齐、复制、粘贴、显示、隐藏、机柜门打开关闭和批量打开关闭操作;可对机房远近拉动操作、上下视角调整、左右旋转、俯视图查看;可对机房地板、墙壁、机柜进行隐藏操作;要求能够在三维仿真机房的视图中显示漏水设备及感应绳的部署位置,并能够手动调整漏水设备以及漏水检测线缆的部署位置。
Ø支持机房内IT设备的3D定位功能,被定位的设备能够显示所属位置,并实现放大弹出展示效果;
Ø在鼠标移动到三维机房设备上时能够自动显示设备实时监控指标信息;
Ø支持机房布局设计和管理,能够在三维机房仿真视图内进行布局设计及机房空间分隔布局。
Ø系统支持同时管理多个区域多个机房,包括:
✓创建多个区域
✓创建和管理多个机房
✓不同三维机房之间的设备移动
✓多机房IT资源信息的统一管理
✓多机房三维视图同时显示
Ø系统支持机房大屏幕自动展示功能,通过模拟机房管理人员的走查流程,以3D播放形式,自动展示机房内部各个设备的实时状态信息等。
Ø支持机柜容量使用状态显示;
带有三维界面的监控系统是当今监控管理系统的流行趋势,它的优势显而易见,可以使管理人员最直观的掌握监管对象的各种信息。
通过先进的动态三维仿真技术,在管理系统平台中真实呈现机房内部三维视图,仿真机房内部所有设备,并能够对各种设备进行实时监控和管理。
根据机房的大小模拟机房真实场景,模拟机房所有设备,把机房里真实的场景呈现在计算机终端桌面,使得管理人员可以远程查看机房设备信息和远程控制。
系统支持对IT机房的三维动态仿真及交互功能。
在系统中能够显示IT机房的三维仿真视图,以及各种各样环境设备、网络设备的三维模型和所处位置。
用户能够在三维仿真视图中动态创建环境设备、网络设备,并能够与三维模型进行实时交互,如编辑网络设备属性,查看环境设备、网络设备实时状态等。
IT综合监管系统的三维机房管理可以同时管理多个机房,添加、维护现有机房,在现有机房中按照实际情况添加机房资源,比如机柜、机位、服务器、KVM、网络设备、UPS、空调设备等等,并通过3D视图方式展现机房资源分布。
机房视图支持多方位、多角度展示,如旋转、俯视等。
效果如下图所示:
图表4:
三维机房正视图
图表5:
三维机房俯视图
在三维仿真视图里,通过输入设备特定信息,可以快速查找并定位相关设备。
被找到的设备会在三维视图中高亮显示。
支持通过设备名称、IP地址、物理地址等信息进行快速定位。
图表6:
三维快速定位
特点:
3D仿真视图展现,机房管理人员只需坐在办公室,无需去机房便可轻松管理机房资源,降低了管理成本,节约时间,环保,高效,真正打造绿色机房。
图表7:
三维自动展示
系统整合了各种设备状态信息和告警信息在自动展示界面上,使机房管理人员可以通过三维管理界面了解机房内部的整体情况和健康度。
通过三维机房仿真和交互,IT管理人员可以:
Ø动态创建机房及机房内部各种硬件设施;
Ø建立软件系统与硬件设备的关联关系;
Ø对IT设备进行三维操作,如选中、旋转、拖动、复制粘贴、增加、删除、编辑属性等。
Ø进行IT设备的三维定位。
Ø在鼠标移动到三维设备上时自动显示设备静态属性及实时监控指标信息。
Ø支持机房布局设计和管理。
Ø支持3D
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- IT 技术 方案设计