IDC运维管理手册.docx
- 文档编号:25178663
- 上传时间:2023-06-05
- 格式:DOCX
- 页数:36
- 大小:118.87KB
IDC运维管理手册.docx
《IDC运维管理手册.docx》由会员分享,可在线阅读,更多相关《IDC运维管理手册.docx(36页珍藏版)》请在冰豆网上搜索。
IDC运维管理手册
IDC运维管理手册
1信息系统运维服务内容
服务目标
信息系统运行维护服务包括,信息系统相关网络及主机设备、操作系统、数据库和存储设备的运行维护服务,保证用户现有的信息系统的正常运行,降低整体管理成本,提高网络信息系统的整体服务水平。
同时根据日常维护的数据和记录,提供用户信息系统的整体建设规划和建议,更好的为用户的信息化发展提供有力的保障。
用户信息系统的组成主要可分为两类:
硬件设备和软件系统。
硬件设备包括:
网络设备、安全设备、主机设备、存储设备等;
软件设备可分为操作系统软件、典型应用软件(如:
数据库软件、中间件软件等)、业务应用软件等。
通过运行维护服务的有效管理来提升用户信息系统的服务效率,协调各业务应用系统的内部运作,改善网络信息系统部门与业务部门的沟通,提高服务质量。
结合用户现有的环境、组织结构、IT资源和管理流程的特点,从流程、人员和技术三方面来规划用户的网络信息系统的结构。
将用户的运行目标、业务需求与IT服务的相协调一致。
信息系统服务的目标:
对用户现有的信息系统基础资源进行监控和管理;
及时掌握网络信息系统资源现状和配置信息;
反映信息系统资源的可用性情况和健康状况;
创建一个可知可控的IT环境,从而保证用户信息系统的各类业务应用系统的可靠、高效、持续、安全运行。
服务项目范围覆盖的信息系统资源以下方面的关键状态及参数指标:
运行状态、故障情况
配置信息
可用性情况及健康状况性能指标
服务内容
1、客户端常用应用软件维护及系统维护
→客户端常用应用软件的安装、调试、管理、更新、升级、故障检测及排除。
→客户端操作系统的调试、管理、更新,升级,故障检测及排除。
→客户端操作系统包括winXPwin7等。
→常用应用软件包括Office2003、office2010、翻译类软件、阅读类软件、下载类软件等,但不包括某些专业应用软件,如专业财务软件、排版软件、工程计算软件等,以及客户自行开发使用的系统客户端应用程序。
→建立常用应用软件及驱动程序库。
(视客户情况而定)
2、客户计算机硬件维护及升级(不含设备费)
→客户端计算机硬件设备的维护、保养、更新、升级、故障检测及排除。
→对于需要更换的设备,提供设备选型建议及市场参考价格,并可代为购买(设备采购费用另计)。
→建立电脑硬件配置档案,实行标准化管理。
(视客户情况而定)
3、单机计算机病毒防护
→安装、管理、维护客户端计算机的病毒防护系统。
→培训用户计算机病毒的防护知识以及防病毒软件的使用,建立用户的防病毒意识。
升级、更新、优化用户已有的病毒防治系统。
→定期提供病毒检测、告警及最新预防措施。
→提供紧急病毒故障处理服务,对突发的新计算机病毒进行及时响应。
4、网络防病毒系统的维护
→对用户的网络防病毒系统进行维护,升级版本,更新病毒库从而确保网络、系统及数据资料的安全。
5、综合布线系统维护
→利用专业测试仪器提供对铜缆、光纤的布线故障检测处理。
→对现有综合布线系统中存在的缺陷、问题提供合理化改造或升级方案,并可提供专业水平的工程施工(工程费用另计)。
6、网络打印的故障处理
→解决驱动程序/软件设置/网络设置问题造成的网络打印故障。
7、非网络打印机的故障处理(非硬件损坏)
→解决驱动程序/软件设置问题造成的打印故障。
8、其它外置设备的故障处理
→解决扫描仪、手写板、摄像头、外置硬盘、刻录机等外置设备由于驱动程序/软件设置问题造成的故障。
9、局域网系统的故障诊断
→检查由于网络设备(如网卡、网线、交换机等)或网络设置造成的局域网络通信故障。
10、配线架及机柜的维护
→整理并规范配线架及机柜内的走线,对于存在的缺陷和问题提供合理化改造方案。
11、服务器系统维护
→从服务器硬件选型、软件安装(限微软产品)、管理到软硬件更新、升级,提供全程维护服务。
→对操作系统提供性能监测、系统优化、故障检测、故障排除、用户管理、资源分配、安全性控制等。
→服务器软件安装(限微软产品)安装配置、维护、故障排除等。
12、服务器安全漏洞修补
→及时对各台服务器提供最新的安全漏洞修补程序,以避免服务器及内部网络遭受到黑客的攻击,对用户造成损失。
13、网络交换机维护
→提供网络交换机的调试、故障诊断、日常维护保养、更换升级建议。
对于突发的紧急硬件故障可以提供匹配的设备进行临时替代,保证用户网络的正常运转。
14、路由器维护
→提供用户端路由器的调试、故障诊断、日常维护保养、更换升级建议。
对于突发的紧急硬件故障可以提供匹配的设备进行临时替代,保证用户网络的正常运转。
15、办公自动软件的安装及维护
→对办公自动软件系统的数据库备份、客户端安装、软件故障排除等进行办公自动软件整体维护。
16、计算机机房及综合布线系统改造
→对用户现有计算机房及综合布线系统可能存在的线路混乱、不规范等问题提供合理化解决方案。
17、网络防病毒系统的建设
→按用户需求,规划、建设网络防病毒系统,实现全方位病毒防护,确保网络、系统及数据资料的安全。
18、单机备份网/络备份系统的选型及建设
→为需要单机备份或网络备份的用户提供专业的全套服务,包括系统及设备选型、策略制定、灾难恢复等。
19、路由器及交换机调试
→提供路由器及交换机进行实际操作调试。
→调试以基本的安装调试应用为主。
信息资产统计服务
此项服务为基本服务,包含在运行维护服务中,帮助我们对用户现有的信息资产情况进行了解,更好的提供系统的运行维护服务。
服务内容包括:
硬件设备型号、数量、版本等信息统计记录;
软件产品型号、版本和补丁等信息统计记录;
网络结构、网络路由、网络IP地址统计记录;
综合布线系统结构图的绘制;
其它附属设备的统计记录;
网络、安全系统运维服务
从网络的连通性、网络的性能、网络的监控管理三个方面实现对网络系统的运维管理。
网络、安全系统基本服务内容:
序号
服务模块
内容描述
提供方
1
现场备件安装
配合用户进行,按备件到达现场时间工程师到达现场
2
现场软件升级
首先分析软件升级的必要性和风险,配合用户进行软件升级
3
现场故障诊断
按服务级别:
7×24小时
5×8小时
4
电话远程技术支持
7×24小时
5
问题管理系统
对遇到的问题进行汇总和发布
网络核心交换机巡视典型作业计划书
系统管理单位:
维保单位:
设备名:
设备型号:
管理IP:
检查内容
参考标准
检查结果
检查结论
巡视方法描述
巡检周期
硬件运行状态
电源运行状态
□正常□异常
风扇运行状态
□正常□异常
模块运行状态
□正常□异常
系统运行状态检查
VLAN状态
□正常□异常
配置状态
□正常□异常
OSPF状态
□正常□异常
日志检查
日志状态
□正常□异常
其他检查内容
□正常□异常
□正常□异常
□正常□异常
(1)用户现场技术人员值守
根据用户的需求提供长期的用户现场技术人员值守服务,保证网络的实时连通和可用,保障接入交换机、汇聚交换机和核心交换机的正常运转。
现场值守的技术人员每天记录网络交换机的端口是否可以正常使用,网络的转发和路由是否正常进行,交换机的性能检测,进行整体网络性能评估,针对网络的利用率进行优化并提出网络扩容和优化的建议。
现场值守人员还进行安全设备的日常运行状态的监控,对各种安全设备的日志检查,对重点事件进行记录,对安全事件的产生原因进行判断和解决,及时发现问题,防患于未然。
同时能够对设备的运行数据进行记录,形成报表进行统计分析,便于进行网络系统的分析和故障的提前预知。
具体记录的数据包括:
配置数据
性能数据
故障数据
(2)现场巡检服务
现场巡检服务是对客户的设备及网络进行全面检查的服务项目,通过该服务可使客户获得设备运行的第一手资料,最大可能地发现存在的隐患,保障设备稳定运行。
同时,将有针对性地提出预警及解决建议,使客户能够提早预防,最大限度降低运营风险。
巡检包括的内容如下:
编号
巡检内容
1
硬件运行状态检查项目
单板状态检查
电源模块状态检查
风扇状态检查
整机指示灯状态检查
机框防尘网检查
机房温度、湿度检查
设备地线检查
2
软件运行情况检查项目
设备运行情况检查
网络报文分析
设备对接运行状况检查
路由运行情况检查
3
网络整体运行情况调查
网络运行问题调查
网络变更情况调查
网络历史故障调查
(3)网络运行分析与管理服务
网络运行分析与管理服务是指工程师通过对网络运行状况、网络问题进行周期性检查、分析后,为客户提出指导性建议的一种综合性高级服务,其内容包括:
服务内容
服务优点
向客户提供网络专家电话号码。
保证重大问题第一连线至网络专家。
网络专家组每周与客户进行不少于30分钟的电话技术交流
以最小成本保证及时解答客户关心的技术问题,并就某一领域技术问题展开深层次沟通。
每月向客户提交CASE汇总分析报告,并可扩展到每年17次(月度、季度、年度)
使客户了解网络历史故障情况以及故障预防建议,最大程度减少网络故障隐患,更高效的进行网络管理。
(4)重要时刻专人值守服务
保证重要时刻设备稳定运行对客户成功尤为关键,因此,可对客户提供重要时刻的专人现场值守支持,包括政府的重大会议期间、突发公共事件及其它任何客户认为可能对其工作产生重大影响的时刻。
如需专人值守,客户需至少提前2周与授权服务商客户服务经理联系。
授权服务商均需按事先合同约定提供专人值守服务。
客户如需超出合同约定范围的更多值守支持,需额外支付相应人力和差旅费用。
主机、存储系统运维服务
主机、存储系统的运维服务包括:
主机、存储设备的日常监控,设备的运行状态监控,故障处理,操作系统维护,补丁升级等内容。
硬件维护包括增加设备、卸载设备、更换设备、除尘等,下面做一简要的叙述。
1.设备的增加
内存和硬盘的增加是服务器最常见的,安装的应用软件、资源库越来越多,服务器需要更多的内存和硬盘容量。
增加内存前需要认定与服务器原有的内存的兼容性,最好是同一品牌的规格的内存。
如果是服务器专用的ECC内存,则必须选用相同的内存,普通的SDRAM内存与ECC内存在同一台服务器上使用很可能会引起系统严重出错。
在增加硬盘以前,需要认定服务器是否有空余的硬盘支架、硬盘接口和电源接口,还有主板是否支持这种容量的硬盘。
尤其需要注意,防止买来了设备却无法使用。
2.设备的卸载和更换
卸载和更换设备时的问题不大,需要注意的是有许多品牌服务器机箱的设计比较特殊,需要特殊的工具或机关才能打开,在卸机箱盖的时候,需要仔细看说明书,不要强行拆卸。
另外,必须在完全断电、服务器接地良好的情况下进行,即使是支持热插拔的设备也是如此,以防止静电对设备造成损坏。
3.除尘
尘土是服务器最大的杀手,因此需要定期给服务器除尘。
尤其是在炎热的夏季,对于服务器来说,灰尘甚至是致命的。
除尘方法与普通PC除尘方法相同,尤其要注意的是电源的除尘。
主机存储系统基本服务内容:
序号
服务模块
内容描述
提供方
1
现场备件安装
配合用户进行。
按备件到达现场时间工程师到达现场
设备厂商及
2
补丁服务
消除软件漏洞给系统带来的安全隐患,并对安装补丁所引起的系统连锁反应进行合理的平衡。
设备厂商及
3
升级服务
对系统进行软件或硬件的升级,以改进、完善现有系统或消除现有系统的漏洞。
设备厂商及
4
现场故障诊断
按服务级别:
7×24小时
5×8小时
5
电话远程技术支持
7×24小时
6
问题管理系统
对遇到的问题进行汇总和发布
7
系统优化
对客户系统的括主机、存储设备、操作系统、提供优化服务。
现场值守人员可进行监控管理的内容包括:
CPU性能管理;
内存使用情况管理;
硬盘利用情况管理;
系统进程管理;
主机性能管理;
实时监控主机电源、风扇的使用情况及主机机箱内部温度;
监控主机硬盘运行状态;
监控主机网卡、阵列卡等硬件状态;
监控主机HA运行状况;
主机系统文件系统管理;
监控存储交换机设备状态、端口状态、传输速度;
监控备份服务进程、备份情况(起止时间、是否成功、出错告警);
监控记录磁盘阵列、磁带库等存储硬件故障提示和告警,并及时解决故障问题;
对存储的性能(如高速缓存、光纤通道等)进行监控.
小型机及服务器系统巡检典型作业计划书(HP服务器部分)
系统管理单位:
洛阳市人防办
设备名:
设备型号
设备序列号
管理IP:
检查内容
参考标准
检查结果
状态是否正常
巡检方法描述
巡检周期
硬件运行状态
电源指示灯
□正常□异常
面板指示灯
□正常□异常
内置磁带机
□正常□异常
CPU状态
□正常□异常
内存状态
□正常□异常
磁盘状态
□正常□异常
网卡状态
□正常□异常
HBA卡运行状态
□正常□异常
系统检查
系统日志
□正常□异常
□正常□异常
文件系统,包括磁盘卷剩余空间
□正常□异常
硬件检测
□正常□异常
交换分区
□正常□异常
固件版本
□正常□异常
补丁包版本
□正常□异常
系统镜像
□正常□异常
存储磁盘
□正常□异常
存储驱动
□正常□异常
进程状态
□正常□异常
系统性能检查
CPU利用率
□正常□异常
内存利用率
□正常□异常
磁盘I/O性能
□正常□异常
数据库运行状态
数据库安装目录
□正常□异常
数据库进程状态
□正常□异常
集群检查
集群进程状态
□正常□异常
集群日志
□正常□异常
存储检查
存储设备故障灯状态
□正常□异常
SAN交换机端口状态
□正常□异常
存储交换机环境状态
□正常□异常
系统故障报告
□正常□异常
数据库系统运维服务
数据库运行维护服务是包括主动数据库性能管理,数据库的主动性能管理对系统运维非常重要。
通过主动式性能管理可了解数据库的日常运行状态,识别数据库的性能问题发生在什么地方,有针对性地进行性能优化。
同时,密切注意数据库系统的变化,主动地预防可能发生的问题。
数据库运行维护服务还包括快速发现、诊断和解决性能问题,在出现问题时,及时找出性能瓶颈,解决数据库性能问题,维护高效的应用系统。
数据库运行维护服务,主要工作是使用技术手段来达到管理的目标,以系统最终的运行维护为目标,提高用户的工作效率。
具体数据库运行维护监控的基本服务内容包括:
1.操作系统相关维护
DBA要注意对操作系统的监控:
※文件系统的空间使用情况,必要时对ORACLE的警告日志及TRC文件进行清理
※如果ORACLE提供网络服务,检查网络连接是否正常
※检查操作系统的资源使用情况是否正常
※检查数据库服务器有没有硬件故障,如磁盘、内存报错
2.数据库相关维护
序号
服务模块
内容描述
提供方
1
Oracle数据库
7*24电话支持服务
每周7天,每天24小时支持中心电话,电子邮件答询,以满足业务发展的需要。
Oracle产品技术专家直接同客户对话,帮助解决客户提出的疑难问题。
根据问题的严重程度,将优先解决客户认为是关键而紧急的任务。
对客户提出的一般性问题进行技术咨询、指导。
定期的客户管理报告,避免问题再度发生。
2
Oracle数据库产品
现场服务响应
数据库宕机
数据坏块
影响业务不能进行的产品问题
软件产品的更新及维护。
3
Oracle数据库产品
系统健康检查
对系统的配置及运作框架提出建议,以帮助您得到一个更坚强可靠的运作环境
降低系统潜在的风险,包括数据丢失、安全漏洞、系统崩溃、性能降低及资源紧张
检查并分析系统日志及跟踪文件,发现并排除数据库系统错误隐患
检查数据库系统是否需要应用最新的补丁集
检查数据库空间的使用情况
协助进行数据库空间的规划管理
检查数据库备份的完整性
监控数据库性能
确认系统的资源需求
明确您系统的能力及不足
优化OracleServer的表现
通过改善系统环境的稳定性来降低潜在的系统宕机时间
4
Oracle数据库产品
性能调优
分析用户的应用类型和用户行为
评价并修改ORACLE数据库的参数设置
评价并调整ORACLE数据库的数据分布
评价应用对硬件和系统的使用情况,并提出建议
利用先进的性能调整工具实施数据库的性能调整
培训用户有关性能调整的概念
提供用户完整的性能调整报告和解决方法
终端运维服务
作为整体信息系统维护方案,终端设备维护必不可少。
各种局部服务器、工作站、台式机、笔记本、显示设备等,除了必要保修外,需要进行日常的系统维护、系统调试和培训。
综合布线系统服务
布线管理是针对设备间、交换间的工作区的配线设备、线缆、信息插座等设施,按照一定的模式进行标识和记录,内容包括:
管理方式、标识、色标、交叉连接、跳线等这些内容的实施给系统维护、管理创造方便,提高了管理水平和工作效率,从而实现了综合布线系统的灵活性、开放性和扩展性。
综合布线线缆是综合布线系统的基础设施,是整个网络的中枢神经系统,它能为智能建筑提供语音、数据、图像、多媒体等系统的应用,并在不断的扩展中。
这得益于综合布线系统网络灵活性及高可靠性,但也带来新的问题,主要表现在随着系统的使用、网络的发展,用户不可避免的要对连接的缆线移动、添加、改动,使得跳线不断变更,在设备间主配线架及楼层配线架将会出现跳线管理的问题,众多的缆线很难避免出现混乱,这一直是用户极为关注的问题。
1.维护管理执行的标准
目前电信基础设施管理的标准是:
TIA/EIA—606标准,该标准是商业建筑物电信基础设施管理标准,是目前国际上有关商业建筑物电信基础结构的唯一管理标准。
管理基础设施包括有以下范围:
※位于工作区、配线间、设备间和引入设施的终端部件;
※电信布线缆线和连接件;
※电信布线缆线路径、连接件位置、终端部件所在的位置:
※电信的接地与连接。
2.彩色标识维护管理方式的实施方法
彩色标识管理是在每个交接区实现线缆管理的方式,是在各色标区域之间按照应用的要求采用跳线连接。
色标作为用来区分配线设备的性质,标识按性质排列的接线模块,表明端接区域、物理位置、编号、容量、规格等,以便管理人员一目了然地加以识别。
即在配线架上将来自不同方向或不同应用功能设备的线路集中布放,并按规定不同颜色的标记区域,当一个工程内有多个设备问、交换间、楼层配线问,应采用统一的色标区别各类用途的配线区,综合布线管理系统通常使用三种标记:
缆线标记、区域标记和插接件标记。
1、配线架面板为端口单独管理方式,因而可以轻松完成每一个端口的检查、替换或纠正。
端口的易接近性是配线系统的重大创新,因而所有管理和维护操作都可在前端完成。
2、在IU高度的19”空间中,可以同时支持超五类、六类、七类信息模块、光纤管理单元和语音配线单元的管理,且每个端口的功能均可由客户自由制定。
3、电缆的管理:
配线架后端带加长电缆托架并预留线槽,还可采用电缆管理条紧固及标识电缆。
4、光纤管理单元:
光纤管理单元为防尘封闭式设计,单元内预留光纤盘绕位置,3口及6口光纤管理单元可分别实现6芯、12芯光纤的管理,还可以管理各类通用的光纤连接器(如6MT—RJ、LC、SC、ST等),在IU机柜空间上管理多达48芯光纤。
5、配线架信息端口采用免工具安装管理信息模块,所有维护操作均在配线架前端完成,每个端口单独管理,维护时仅取下对应端口的支件,不需任何工具。
大屏幕显示系统的维护
1)维护周期的确定
维护周期应根据设备的工作环境来确定,如工作在环境条件较好灰尘较少(如调度指挥中心,监控中心等),建议设备的维护时间为6个月维护一次,如果环境较差应该缩短维护周期,建议3个月一次。
(如车站,机场,购物娱乐场所等)。
2)常见故障现象及处理方法
a)色轮故障
现象——屏幕图像色彩不正常﹐偏蓝﹑偏绿﹑偏红或者颜色不稳定﹐忽蓝忽绿。
打开内置状态15(按ADJUST-SHIFT-1-1-5-SHIFT)﹐可以发现颜色不正常(正常应为100%白色)。
处理方法——将色轮拆下﹐用棉签沾无水酒精擦拭色轮片和光耦探头或更换色轮。
b)DMD板故障
现象——屏幕图像呈黑白色﹐机器死机﹐不接受遥控器指令或屏幕底色有3条隐约可见的白线。
处理方法——更换DMD板。
c)控制模块故障
现象——屏幕中有一片图像颜色不稳定﹐此现象关机后再开机可能消失﹐但运行一段时间后会再次出现或屏幕图像有纹路。
处理方法——更换控制模块。
d)灯泡故障
现象——黑屏或屏幕象不稳定的日光灯一样忽明忽暗
处理方法——检查Power灯是否正常﹐Fan灯是否正常﹐Lamp灯是否闪烁﹐观察灯泡是否已碎﹐如是则需更换灯泡。
e)点灯器故障
现象——屏幕象不稳定的日光灯一样忽明忽暗﹔点灯器有无间隔发出丝丝的声音。
处理方法——先检查灯泡是否正常﹐如正常则需更换点灯器。
f)Digital线故障
现象——在串接状态下屏幕图像颜色有时偏蓝﹐有时偏绿﹐有时又正常﹔打开内置状态10﹐颜色正常。
处理方法——更换Digital线
g)遥控器故障
现象——遥控器控制无反应或不按控制动作。
处理方法——首先使用对其他屏进行控制﹐确定遥控器无问题后﹐检查红外接收板与电子模块联机﹐如无改善﹐则需更换红外接收板和电子模块。
h)颜色复位
现象——开机后屏幕突然出现色差(多发生在突然断电后)。
处理方法——检查gain及offset值﹐是否已恢复为初始值(gain为32,offset为127)﹐重新设定gain及offset值。
i)灰尘污染
现象——画面边缘出现蓝紫色斑﹐ 边缘不清。
处理方法——调整光机内的小反射镜并清除小反射镜上的灰尘。
3)十大常见问题
序号
故障种类
故障现象
解决方案
1
色轮故障
屏幕图像色彩不正常﹐偏蓝﹑偏绿﹑偏红或者颜色不稳定﹐忽蓝忽绿。
打开内置状态10﹐可以发现颜色不正常。
将色轮拆下﹐用棉签沾无水酒精擦拭色轮片和光耦探头或更换色轮。
2
DMD板故障
屏幕图像呈黑白色﹐机器死机﹐不接受遥控器指令或屏幕底色有3条隐约可见的白线。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- IDC 管理 手册