运维管理新规制度.docx
- 文档编号:9469596
- 上传时间:2023-02-04
- 格式:DOCX
- 页数:18
- 大小:82.27KB
运维管理新规制度.docx
《运维管理新规制度.docx》由会员分享,可在线阅读,更多相关《运维管理新规制度.docx(18页珍藏版)》请在冰豆网上搜索。
运维管理新规制度
运维管理制度
XXXXXX
5月18日
引言
本文件是依据《XXXXXX系统协同管理及数据交换策略研究》分任务要求,完成“运维制度”研究工作。
课题组参考国际中国家标准准有:
ITIL/ISO0标准
GBT28827.1-信息技术服务运行维护第1部分:
通用要求
GBT28827.2-信息技术服务运行维护第2部分:
交付规范
GBT28827.3-信息技术服务运行维护第3部分:
应急响应规范
结合XXX课题应用实施及运维管理实际情况研究、编制运行维护管理制度,本文分为7章内容分别为:
1.总则
2.编制方法
3.运维部工作职责
4.运维服务管理体系
5.运维服务内容
6.应急服务响应方法
7.服务管理制度规范等内容。
1、总则
第一条为保障XXXX课题信息系统软硬件设备良好运行,使参与课题技术人员运维工作制度化、步骤化、规范化,特制订本制度。
第二条运维管理工作总体目标:
立足根本促发展,开拓运维新局面。
在办公系统运行推广时期,经过网络、桌面、系统等运维,促进XXXX课题能够稳定可连续性发展。
第三条运维管理制度适用范围:
本项目运维全体人员。
2、编制方法
本实施细则包含运维服务全生命周期管理方法、管理标准/规范、管理模式、管理支撑工具、管理对象和基于步骤管理方法。
本实施细则以ITIL/ISO0为基础,以信息化项目标运维为目标,以管理支撑工具为手段,以步骤化、规范化、标准化管理为方法,以全生命周期PDCA循环为提升路径,表现了对运维服务全过程体系化管理。
3、运维部工作职责
3.1系统运维和技术支持
(1)依据示范工程实施推进和发展目标,负责系统信息协同管理及协同数据交换策略研究整体架构、应用系统等技术开发方案制订和组织开发,保障基础研发平台稳定性和优异性。
(2)负责系统基础研发平台使用培训和操作使用指南编写,对用户使用过程中出现问题沟通和处理;
(3)会同项目实施单位,确定系统信息基础研发设备和软件数量、品牌规格、技术参数,确保课题有效推进实施。
(4)系统信息基础研发设备和软件操作规程和应用管理制度制订,并负责监督实施。
(5)系统信息基础研发中心设备和软件安装、调试和验收,使用培训和维修保养。
(6)系统信息基础研发平台日常运行过程中信息安全和技术问题协调处理,保障网站二十四小时安全稳定运行。
(7)负责研发平台系统管理及设备保密口令设置和保留,保密口令设置后报课题领导小组立案,保密口令设定后任何人不得随意更改,保密口令每三个月更新一次。
(8)负责系统信息协同管理及协同数据交换策略研究新程序、新系统和软件改版升级工作。
3.2.平台信息和技术安全
(1)实施国家相关网络信息技术安全法律法规,和通信管理和网络安全监管部门联络,立即处理基础研发平台信息技术安全方面存在问题,确保平台安全、稳定、可靠运行。
(2)基础研发平台信息技术安全保密制度和工作步骤制订,落实信息技术安全保密责任制,实施“谁主管、谁负责,谁主办、谁负责”标准,责任到人。
(3)在服务器和计算机之间设置硬件防火墙,在服务器及工作站上均安装防病毒软件,进行硬件和技术双保护,确保基础研发平台不受病毒和黑客攻击。
(4)负责基础研发平台信息技术安全应急处理预案制订和实施。
(5)建立多机备份基础平台信息服务系统机制,一旦主系统碰到故障或受到攻击造成不能正常运行,能够在最短时间内替换主系统提供服务。
(6)建立基础平台系统集中式权限管理,根据岗位职责设定工作人员操作权限,针对不一样应用系统、终端、操作人员,设置共享数据库信息访问权限,并设置密码。
不一样操作人员设定不一样用户名,且定时更换,严禁操作人员泄漏密码。
4、运维服务管理体系
运维服务管理体系要求了运维工作包含各类实体,和这些实体间相互关系。
相关实体根据运维服务管理体系进行有机组织,并协调工作,根据服务协议要求提供不一样等级IT运维服务。
4.1运维服务管理对象
运维服务管理对象包含基础设施、应用系统、用户、供给商、和IT运维部门和人员,具体内容以下:
(1)基础设施包含网络、主机系统、存放/备份系统、终端系统、安全系统、和机房动力环境等。
(2)应用系统包含OA办公信息系统、门户网站等应用系统等。
(3)用户包含使用如上应用系统用户。
(4)供给商包含基础设施和应用系统供给商和IT运维服务供给商。
(5)运维部门和人员包含内部参与运维活动相关部门和人员,和提供运维服务企业和相关人员。
4.2运维系统功效框架
依据建设单位系统结构和业务开展需要,运维项目组将项目标维护框架分为9个具体组成部分,分别为:
服务台、时间管理。
工单管理、问题管理、变更管理、配置管理、工程师考评、知识库管理、统计、系统管理等9个子项。
而具体运维步骤将以此为依据开展工作。
4.3运维管理组织结构
运维项目标运维管理结构位三层模式,具体以下图所表示。
由项目责任人和甲方进行业务范围接洽,并将沟通结果向下传输。
项目经理负责项目标整体运维工作,包含多种制度制订和实施。
运维工程师则在项目经理指导下开展维护工作。
4.3.1项目责任人
职责:
负责项目商务、整体协调事宜。
职位描述:
1、整体负责建设单位运维项目服务计划制订,领导项目经理并安排项目工作,指导项目经理完成具体维护工作,每七天听取项目经理工作汇报,负责考评项目经理工作完成情况。
2、帮助建设单位完成新增项目标调研、方案设计并指导项目经理进行具体实施。
4.3.2项目经理
职责:
计划、实施、完善信息化项目标运维工作,指导网络、数据库维护工程师开展工作。
职位描述:
1、依据企业战略目标,指导下属工程师开展用户服务工作,确保运维工作能够满足用户实际需要;
2、建立和连续完善运维管理体系,优化运维步骤步骤,处理运维服务中出现特殊问题;
3、计划并提升运维工程师专业服务能力,在整体上提升用户满意度;
4、制订和连续完善绩效考评体系;
5、制订整理运维项目标应急预案系统,并指导运维工程师实施;
6、提升本身专业技能,在业务方面给网络管理员和数据库管理员指导。
4.3.3技术主管
职责:
应用、国产数据库管理,数据库性能调优,实现应用负载均衡。
职位描述:
1.技术主管非项目常驻人员,依据项目需要进行专业方面指导;
2.负责数据库性能分析和调优,数据库运行状态监控,立即发觉异常并快速处理。
3.熟练掌握国产数据库技术,能够实现布署及调优。
4.掌握国产中间件工作原理,能够实现布署调优及故障处理。
5.熟练掌握linux操作系统,布署国产数据库。
熟练掌国产数据库冗灾、数据保护、故障恢复技术。
6.负责应用负载均衡布署和调试。
7.负责指导数据库工程师管理员开展工作。
4.3.4服务台
职责:
故障电话受理,文档管理。
职位描述
1.负责业务救助电话受理工作;
2.故障处理提议人,同时进行维护工程师指派,跟踪事件处理状态;
3.进行维护故障统计、用户满意度统计、工作报表输出等工作;
4.帮助项目经理,进行文档整理、归类、保留等工作。
4.3.5网络管理员
职责:
维护建设单位网络系统正常,处理网络相关故障。
职位描述:
1、对现有服务器、局域网络及机房、配线间日常管理维护;
2、对信息安全建设提出相关提议,确保网络安全;
3、确保外网光纤线路正常,确保局域网运行正常;
4、对网络系统和网络设备运行状态进行监控;
5、熟练掌握域策略设置、DHCP、DNS、FTP服务器、NTFS权限设置等;
6、编写网络部分应用处理预案并实施。
7、工作认真、细致,主动主动有条理性,含有良好沟通能力及团体合作精神.
4.3.5应用、数据库管理员
职责:
维护建设单位业务系统运行正常,处理应用和数据库故障。
职位描述:
1、监测业务系统运行情况,应用、数据库性能监视及优化,作必需调整;
2、计划不一样数据生命周期,制订备份、恢复、迁移和灾备策略,依据业务需要实施数据转换及迁移等操作;
3、确保应用和数据库系统安全性、完整性和运行效率。
4、负责数据库平台整体架构及处理方案制订和实施;
5、工作认真、细致,主动主动有条理性,含有良好沟通能力及团体合作精神.
4.3.7终端管理员
职责:
维护建设单位桌面系统运行正常,处理终端、外设故障。
职位描述:
1、各部门电脑、打印机、传真机维护;
2、对各部门职员进行电脑相关技术支持及培训工作;
3、精通中标Linux及金山WPS办公软件使用,能够熟练使用MSWindowsXP;MSOffice软件,能够制作对应教程对其它部门职员进行培训
4.4运维服务步骤
IT运维服务管理步骤包含服务台、事件管理、问题管理、配置管理、变更管理、公布管理、服务等级管理、财务管理、能力管理、可用性管理、服务连续性管理、知识管理及供给商管理等,伴随运维活动不停深入和连续改善,其它步骤可能会逐步独立并规范。
4.4.1项目运维服务工作步骤图
4.4.2服务台
服务台是支持运维服务关键功效,和各个步骤联络亲密。
全部管理步骤全部要经过服务台为用户提供单点联络,解答用户相关问题和需求,或为用户寻求对应支持人员。
在本系统中,服务台是接收多种起源服务请求和相关信息反馈唯一入口和出口,同时服务台还负责通常请求、经过知识库(历史事件)能够处理请求;她也是复杂问题二线处理桥梁。
4.4.3事件管理
事件管理步骤关键目标是立即恢复服务提供并降低其对业务不利影响,尽可能确保最好服务质量和可用性等级。
事件管理步骤通常包含事件侦测和统计、事件分类和支持、事件调查和诊疗、事件处理和恢复和事件关闭。
本系统把全部服务请求和报警归结为事件。
事件管理是提供服务台和事件管理者对于事件统计、处理、查询、审核、派发等功效。
它也包含经过和第三方监控系统对接,把其发送报警形成事件功效。
4.4.4工单管理
工单管理:
工单是现场运维、二线支持任务载体,运维工程依据所接收工单进行运维工作。
工单管理是对工单实现创建、变更、查询浏览、派发、监督等功效模块。
4.4.5问题管理
问题管理步骤关键目标是预防问题和事故再次发生,并将未能处理事件影响降低到最小。
问题管理步骤包含诊疗事件根本原因和确定问题处理方案所需要活动,经过适宜控制过程,尤其是变更管理和公布管理,负责确保处理方案实施。
问题管理还将维护相关问题、应急方案和处理方案信息。
问题管理是针对已处理事件遗留问题或处理事件方案只是治标不治本不能根本处理问题而考虑模块。
依据事件、及处理方案,问题处理人经过调查、诊疗并提出最终处理方法。
4.4.6变更管理
变更管理实现全部基础设施和应用系统变更,变更管理应统计并对全部要求变更进行分类,应评定变更请求风险、影响和业务收益。
其关键目标是以对服务最小干扰实现有益变更。
变更管理是要对重大资源新增、变更、升级等运维活动进行审核功效,以免这些活动对现有资源可用性造成没有必需影响和破坏;同时,她还要实现在工单中产生改变进行后审计功效。
4.4.7配置管理
配置管理步骤负责核实基础设施和应用系统中实施变更和配置项之间关系是否已经被正确统计下来;确保配置管理数据库能够正确地反应现存配置项实际版本状态。
配置管理实际上是全部资源统一管理功效,包含资源整个生命周期参数或配置改变统计管理。
管理信息关键包含分类、型号、版本、位置,状态、相关资料等基础信息还包含关键参数等
4.4.8知识库管理
知识库管理:
知识库是提供给运维人员关键技术资料内容,她聚集在工作碰到经典案例归纳总结知识关键点和全方面实用资料手册。
在本系统中,知识库管理提供便于使用人机接口、快速查询技术手段和维护手段。
4.4.9统计及工作汇报
运维管理系统提供一线处理率统计、用户满意度统计、按分类事件汇总统计、工作汇报生成功效,根据一定格式依据事件数据、工单数据、问题数据、配置数据、变更数据能够帮助运维管理者能把运维所做工作内容清楚罗列出来。
5、运维服务内容
5.1服务目标
运维项目组提供运行维护服务包含,信息系统相关主机设备、操作系统、数据库和存放设备运行维护服务,确保用户现有信息系统正常运行,降低整体管理成本,提升网络信息系统整体服务水平。
同时依据日常维护数据和统计,提供用户信息系统整体建设计划和提议,愈加好为用户信息化发展提供有力保障。
用户信息系统组成关键可分为两类:
硬件设备和软件系统。
硬件设备包含网络设备、安全设备、主机设备、存放设备等;软件设备可分为操作系统软件、经典应用软件(如:
数据库软件、中间件软件等)、业务应用软件等。
服务项目范围覆盖信息系统资源以下方面关键状态及参数指标:
Ø运行状态、故障情况
Ø配置信息
Ø可用性情况及健康情况性能指标
5.2IT资产统计服务
服务内容包含:
Ø硬件设备型号、数量、版本等信息统计统计
Ø软件产品型号、版本和补丁等信息统计统计
Ø网络结构、网络路由、网络IP地址统计统计
Ø综合布线系统结构图绘制
Ø其它隶属设备统计统计
5.3网络、安全系统运维服务
从网络连通性、网络性能、网络监控管理三个方面实现对网络系统运维管理。
Ø设备基础性能检测:
CPU、内存使用情况监测;
Ø设备日志查看;
Ø设备SNMP状态;
Ø测试Ping,tracert等工具连通性;
Ø网络安全策略应用是否正常;
ØInternet带宽流量实时监测;
Ø网络拓扑链路状态监测;
Ø异常网络数据包流量;
ØDos、ddos等网络攻击情况监测;
ØInternet线路误码率、丢包率监测;
5.4主机、存放系统运维服务
提供主机、存放系统运维服务包含:
主机、存放设备日常监控,设备运行状态监控,故障处理,操作系统维护,补丁升级等内容。
进行监控管理内容包含:
ØCPU性能管理;
Ø内存使用情况管理;
Ø硬盘利用情况管理;
Ø系统进程管理;
Ø主机性能管理;
Ø实时监控主机电源、风扇使用情况及主机机箱内部温度;
Ø监控主机硬盘运行状态;
Ø监控主机网卡、阵列卡等硬件状态;
Ø监控主机HA运行情况;
Ø主机系统文件系统管理;
Ø监控存放交换机设备状态、端口状态、传输速度;
Ø监控备份服务进程、备份情况(起止时间、是否成功、犯错告警);
Ø监控统计磁盘阵列、磁带库等存放硬件故障提醒和告警,并立即处理故障问题;
Ø对存放性能(如高速缓存、光纤通道等)进行监控。
5.5数据库系统运维服务
提供数据库运行维护服务是包含主动数据库性能管理,数据库主动性能管理对系统运维很关键。
经过主动式性能管理可了解数据库日常运行状态,识别数据库性能问题发生在什么地方,有针对性地进行性能优化。
同时,亲密注意数据库系统改变,主动地预防可能发生问题。
进行监控管理内容包含:
Ø数据库基础信息:
文件系统、碎片、死锁、CPU占用率较大或时间较长SQL语句。
Ø表空间使用信息监测;
Ø数据库文件I/0读写情况;
ØSession连接数量监控;
Ø数据库监听运行状态监测;
Ø查看每日数据备份、数据同时是否正常;
Ø报警日志监测;
Ø对表和索引进行Analyze,检验表空间碎片;
Ø检测数据库后台进程;
Ø数据库对象空间扩展情况监测;
5.6中间件运维服务
中间件管理是指对TongWeb、等国产中间件日常维护管理和监控工作,提升对中间件平台事件分析处理能力,确保中间件平台连续稳定运行。
中间件监控指标包含配置信息管理、故障监控、性能监控。
Ø实施线程:
监控中间件配置实施线程空闲数量。
ØJVM内存:
JVM内存曲线正常,能够立即进行内存空间回收。
ØJDBC连接池:
连接池初始容量和最大容量应该设置为相等,而且最少等于实施线程数量,以避免在运行过程中创建数据库连接所带来性能消耗。
Ø检验中间件日志文件是否有异常报错
Ø假如有中间件集群配置,需要检验集群配置是否正常。
5.7终端、外设运维服务
负责对终端PC、笔记本和工作站操作系统、应用软件和硬件维护,处理使用人员在应用过程中碰到问题并进行简单培训,完成打印机等其它外设故障处理工作。
6、应急服务响应方法
运维项目组制订了详尽应急处理预案,整个步骤严谨而有序。
但在服务维护过程中,意外情况将难以完全避免。
我们将对项目实施突发风险进行具体分析,而且针对各类突发事件,设计了对应预防和处理方法,同时提供了完整应急处理步骤。
6.1应急预案实施基础步骤
已处理
扩大应急
发觉故障
开启应急预案,并通知领导
按事件步骤处理
初步判定
故障恢复
联络技术支持处理
联络开发人员或
厂家工程师现场处理
通常事件
突发事件
总结,修订应急预案
已处理
未处理
突发事件应急组
未处理
已处理
汇报进度
汇报进度
汇报
支援
统计
6.2突发事件应急策略
(1)值班人员平时应做好应急事件监控工作,对于突发事件应认真分析、正确判定故障发生数据域,负责跟踪该事件直至其结束。
对于不在运维中心故障,应在第一时间内通知责任人去现场处理,亲密关注事件步骤及进展情况,并做好登记工作上报领导。
(2)正常情况下,要求值班人员在10分钟内进行事件确定。
假如属于通常事件则根据事件步骤进行分配处理,不然应快速开启《应急预案》,并严格根据《应急预案》所要求步骤快速实施应急处理,立即汇报上级领导,掌握实时处理情况。
(3)在处理过程中,如需其它部门去现场支援处理,应立即向上级领导部门汇报,协调沟通,立即联络技术工程师或厂家技术支持赶赴现场援助处理。
7、服务管理制度规范
7.1服务时间
(1)在5*8小时工作时间内设置由专员职守热线电话,接听内部服务请求,并统计服务台事件处理结果。
(2)在非工作时间设置有专员7*24小时接听移动电话热线,用于处理内部技术问题和接听7*24小时机房监控人员机房突发情况汇报。
(3)服务响应时间:
故障等级
响应时间
故障处理时间
I级:
属于紧急问题;其具表现象为:
系统瓦解造成业务停止、数据丢失。
10分钟,30分钟内提交故障处理方案
3小时以内
II级:
属于严重问题;其具表现象为:
出现部分部件失效、系统性能下降但能正常运行,不影响正常业务运作。
10分钟,30分钟内提交故障处理方案
6小时以内
III级:
属于较严重问题;其具表现象为:
出现系统报错或警告,但业务系统能继续运行且性能不受影响。
10分钟,30分钟内提交故障处理方案
12小时以内
IV级:
属于一般问题;其具表现象为:
系统技术功效、安装或配置咨询,或其它显然不影响业务预约服务。
10分钟,2小时内提交故障处理方案
二十四小时以内
7.2行为规范
(1)遵守用户各项规章制度,严格根据用户对应规章制度办事。
(2)和用户运行维护体系其它部门和步骤协同工作,亲密配合,共同开展技术支持工作。
(3)出现疑难技术、业务问题和重大紧急情况时,立即向责任人汇报。
(4)现场技术支持时要精神饱满,穿着得体,谈吐文明,举止庄重。
接听电话时要文明礼貌,语言清楚明了,语气和善。
(5)遵守保密标准。
对被支持单位网络、主机、系统软件、应用软件等密码、关键参数、业务数据等负有保密责任,不得随意复制和传输。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 管理 规制