网络的运维与机房应急预案.docx
- 文档编号:2940234
- 上传时间:2022-11-16
- 格式:DOCX
- 页数:11
- 大小:121.14KB
网络的运维与机房应急预案.docx
《网络的运维与机房应急预案.docx》由会员分享,可在线阅读,更多相关《网络的运维与机房应急预案.docx(11页珍藏版)》请在冰豆网上搜索。
网络的运维与机房应急预案
网络运维小组应急预案
随着网络信息化建设的不断深入,加强机房各类设备、系统以与信息与网络安全等方面应对突发事件的处理能力将是我们目前面临的一项重要任务。
为确保系统与机房安全与稳定,以保证正常运行为宗旨,按照“预防为主,积极处置〞的原如此,本着建立一个有效处置突发事件,建立统一指挥、职责明确运转有序、反响迅速处置有力的机房安全体系的目标,将正在发生或已发生事故的损害程度减轻到最低,确保员工安全,特制定本应急处置预案。
本预案共分为应用系统故障应急流程和机房突发事件应急流程
系统故障应急流程
一、系统故障应急流程说明
1、故障发生
系统运维服务小组可从以下途径得知故障的发生:
1.1、运维服务中心通过网管告警发现故障
1.2、维护站点通过维护巡检发现故障
1.3、用户发现故障,报给呼叫中心
1.4、驻场工程师发现故障
2、报障受理
监控系统运维服务小组得知系统故障发生后,立即响应,并向报障人或单位详细了解系统故障情况。
3、信息研判
运维服务小组根据了解到的系统故障情况进展分析判断,以确定采用一般故障处理流程还是立即启动系统突发故障应急处理预案。
4、预案启动
如需启动应急预案,如此立刻通知系统突发故障应急领导小组,由领导小组启动应急预案,对系统突发故障应急事件进展全面管控处理。
5、资源确认
系统突发故障应急预案启动后,首先是根据现场突发故障实际状况、紧急程度、技术难度、备品备件等情况对相关资源〔主要是参与人员〕依据经验进展调度和确认,主要有以下资源:
我公司技术支持人员;
相关厂家技术支持人员;
我公司聘请的技术专家
6、预案执行
按照既定的预案进展突发故障抢修,如遇到问题与时向系统突发故障应急领导小组汇报。
7、预案终止
预案的终止时间由故障现场技术人员根据现场的实际进展情况,在与用户单位有关部门协调后报系统突发故障应急领导小组决定。
8、结果上报
预案中止后,相关预案参与人员将整个事件过程中的经验和教训,修改、完善事件应急预案。
然后集中上报至系统突发故障应急领导小组。
二、系统故障应急处理流程图
机房突发事件应急流程
一、机房突发事件分类
1、自然灾害:
指地震、火灾等因自然因素引起的网络与信息系统的损坏。
2、事故灾难:
指电力中断、网络损坏、软件、硬件设备故障等引起的网络与信息系统的损坏。
3、人为破坏:
指人为破坏网络线路、通信设施,黑客攻击、病毒攻击、恐怖袭击等引起的网络与信息系统的损坏。
二、应急处理人员组织机构
三、应急机构人员岗位职责
1、应急总指挥职责
1.1、保证在任何时间,与时协调应急行动所有涉与的岗位人员;
1.2、提供必须的紧急响应设备;
1.3、在紧急情况下全面负责紧急行动;
1.4、在必要时向外界求救,例如:
119、110、120等。
2、应急副总指挥职责
2.1、在总指挥领导下具体开展工作,当总指挥不在时履行总指挥职责;
2.2、根据获得的应急信息下达命令。
3、各相关设备负责人职责
3.1、负责尽快收集信息向应急总指挥汇报事故情况;
3.2、负责现场临时设备抢救和对事态的控制;
3.3、听从上级指挥人员的指挥。
四、突发事件处理原如此
1.预防为主。
立足安全防护,加强预警,重点保护根底信息网络和关系信息安全、稳定的重要信息系统,从预防、监控、应急处理、应急保障等环节,在管理、技术、人员等方面采取多种措施充分发挥各方面的作用,共同构筑安全保障体系。
2.快速反响。
突发事件发生时,按照快速反响机制,与时获取充分而准确的信息,跟踪研判,果断决策,迅速处置,最大程度地减少危害和影响。
3.分级负责。
按照“谁主管,谁负责〞的原如此,建立和完善安全责任制与联动工作机制。
根据各负责人的职能,各司其职,加强各负责人的协调与配合,共同履行应急处置工作的管理职责。
4.以人为本。
把保障人员以与公共利益的安全作为首要任务。
5.常备不懈。
加强技术储藏,规X应急处置措施与操作流程,定期进展预案演练,确保应急预案切实有效,实现网络与信息安全突发公共事件应急处置的科学化、程序化与规X化。
五、机房应急开关机具体措施
机房各设备关闭顺序如下:
六、机房日常维护
1、建立健全机房管理制度
1.1在正常工作日内,信息技术部人员负责对机房进展监控,主要职责是:
巡视网络设备与系统的运行情况,发生异常情况与时处理,消除网络故障隐患。
1.2节假日期间技术人员轮流值班,负责处理有关异常情况。
1.3机房采取来人来访登记制度,未经允许,无关人员不得进入公司机房区域。
2、机房内严格采取防雷、防火、防尘、防静电等措施以与机房24小时监控等措施。
3、认真做好数据备份工作,定期做一次数据库完全备份,每月检查服务器运行和备份情况。
4、对机房的主要网络设备〔路由器、主干交换机等〕进展工作时间内全程监控,发现异常情况应与时进展处理,确保整个网络的正常运行。
七、服务器与存储设备故障处理
1、排错流程
2、应急处置具体措施
2.1机房漏水应急预案
〔1〕发生机房漏水时,第一目击者应立即通知运维服务小组,并与时报告监控系统突发故障应急领导小组。
〔2〕假如空调系统出现渗漏水,运维服务小组负责人应立即安排停用故障空调,去除机房积水,并与时联系设备供给方处理,同时启动备用空调,必要情况下可临时用备用空调对服务器进展降温。
〔3〕假如为墙体或机房门渗漏水,运维服务小组负责人应立即采取有效措施确保机房安全,与时去除积水,维修墙体或门窗,消除渗漏水隐患。
2.2设备发生被盗或人为损害事件应急预案
〔1〕发生设备被盗或人为损害设备情况时,使用者或管理者应立即报告系统突发故障应急领导小组,同时保护好现场。
〔2〕系统突发故障应急领导小组接报后,通知用户保卫部门、相关领导,一同核实审定现场情况,清点被盗物资或盘查人为损害情况,做好必要的影像记录和文字记录。
〔3〕事发单位和当事人应当积极配合公安部门进展调查,并将有关情况向系统突发故障应急领导小组汇报。
〔4〕系统突发故障应急领导小组安排运维服务小组、事发单位与时恢复系统正常运行,并对事件进展调查。
运维服务小组和事发单位应在调查完毕后一日内书面报告系统突发故障应急领导小组。
事态或后果严重的,应向相关领导汇报。
2.3机房长时间停电应急预案
〔1〕定期检查机房供电设备的运行状况和电路线缆器材情况,当发生如下突发事件时,按照以下方案进展处置:
〔2〕当机房发生市电供电突然停电或是电源异常时。
首先应和后勤部门联系确认正常停电以与预计停电时间。
检查不连续电源的电池可供电时间,确保设备正常运行,如遇到突然断电,应与时将空调等不在UPS电源供电X围内的设备与时断电,预防突然来电时瞬间电流过大导致设备损坏等现象。
〔3〕当确定停电时间超出机房UPS承载X围后,首先确定停电的X围以与受影响的设备X围。
并与时通知各部门做好停电应急准备。
然后通知机房电源维护人和设备的负责人到达现场,做好各设备的电源停电准备。
在UPS供电电量仅剩10%之后,严格按操作手册停掉各服务器的电源,最后停核心交换机和路由器,等待电力恢复。
〔4〕当确定停电原因是在本身供电系统X围内,立即汇报给负责领导,并与时联系相关维护人员达到现场检修。
对于恢复时间无法预计的,要通知后勤部门做好柴油机发电与移动电源车供电准备
〔5〕恢复供电后,严格按照操作程序逐步恢复机房设备和UPS的供电,以防瞬间电流过大造成设备损坏。
2.4通信网络故障应急预案
〔1〕发生通信线路中断、路由故障、流量异常、域名系统故障后,操作员应与时通知本单位信息系统管理员,经初步判断后与时上报运维服务小组和系统突发故障应急领导小组。
〔2〕运维服务小组接报告后,应与时查清通信网络故障位置,隔离故障区域,并将事态与时报告系统突发故障应急领导小组,通知相关通信网络运营商查清原因;同时与时组织相关技术人员检测故障区域,逐步恢复故障区与服务器的网络联接,恢复通信网络,保证正常运转。
〔3〕事态或后果严重的,应向应急指挥办公室和相关领导汇报。
〔4〕应急处置完毕后,运维服务小组应将故障分析报告,在调查完毕后一日内书面报告系统突发故障应急领导小组。
2.5不良信息和网络病毒事件应急预案
〔1〕发现不良信息或网络病毒时,信息系统管理员应立即断开网线,终止不良信息或网络病毒传播,并报告指挥调度中心运维服务小组和系统突发故障应急领导小组。
〔2〕运维服务小组应根据系统突发故障应急领导小组指令,采取隔离网络等措施,与时杀毒或去除不良信息,并追查不良信息来源。
〔3〕事态或后果严重的,应向监控中心办公室和相关领导汇报。
〔4〕处置完毕后,运维服务小组应将事发经过、造成影响、处置结果在调查工作完毕后一日内书面报告系统突发故障应急领导小组。
2.6服务器软件系统故障应急预案
〔1〕发生服务器软件系统故障后,运维服务小组负责人应立即组织启动备份服务器系统,由备份服务器接收业务应用,并与时报告系统突发故障应急领导小组;同时安排相关责任人将故障服务器脱离网络,保存系统状态不变,取出系统镜像备份磁盘,保持原始数据。
〔2〕运维服务小组应根据系统突发故障应急领导小组的指令,在确认安全的情况下,重新启动故障服务器系统;重启系统成功,如此检查数据丢失情况,利用备份数据恢复;假如重启失败,立即联系相关厂商和上级单位,请求技术支援,作好技术处理。
〔3〕事态或后果严重的,应向监控中心应急指挥办公室和相关领导汇报。
〔4〕处置完毕后,运维服务小组应将事发经过、处置结果等在调查工作完毕后一日内报告系统突发故障应急领导小组。
2.7黑客攻击事件应急预案
〔1〕当发现网络被非法入侵、网页内容被篡改,应用服务器上的数据被非法拷贝、修改、删除,或通过入侵检测系统发现有黑客正在进展攻击时,使用者或管理者应断开网络,并立即报告系统突发故障应急领导小组。
〔2〕接报告后,系统突发故障应急领导小组应立即指令运维服务小组核实情况,关闭服务器或系统,修改防火墙和路由器的过滤规如此,封锁或删除被攻破的登陆某某,阻断可疑用户进入网络的通道。
〔3〕运维服务小组应与时清理系统,恢复数据、程序,恢复系统和网络正常;情况严重的,应向监控中心应急指挥办公室和相关领导汇报,并请求支援。
〔4〕处置完毕后,运维服务小组应将事发经过、处置结果等在调查工作完毕后一日内报告系统突发故障应急领导小组。
2.8核心设备硬件故障应急预案
〔1〕发生核心设备硬件故障后,运维服务小组应与时报告系统突发故障应急领导小组,并组织查找、确定故障设备与故障原因,进展先期处置。
〔2〕假如故障设备在短时间内无法修复运维服务小组应启动备份设备,保持系统正常运行;将故障设备脱离网络,进展故障排除工作。
〔3〕运维服务小组故障排除后,在网络空闲时期,替换备用设备;假如故障仍然存在,立即联系相关厂商,认真填写设备故障报告单备查。
〔4〕事态或后果严重的,应向监控中心应急指挥办公室和相关领导汇报。
2.9业务数据损坏应急预案
〔1〕发生业务数据损坏时,运维服务小组应与时报告系统突发故障应急领导小组,检查、备份业务系统当前数据。
〔2〕运维服务小组负责调用备份服务器备份数据,假如备份数据损坏,如此调用磁带机中历史备份数据,假如磁带机数据仍不可用,如此调用异地备份数据。
〔3〕业务数据损坏事件超过2小时后,运维服务小组应与时报告系统突发故障应急领导小组,与时通知业务部门以手工方式开展业务。
〔4〕运维服务小组应待业务数据系统恢复后,检查历史数据和当前数据的差异,由相关系统业务员补录数据;重新备份数据,并在工作完毕后一日内报告系统突发故障应急领导小组。
2.10雷击事故应急预案
〔1〕遇雷暴天气或接上级部门雷暴气象预警,运维服务小组应与时报告系
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 网络 机房 应急 预案