ITSMS应急预案.docx
- 文档编号:3903577
- 上传时间:2022-11-26
- 格式:DOCX
- 页数:7
- 大小:19.57KB
ITSMS应急预案.docx
《ITSMS应急预案.docx》由会员分享,可在线阅读,更多相关《ITSMS应急预案.docx(7页珍藏版)》请在冰豆网上搜索。
ITSMS应急预案
应急预案
编号:
ISMS-W07
状态:
受控
编写:
XXX
审核:
XXX
批准:
XXX
发布版次:
第A/0版
生效日期:
分发:
各部门
接受部门:
变更记录
变更日期
版本
变更说明
编写
审核
批准
PC服务器应急预案
1如遇到服务器硬盘报警,具体操作如下:
Ø联系业务工作人员,在其允许下,先拔出磁盘,稍等一会再重新将磁盘插入。
如果过几分钟后发现磁盘黄灯消失或者黄灯开始闪动,则一切正常。
Ø如果故障依旧存在,则利用SERVERRAIDMANAGER查看阵列信息。
将故障硬盘重新REBUILD。
如果故障消失,则说明为硬盘掉线导致的阵列信息报错。
Ø如果故障依旧存在,应尽快更换磁盘,同时做好磁盘数据的备份工作,否则同一阵列如果再有一个磁盘故障会造成整个系统崩溃。
2服务器电源报警
Ø联系业务工作人员,在其允许下,先将服务器关机,检查是否为供电,电源线的故障。
Ø如果供电以及电源线正常,需将服务器中的电源模块拔出,稍等一会再重新将电源模块插入。
Ø如果故障依旧存在,应尽快更换电源模块,同时做好备机的准备工作,否则冗余电源再出现故障,会造成宕机的危险。
3服务器内存报警
Ø联系业务工作人员,在其允许下,先将服务器重启,如果故障消失则为BIOS硬件自检导致的错误。
Ø如果故障依旧存在,需找到报错的是哪根内存(打开机箱或者在BIOS中均可以找到)。
将服务器关机,断电。
将故障内存拔出,稍等一会再重新将内存插入。
Ø如果故障依旧存在,需将服务器上其他没有报错的内存跟报错内存互换位置。
Ø如果故障消失,则为内存插槽故障,需将内存插槽清理除尘,或者联系IBM工程师更换配件(内存插槽故障出现的几率比较小)。
内存互换位置后如果故障依旧存在,则为内存故障。
一般报错内存为两根。
需利用服务器没有报错的内存,与两根报错内存轮流换取位置,以此来判断故障内存是哪一根。
找见故障内存,应尽快更换内存。
4服务器风扇报警
Ø联系业务工作人员,在其允许下。
Ø先将服务器关机,将故障风扇拔出,与其他风扇互换位置。
Ø如果故障风扇依旧存在,则为风扇硬件故障。
需尽快更换风扇,否则时间长了服务器会出现自动关机,重启等现象。
5服务器VRM报错
Ø联系业务工作人员,在其允许下,先将服务器关闭,将报错VRM模块拔出,与服务器上其他VRM模块互换位置。
Ø如果故障VRM模块依旧存在报错则为VRM模块硬件故障。
需尽快更换VRM模块。
此故障有两种现象,一种为开不了机,这种情况比较常见,此时应迅速做出故障诊断,联系配件。
一种现象为只有报错信息,但是机器还可以正常使用,此时应尽快解决故障,防止服务器无故宕机。
6服务器RAID报错
Ø联系业务工作人员,在其允许下,利用SERVERRAIDMANAGER查看RIAD信息,以及全部硬盘的状态。
Ø如果RAID信息正常,需将服务器数据备份,将RAID卡拔出,过一会再插上RAID卡,一般情况下故障会消失。
Ø如果发现RAID信息不正常,需将故障硬盘重现ONLINE。
如果硬件自检发现不了RAID卡或者SERVERRAIDMANAGER发现不了RAID信息。
则为RAID卡硬件故障,需尽快更换RAID卡。
(此故障风险比较大,做任何操作前需将数据备份)。
7服务器其他硬件故障
Ø如果发现服务器出现没有硬件报警但是出现开不了机等现象。
需联系业务工作人员,在其允许下。
Ø需查看BIOS报错信息,或者进入远程管理端口查看报错日志。
如果报错日志不明显,需将所有主板上的模块拔出(RAID卡除外)。
过一会再将所有模块重新插上。
Ø如果故障依旧存在,则大多数为主板老化或者主板电路虚焊导致。
需尽快更换配件。
Ø如果服务器出现CPU报错,需联系业务工作人员,在其允许下。
将故障CPU拔出,过一会再插上。
如果故障依旧存在,则为CPU硬件故障。
需尽快更换配件。
(CPU故障出现的几率比较低)。
8局域网内的PC服务器无法被其他机器ping通,不能正常访问,无法ping通服务器,检查网络连通状况,以及网线连接是否正常,有无插头松动等情况,具体步骤如下:
8.1排除服务器处于宕机状态
8.2排除局域网线路故障
Ø查看与服务器连接的网线是否与机箱连接完好;
Øping地址,确认局域网链路是否畅通。
8.3排除网卡故障
Ø查看与机箱连接的网线,网卡指示灯是否亮。
Ø若网卡正常,就需查看是否网线的故障。
8.4排除网线故障
Ø将网线连接至笔记本电脑上,测试能否正常获得IP。
Ø获得IP后,ping相应地址,确认局域网连接畅通。
Ø如无法获得IP,需重新制作水晶头后再进行测试。
9备件应急预案
系统集成项目现场对于关键设备必须在项目现场备留关键设备,当关键设备损坏时,立即替换。
10人力资源应急预案
每个运维项目必须同时配备两名项目经理A/B项目经理,当某一名项目经理不能获取时,另一名项目经理可更换。
日常中,进行项目共享,由服务部门经理对该部门所有项目经理进行项目培训,当项目发生时可跨项目支持。
火灾事故处置方案
1总则
1.1编制目的
为了预防和杜绝火灾,保障设备和人身安全,结合公司情况,特制定本案。
1.2编制依据
本预案依据《电力企业现场处置方案编制导则》、《电力设备典型消防规程》编制而成。
1.3使用范围
本预案适用于公司火灾事故时的现场处置方案。
2事件特征
公司位于太极大厦三层,一旦发生火灾则信息及通讯网络全部中断,将严重影响我公司的安全运行。
3应急组织机构及职责
3.1应急组织机构
Ø组长:
总经理
Ø副组长:
管理者代表
Ø主持部门:
综合部
Ø成员:
全体人员
3.2应急组织机构的职责
主要职责:
在组长的指挥下,迅速灭火,阻止火热蔓延,把设备的损失降至最低点。
在副组长的指挥下,迅速从安全通道撤离火灾现场,保障公司员工的人身安全。
4应急处置
4.1机房一旦发生火灾报警,值班人员应立即查明火源,迅速用灭火器进行灭火,力争把火式控制扑灭在初期阶段。
4.2若已发生火灾,则立即切断交流电源,开启直流事故照明,并迅速拨打“119”火警电话求援。
4.3当班人员根据火情发生的位置、扩散情况及威胁严重程度,首先通知起火楼层,然后根据火情逐区域的通知疏散。
4.4救火人员进行灭火的同时,还要及时通知医院值班医生、厂办值班司机,尽快增加援助人手。
5注意事项
5.1进入浓烟场合前,要及时佩戴防护装具。
5.2若火灾已发生,则先切断电源,并开启直流事故照明。
5.3坚持“救人第一”的思想,当火场遇有人受到火势威胁时,必须首先抢救人员。
5.4火灾后,清点疏散人员,并保护好现场。
网络系统应急预案
1目的
为了及时、迅速、有效地应对公司网络系统可能发生的突发事件,最大程度地预防和减少网络发生事故造成的损失,保障网络的正常稳定运行,特制定本预案。
2突发事故类型
2.1核心网络设备硬件故障,需要更换备机、备件的;
2.2由于网络线路问题,导致网络运行中断的;
2.3网络设备配置文件丢失,导致无法通信的;
2.5网络设备负载过大,导致设备宕机的。
3网络故障事件的分级与响应程序
3.1网络故障事件分级根据危害和紧急程度分为“三级/预警”“二级/报警”“一级/紧急”三级。
各级互联网网络安全事件定义如下:
3.1.1一级/紧急,下列情况之一为“一级/紧急”级别故障事件或者为“突发性”重大事件:
Ø导致网络瘫痪的事件;
Ø网络设备出现down机;
Ø有一条链路断开;
Ø设备无法登陆或者配置被更改。
3.1.2二级/报警,下列情况之一为“二级/报警”级别故障事件或者为“中级”故障事件:
Ø出现一种新的利用操作系统和应用程序漏洞的网络蠕虫,能够给网络造成部分断网的;
Ø出现网络带宽满负荷运作;
Ø网络设备cup、内存使用率达到80%;
Ø通过监测发现有个别协议数据流量异常的情况;
Ø由二级故障处理时间超过2个小时自动升级为一级故障。
3.1.3三级/预警,下列情况之一为“三级/预警”级别故障事件或者为“一般性”故障事件:
Ø网络出现严重丢包;
Ø网络设备端口出现down状态(物理up,协议down);
Ø网络设备cpu、内存使用率出现明显上升;
Ø导致一个及以上地市级网络总流量在24小时内异常增加50%的事件;
Ø由三级故障处理时间超过2个小时自动升级为二级故障。
4应急处理流程
为确保系统稳定运行,发生故障在最短时间内恢复,综合管理部网络管理员应在故障发生时立即做出响应,一方面进行故障判断与处置,另一方面进行备件/备机准备,若判定在2小时内不能解决故障的情况,将立即启用备机,确保生产业务在最短时间内恢复。
处理流程如下:
4.1突发事故的处理:
4.1.1网络系统发生故障后应由发现人立即通知网络管理员,相关人员应在最短时间内到达现场检查故障,进行故障定位。
如果网络出现比较严重的问题,对各系统业务的正常运行造成较大的影响,需立即向主管领导报告;
4.1.2网络管理员应迅速定位、排除故障,解决问题。
如果遇到设备硬件故障,需要更换设备备机的应立即向主管负责人汇报,迅速将备机数据准备完毕;如果需要更换设备配件的应立即向主管负责人汇报并立即联系第三方服务商提供配件。
更换设备备机、配件需要迅速的做出书面更换方案报主管领导签字批准并严格按照方案实施,尽快恢复网络故障,保障业务系统正常运行;
4.1.3若发现是网络链路故障的,应快速判断属于内部线路故障还是外部线路故障。
属内部线路故障的需要尽快查找故障原因,如果重新敷设线路的要按照网络线路敷设标准尽快敷设;属外部线路的问题,应与线路服务提供商联系,督促对方尽快恢复故障线路;
4.1.4若网络设备配置文件丢失,应及时将备份的配置文件上传到网络设备中,保证网络系统在最短的时间内恢复正常运行;分析造成事故的原因,针对具体问题,采取相应的安全措施;
4.1.5若发现网络设备负载过大,应迅速找出流量异常的端口,针对具体情况采取相应措施降低设备的负载。
注:
Ø网络管理员尽快(5-10分钟内)将故障情况向主管领导汇报,听从指示进行初步操作;
Ø网络管理员根据恢复时间标准确定是否启动备机;一边进行故障分析,一边进行备机准备,确保在2小时内能使系统恢复;
Ø网络管理员应在应用恢复后,召集所有相关人员进行集中诊断,制定系统修复方案,避免同样情况的再次发生。
并由网络管理员联合服务商一起执行系统修复方案;
Ø系统修复并经测试成功后,网络管理员发布系统服务恢复通告;
Ø网络管理员将故障的所有信息录入服务台知识库中;
Ø网络管理员准备“重大故障责任报告”并提出整改措施;
Ø部门主管负责审阅批准重大事件责任报告,并向相关领导分发报告;
Ø网络管理员负责跟进整改措施。
5发事故的预防
5.1待每日日常监控工作,及时发现问题,采取相应措施解决问题;
5.2份各网络设备的配置文件及设备IOS,在修改网络设备配置后也应及时备份,妥善保管;
5.3损的部件,应准备相应的备件,出现故障后及时更换;
5.4强自身学习,提高处理,分析问题的能力。
5.5新知识库,遇到类似问题参照知识库迅速解决。
6备件库
应急预案的关键就在于确保网络设备备件完整性,要不定期检查备件的情况,确保设备故障更换备件后能正常运行。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- ITSMS 应急 预案