问题及故障处置流程.docx
- 文档编号:25000467
- 上传时间:2023-06-03
- 格式:DOCX
- 页数:12
- 大小:49.38KB
问题及故障处置流程.docx
《问题及故障处置流程.docx》由会员分享,可在线阅读,更多相关《问题及故障处置流程.docx(12页珍藏版)》请在冰豆网上搜索。
问题及故障处置流程
系统问题及故障管理流程
1、相关概念
1)问题概念:
问题是一个或多个不知原因的事件。
2)问题与故障(或突发事件)的关系:
当问题的影响符合故障(或突发事件)概念标准时,问题即形成故障(或突发事件)。
3)故障处置小组:
故障处置小组由各业务流的故障牵头处置人组成,一路完成故障管理相关工作。
目前业务运营中心故障处置小组包括话单流陈霞、定单流张嘉琦、账务流刘华、热线支持组马立娜及值班组阴衍亮。
2、故障处置
一、角色及职责概念
1)故障上报人
按照故障上报标准判断为故障后,第一时间按要求发出报告邮件,并通知故障分派员。
对于符合故障或突发事件概念的问题,逐层升级至本部门主管领导;未达到标准的通知主管,由主管酌情升级。
对于故障或突发处置进程中未按时限回答进展情况,由故障上报人直接升级至故障分派员。
对于发生的故障,统一按业务运营中心内部要求进行记录。
故障上报人由业务运营中心50000号值班班长及运维组人员担当。
2)故障分派员
●接收故障上报人的报障邮件和报障通知。
●按照故障情况,以邮件及方式指定故障处置牵头人。
●按照故障牵头人要求,协助故障牵头处置人进行故障处置,跟进处置步骤,监督执行。
●故障分派员由值班组人员担任。
3)故障处置牵头人
●牵头处置故障分派员分派的故障。
●指派故障涉及的各部份人员协助进行故障处置,如有必要,可要求相关人员现场支持。
●跟踪整个故障处置进程,做好记录,评估各步骤的完成情况。
●组织BMCC相关人员和相关厂商人员进行故障处置方案的制定,掌控整个进程。
●监督故障处置各重要步骤的执行,做好资源调度,在异样问题及时升级至相关领导,协助完成资源调配。
●在原因明确后、方案确认后、方案实施关键点完成后及时通报故障最新进展,直至故障解决。
。
●按照故障处置情况及时向领导汇报故障处置情况。
●与对外信息发布人及时沟通,协商确认对外发布口径。
●记录问题处置进程,记录故障问题管理列表中的相关处置信息。
●负责故障处置完成后,整理并填写故障分析报告,并按时提交。
●总结及优化类似故障的处置步骤,为后续故障处置提供依据。
●按照故障管理员的要求组织故障分析会、故障分享会,对故障进行总结分析。
●故障处置牵头人由运维组/值班组人员担任。
4)对外信息发布人
●负责接收来自业务管理部门的统一报障。
●负责牵头拟定对业务部门的回答口径(重大问题报领导决策)。
●负责对业务管理部门发布统一回答口径。
●对外信息发布人由业务运营中心马立娜担任。
5)故障管理人
负责管理故障管理流程,更新流程文档,监督流程的执行。
对所有故障进行统一管理;符合故障标准的,催促故障报告的提交。
负责对故障报告/督办单进行审核,保证故障报告/督办单的质量。
依据故障的影响及复杂程度,要求故障处置牵头人召开故障分享会或故障分析会。
每一个月组织故障分析会及问题总结会和周例会。
每周按时提交故障周报。
故障管理人由业务运营中心故障处置小组担任。
二、故障处置流程图
三、流程描述
1)故障判断
符合以下标准,判断为故障,按以下故障上报流程处置:
故障通用标准:
高敏感业务出现问题
用户自助办理业务出现问题
用户存有凭证的业务出现问题
具体说明:
●短信接收到区域中心上报突发事件,核实为支撑系统问题。
●品质或市场部通知系统存在问题,核实为支撑系统问题。
●批量下发短信的内容有误。
●用户充值缴费、开停机业务有问题。
●批量用户发票打印或内容出现问题。
●批量用户账详单内容有误。
●客服终端、营业前台无法正常登录系统。
●各渠道通用业务的办理出现问题。
●影响北京公司在集团支撑系统考核成绩、集团公司信息化考核成绩。
2)故障上报
发现故障后的第一时间发出报告邮件,并通知故障分派人。
Ø邮件大体内容包括:
问题现象、报告时间、上报人、影响类型、问题来源、投诉量、投诉号码、初步定位。
Ø针对以下类型的故障,除大体内容外,还应按如实际情况增加故障邮件报障内容:
✧短信类:
品牌、短信内容、短信接收时间
✧充值类:
品牌、充值时间、问题详细情况
✧业务办理类:
系统失败界面截屏或详细的报错提示信息
✧系统登录类
系统失败界面截屏或详细的报错提示信息
✧话单类:
品牌、话单类型、影响时间段、具体错误描述
✧账务类:
品牌、影响用户范围、账期范围、具体错误描述
✧账详单显示类
品牌、错误截屏
Ø邮件发送范围:
主送:
值班组全部成员;抄送:
章玮,BOCM,信息系统部50000号组,刘华,陈霞,张嘉琦,徐晖,曲国强,王英基,石伟,吕鹏,杨海威,姜宏岩,陈云磊,杨英苹
Ø邮件主题:
报障:
故障现象简述
对于符合故障或突发事件概念的问题,逐层升级至本部门主管领导;未达到标准的通知主管,由主管酌情升级。
对于故障或突发处置进程中未按时限回答进展情况的,由问题报告人直接升级至故障牵头处置人。
对于发现问题,按故障记录表填写要求及时填写故障情况。
3)故障分派
收到故障上报人的邮件或报障后,按照故障的实际情况指定故障的牵头处置人,将邮件转发至牵头处置人并或当面通知牵头处置人完成故障处置。
故障牵头处置人的指派依据:
按照发生故障的实际情况,分派至运维组的业务负责人/值班组负责人,针对不明确的问题,分派至相应组的主管,由主管指定本组的故障牵头处置人。
针对涉及多组的情况,第一次分派的组为牵头处置组,牵头处置人也由此组指定。
4)故障处置
故障处置应以降低对外影响,减少用户不良感知为第一行动准则,故障处置全进程都应优先考虑此准则。
故障发生后,组织厂商人员首先进行业务恢复或降低影响的相关操作,尽可能减少用户感知。
相关应急手腕处置后,需组织相关人员查询和分析问题原因。
故障处置牵头人需组织亚信及BMCC相关负责人(包括开发中心及保护中心人员),一路讨论故障处置方案,综合考虑可能带来的用户影响,制定细节处置步骤,核查关键点,核查方案并指定具体负责人,针对重点步骤后设置决策点及决策人,明确计划后再开始进行故障处置。
故障牵头处置人需充分调配BMCC及厂商人员,在资源出现问题的情况,需升级至部门领导协助进行资源调配。
故障处置进程中若是关键路径中的步骤出现问题或延迟的情况,各步骤处置人员需提前上报至故障牵头处置人,由牵头处置人统一评估后续影响,及时通报。
如有必要,可从头组织相关人员进行讨论,确认最终方案。
故障处置进程中需及时与服务组及对外信息发布人沟通,确认最新的影响和感知,确认故障处置方案是不是需调整。
故障处置进程,进行相关决策点的决策,针对影响面大的重要决策,需升级至领导的进行决策,升级时需提供决策依据及建议方案。
故障处置进程中需及时向领导报告问题处置进展,针对可能出现问题或延迟的步骤需提前升级;
故障处置后,请及时填写故障记录表中的信息。
针对不能及时解决的问题,请填写处置进展。
5)故障总结
故障处置完成后,需及时更新故障记录表中的故障状态。
故障处置完成后,需在三个工作日内提交故障分析报告。
故障分析报告命名规则为:
故障分析报告_yyyymmdd_故障名称_处置人
故障分析报告格式及填写要求见附件:
●故障分析报告填写完成后,需由故障管理人审核通过,以后上载目录下,并发送邮件至章总、BOCM、故障管理人、相关故障处置人。
●针对品质下发的督办单,故障牵头处置人需按照故障产生原因,并结合此故障的对外的发布口径填写督办单中的内容,填写完成后需由故障管理人审核后,提交至对外信息发布人//部门领导,由对外信息发布人统一回答至品质部门。
6)故障分析
故障处置完成后,由故障管理员按照故障的情况,肯定各故障的后续分析方式,主要包括故障周例会,故障分析会,故障分享会。
故障分析方式的确认依据:
针对重复发生且处置流程简单的故障,可在故障总结后直接关闭。
针对处置流程较复杂需改良的故障,在故障周例会上具体讨论分析。
针对影响大且处置环节较多,流程复杂的故障,利用故障分享会的方式。
针对影响大但处置方式明确,但涉及系统实现较复杂的问题,利用故障分析会的形式。
以上形式可重复利用。
每周需依据本周故障发生情况及故障的最新进展,整理完成当周故障周报。
附故障分析会议要求:
✓故障周例会
牵头人:
故障管理人
参与人:
BOCM,(业务需求负责人)
频率:
每周一下午
目标:
针对每周的故障情况进行总结,包括重点故障及故障管理流程的实施情况,另外针对需讨论及升级问题进行重点讨论。
形式:
由故障管理员牵头主持,由领导、各组主管及厂商人员参与,针对话单流、交易流、账务流的重点故障进行别离的讨论,彼此了解,彼此借鉴;针对故障管理情况进行通报,讨论需改良项目及后续安排。
如涉及需求引发的故障,业务开发中心需求负责人也需参加进行讨论。
输出物:
故障周例会会议记要
✓故障分享会
牵头人:
故障牵头处置人
参与人员:
故障管理人、故障处置人、BOCM
频率:
不按时
目标:
通过度享会,让参会人员对故障处置的方式及处置思路有进一步的熟悉,旨在指导大家以后的故障处置进程,帮忙以后的方案制定。
形式:
由故障的牵头处置人做为主持人,引导参会人员针对故障的处置过程进行分析讨论,找出不足与问题,具体参与形式不限。
输出物:
故障总结资料,应包括出账处置的全进程,故障处置方案,处置进程的问题及改良,处置经验总结,系统知识积累总结、故障案例库输出等内容。
✓故障分析会
牵头人:
故障牵头处置人
参与人员:
故障管理人、故障处置人、厂商人员
频率:
不按时
目标:
通过度析会,让参会人员请楚了解故障涉及的相关系统实现方式,故障发生的根本原因,旨在加深大家对系统的了解程度,帮忙以后的故障定位。
形式:
由故障处置牵头人自己或联系厂商人员,针对此故障涉及的系统具体实现方式进行详细讲解,并将因故障造成的系统变更明确说明。
主持人与参会人员在会议进程中以可以以提问回答的形式增加对讲解内容的理解。
输出物:
故障分析会资料,包括系统实现及故障变更的培训资料,相关系统知识积累总结,故障案例库输出等内容。
3、问题处置
一、角色及职责概念
1)问题上报人
经判断非故障的问题,按要求发出问题报告邮件本组主管处。
对于发现问题,统一按业务运营中心内部要求进行记录。
问题上报人由业务运营中心50000号及运维组人员担任。
2)问题处置人:
针对问题进行初步判断,确认问题产生原因。
协调开发中心与厂商人员一路针对问题进行处置,并按期通报问题处置进展。
填写问题记录表中的相关信息。
问题处置人由业业务运营中心运维组人员担任。
3)问题管理人:
对于问题进行统一管理,每周通报整理问题进展情况。
针对问题流程进行监控,如有问题及时更新发布。
问题管理人由业业务运营中心刘华/阴衍亮担任。
二、流程图
三、流程描述:
1)问题上报
●发现问题后的第一时间发出报告邮件至本组主管处,并或当面与本组主管沟通问题情况。
邮件内容包括:
问题现象、报告时间、上报人、影响类型、问题来源、投诉量、投诉号码、初步定位情况
●各组主管在接收到问题上报邮件后,确认分析问题所属组别,将邮件转发至所属组的主管处,以后通知。
●问题上报人将上报问题的相关信息填写至故障问题管理列表中,是不是形成故障填写为否。
2)问题处置
●对问题进行初步整理及分析,确认问题按照原因。
●联系开发中心或厂商相关人员进行问题的处置。
●按期更新问题最新进展至故障问题管理列表,而且邮件回答问题上报人及其相关组主管,直到问题最终解决。
3)问题总结
●由故障管理员统一对问题进行管理,每周通报各问题的最新进展。
●针对因处置延时造成问题级别提升,可要求问题处置人将问题升级至故障。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 问题 故障 处置 流程