运维项目工作总结参考Word文件下载.docx
- 文档编号:22420794
- 上传时间:2023-02-04
- 格式:DOCX
- 页数:16
- 大小:69.35KB
运维项目工作总结参考Word文件下载.docx
《运维项目工作总结参考Word文件下载.docx》由会员分享,可在线阅读,更多相关《运维项目工作总结参考Word文件下载.docx(16页珍藏版)》请在冰豆网上搜索。
5运维工作总结
5.11-8月份
1月份到8月份,XXXX处于系统测试与部署阶段,XXXX公司提供的服务为系统进行全面测试、部署、业务协维、协助XXXX机房搬迁等内容,共计提供215人天运维服务工作,其中XXXX上线测试投入4人共56人天;
系统部署上线共投入3人共48人天;
XXXX机房搬迁投入1人共8人天;
二线支撑投入1人共83人天;
XXXX系统优化投入1人共20人天。
运维工作量按月分布图
工作类型
1月
2月
3月
4月
5月
6月
7月
8月
合计
所占比例
系统测试(人天)
18
23
15
56
16.2%
系统部署(人天)
8
40
48
XXXX机房搬迁(人天)
XXXX优化(人天)
3
2
20
9.3%
二线支撑(人天)
4
5
7
10
12
19
83
21%
总计(人天):
30
61
80
215
100%
5.1.1XXXX系统测试与部署
XXXX按照XXXX基地实际业务需求定制开发,开发项目组内部测试通过后,需提交到运维人员内部及XXXX内部进行测试验证,运维人员内部由XXXX公司的业务协维工程师和驻点工程师3人共同完成,包括XXXX基本的业务功能,如ZS申请、ZS审核、ZS下载、ZS批量申请等,共完成测试用例138起。
根据XXXX需求文档及测试用例严格执行,业务功能基本符合要求后,XXXX公司工程师正式部署上线XXXX系统。
5.1.2协助XXXX机房搬迁
XXXX在7月份进行机房搬迁,XXXX工程师协助XXXX局方完成服务器的搬迁,包括服务器的网络调试、XXXX系统的应用部署等。
5.1.3二线专家支撑
1-8月份二线支撑服务主要包括以下工作:
●对XXXX开发人员及测试人员提供专业的知识指导。
●制定XXXX系统现网作业方案(版本升级方案、新版本的产品说明;
patch升级方案,打完patch后的产品说明;
系统调整方案;
相应的升级回退方案)
●解答XXXX等局方人员的技术难点。
部分工作明细:
工作任务
工作描述
其他业务
OFFLINEXXXX、OCSP数据库连接一段时间后超时
分析日志发现oracle连接在建立8小时后会自动断开,故需要使用连接池来避开这个问题。
对OFFLINEXXXX、OCSP与数据库的连接方式进行改造,改为连接池方式,解决了问题。
远程支持
XXXXtomXXXXt启动异常
日志显示TomXXXXt启动时,连接JBossEJB服务异常,检查JBossEJB状态,发现EJB对外暴露的ip地址是192.168.8.2,,而XXXXweb的jndi配置指定为127.0.0.1,故找不到EJB服务。
指导运维人员启动XXXXJBoss时不加-b参数,解决了问题。
局方希望XXXX能支持以前采购的BJXXXX的key,相关改造工作的调研
沟通得知此批KEY厂商为飞天,与飞天的技术人员沟通,提出改造需求,由他们评估改造可行度,将结果反馈给局方。
XXXX控件对多厂家key的支持
与需要支持的厂家技术人员联系,给他们说明需要定制的需求,并跟进进度。
5.1.4XXXX系统优化
针对XXXX部署上线进行全面测试后出现的BUG进行修复:
优化类型
内容描述
修复BUG
对OFFLINEXXXX、OCSP增加数据库连接池,解决这两个模块应用与数据库连接一段时间后超时的问题。
因为审计页面存在多个元素id为log,导致OCSP审计页面显示异常,修复此问题。
除RA外,其他分系统的审计功能有问题,点“审计”页面弹出窗口提示“该密钥集未被定义”。
因为审计功能记录日志时,指定操作员ZS容器为ipass-key,因为容器不对,初始化时出错。
修复此问题。
数量统计导出excel乱码,因为产生excel文件内容时没有指定字符编码,修复此问题。
XXXX企业ZS管理查询结果只有一条ZS时,不能做吊销。
因为页面JS有错,修复此问题。
5.29-12月份
9-12月份,XXXX平衡运行的同时,成功接入集团采购门户系统与XXXX基地4A系统,为这两个系统提供最高级别的安全保障。
按XXXX公司的要求,XXXX公司配备的4位运维人员,包括两位驻点工程师与两位业务协维工程师,到XXXX基地现场办公,能够及时响应XXXX局方的要求。
XXXX公司为XXXX提供全面的运维服务,包括硬件巡检、软件巡检、XXXX系统巡检、业务协维、二线专家支撑等,共计445人天,其中硬件巡检46人天,软件巡检46天,XXXX系统巡检90天,故障处理2天,业务协维174天,二线专家支撑87天,其中10人天为晚上加班。
运维工作量按月分布图
9月
10月
11月
12月
硬件巡检与监控(人天)
11
46
10%
系统软件巡检与监控(人天)
XXXX系统巡检与监控(人天)
22
90
20%
XXXX系统故障处理(人天)
1
0%
87
29.4%
业务协维(人天)
44
174
111
108
110
116
445
5.2.1系统运维支撑
5.2.1.1系统巡检方式
5.2.1.1.1远程方式
因XXXX系统机房部分办公设备还没准备好,所以只能通过远程连接服务器方式,对各个服务区及服务器进行巡检,巡检内容如下:
区域
服务器地址
5.2.1.1.2现场方式
现场巡检方式是驻点工程师通过到达XXXX机房内部,通过观察各服务器硬件指示灯、风扇运行等,检查服务器系统运行状态,巡检的服务器数量如下:
设备名字
数量(单位:
台)
Linux服务器
Unix服务器
6
磁带库服务器
交换机
17
加密机
防火墙
5.2.1.2系统维护巡检内容
5.2.1.2.1远程方式巡检内容
●检查服务器CPU使用情况
●检查服务器硬盘使用情况(针对home目录)
●检查服务器内存使用情况
●检查系统进程运行情况
●通过查看日志,检查系统运行情况
5.2.1.2.2现场方式巡检内容
●各服务器指示灯
●各服务器风扇运行状态
●交换机指示灯状态
●检查机房实时温度是否达标
●检查机房设备温度是否过热
●检查机房卫生是否符合要求
●有无临时接线搭线未清理
5.2.1.3系统运行分析
5.2.1.3.1系统CPU分析
各服务器CPU运行均都处于正常指标(CPU使用率<
=85%)范围内,具体如下:
5.2.1.3.2系统内存分析
各服务内存使用正常,没有发生内存占满或内存溢出等故障,保证了各服务进行的运行:
5.2.1.3.3系统硬盘空间分析
各服务器空间以小幅度的速率增长,健康状况良好:
5.2.1.3.4系统进程运行分析
服务器的应用进程处于正常状态,具体如下:
系统名字
进程检查情况
5.2.1.3.5系统故障分析
XXXX系统9-12月出现故障情况如下,在故障发生的第一时间,运维人员收到监控系统的邮件通知,并在收到邮件通知的第一时间进行处理,并把故障原因通报XXXX公司相关负责人,在完成后进行记录、整理,输出相应的故障报告等:
故障出现时间
故障服务器
故障起因
故障影响
是否修复
2011-9-2411:
192.168.8.2
网络问题
因为8.1和8.2服务器做的是负载均衡8.2出现暂时连接不上,不影响业务的正常运行
已修复
(机器网络不通,重启后恢复正常。
2011-10-25
192.168.6.6
数据库服务器硬件问题
目前未对外提供服务,本次故障未造成对外服务的影响。
5.2.1.4现网作业工作
任务简介
任务描述
执行人
备注
制作模板
生成个人,企业,服务器模板,有效期为3年
签发操作员ZS
签发LA操作员ZS
模板备份
系统现有模板进行备份
系统升级
系统920版本部署上线,并进行功能测试
防火墙操作
核查防火墙配置
XXXXV001R001B004版本的上线升级
核实数据
去后台数据库核实数据
系统部署
安装部署XXXX业务监控系统
系统备份
去机房配合粟钫对防火墙进行配置、对ocsp数据库进行排错定位、对备份服务器的配置
硬件支持
现场协助惠普工程师处理数据库服务器问题,最后硬件故障解决,p数据库恢复正常
IDS加电检查
检查绿盟的IDS入侵检测设备加电情况
渗透测试
配合华为对XXXX系统进行入侵检测和渗透测试
软件验收
XXXX软件验收KMC、XXXX部分
应急演练
配合XXXX局方进行XXXX系统应该演练
5.2.2业务协维
5.2.2.1系统业务管理
●创建ZS模板:
因项目需求创建项目适用ZS模板,并做好模板备份工作。
●创建受理点:
为项目创建新受理点,配置人员等。
●创建应用类型:
为集团采购部项目创建单独应用类型,便于项目ZS量的统计及数据分析。
●操作员权限分配:
一方面满足项目需求,另一方面根据安全规范分配。
●系统升级上线业务功能测试,保证系统业务功能的可用性与完整性。
●XXXX系统内部全面测试:
完成内部系统测试,为XXXX系统软件功能验收测试做好充足准备。
●系统监控系统功能部署前测试及功能演示等工作。
●参与XXXX系统定制开发需求的评审并提出修改意见,与开发人员配合讨论确认方案,保障开发前需求评审及方案制定工作顺利完成。
●配合南基4A系统接入的联调测试。
5.2.2.2运营支撑内容
●受理集团的上线。
●等。
●平台相关人员对XXXX的问题。
5.2.2.3ZS业务客户服务与支持
受理集团的ZS业务客服咨询与故障投诉申报;
ZS业务流程咨询、ZS使用问题技术支持。
1)指引、FAQ等日常文档输出:
●《XXXX业务系统接入指引》
●《CMXXXXOpenAPI需求规格说明书》
2)系统业务测试:
系统920版本部署前测试,及功能演示,上线后功能验证等工作。
3)系统业务测试:
系统1129版本部署前测试,及功能演示,上线后功能验证等工作。
5.2.2.4运营数据分析
此图为2011年XXXXZS发放分析
指标分析说明:
5.2.3专家服务
5.2.3.1运维体系的建立
制定规范制度:
规范ZS发行、客户服务等工作流程行为,基于经验、结合CMXXXX的业务特性,制定了CMXXXX数字ZS发行规范、、CMXXXX数字ZS客户服务规范等文档。
为建立健全运维、运营体系提供了坚实的基础。
5.2.3.2输出文档
●《XXXXCMXXXX应急响应计划》
●《CMXXXX系统运维规范》
●《CMXXXX行规范》
●《CMXXXX客户服务规范》
5.2.3.3运维、系统二线支撑
●机房网络现场调试
●网管监控方案及讨论
●定制开发需求评审
●部署方案审核
●现网作业密码管理
●XXXX明年发展规划
5.2.3.4运营优化
根据项目支撑情况,提出日常运营优化建议:
●规范ZS申请流程
●规范ZS使用流程
●规范UKEY使用流程
5.2.3.5XXXX应用接入
。
5.2.3.6运维风险评估
渗透测试:
为了保障XXXX系统的安全性,应XXXX基地要求,地XXXX进行渗透测试,从外网到内网全方位、漏洞渗透等,取得了良好的效果。
5.2.4系统定制开发
根据应用项目的特性、运营人员提出的优化需求,进行需求分析、评审,输出解决开发,协调资源进行定制开发工作,把控定制开发质量。
1)XXXX支持二级审核开发及上线
改造XXXX,使其支持二级审核。
对应用类型配置其下ZS的审核级别。
如果是一级审核,。
2)系统监控功能的需求分析及评审
对CMXXXX系统业务进行监控,当系统异常时通过邮件方式通知系统维护人员。
系统暂时不考虑对系统权限的管理控制。
3)系统定制开发功能的测试环境搭建。
部署XXXX定制开发到测试环境,完成测试组内测试,进而运营人员针对业务功能进行测试并已完成测试。
目前XXXX11月版本已部署上线,验证工作也已基本结束。
6规范运维流程
随着运维工作的逐渐开展,在与XXXX公司的工作配合过程中,通过引入XXXX公司的服务运营管理平台(somp),规范了运维工作流程,包括事件管理流程等。
所谓事件,是指系统运行过程中突然出现的造成服务中断或服务质量下降的突发现象。
事件管理流程通过对事件的相关环节进行规范,从事件的记录开始,经过分类和初步支持、调查与诊断、解决和恢复,直到与客户确认后事件的关闭,流程中的各个环节前后相连,流转有序,并规定每一环节处理的最长时限。
通过事件记录员、事件分析员以及事件经理等角色的明确,责任到人。
从而达到在发生事件后,能在最短的时间内解决并恢复客户中断的服务,提高客户满意度。
XXXX公司通过开发XXXX业务流程监控系统,定时对XXXX业务流程进行监控拨测,在XXXX发生故障第一时间通过邮件或短信的方式通知运维工程师,运维工程师第一时间进行故障处理并上报XXXX相关负责人,并在故障出理完成后,输出故障报告给XXXX公司,使得对每次故障做到跟踪、归纳总结的作用。
7总结与明年展望
随着2011年的脚步慢慢走远,XXXX公司在XXXX公司的大力支持下,XXXX运维工作已经步入正轨,按XXXX公司和XXXX的要求完成了对XXXX的维护工作,保障了XXXX的平稳运行,通过回顾总结今年的工作,也发现运维工作中存在不足的地方,XXXX公司力争在以后的工作中改进。
2011只是XXXX运维工作的一个起点,2012年随着更多XXXX外部与内部业务系统的接入,XXXX也面临着越来越大的负载,同时运维工作也面临新的挑战,无论是对XXXX系统能力保障、业务人员协维能力,都将给XXXX公司和XXXX公司提出更高的要求,需要运维人员能力提升到另一个高度,XXXX公司在面对挑战面前,非常有信心,在XXXX公司的指导和支持下,对现有运维人员进行技术能力、业务能力等多方面提高,根据业务发展要求,增加各方面资源投入,明年会更加出色的完成XXXX运维工作,把运维工作更加规范化、专业化,更上新台阶。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 项目 工作总结 参考