数据中心机房工程运维管理实施方案Word格式.docx
- 文档编号:20257988
- 上传时间:2023-01-21
- 格式:DOCX
- 页数:25
- 大小:1.01MB
数据中心机房工程运维管理实施方案Word格式.docx
《数据中心机房工程运维管理实施方案Word格式.docx》由会员分享,可在线阅读,更多相关《数据中心机房工程运维管理实施方案Word格式.docx(25页珍藏版)》请在冰豆网上搜索。
制定相应的机房治理制度,使日常治理工作做到有章可循,有据可依。
2〕严格治理。
作为部门领导一定要有从严治理的指导思想,要严格治理、严格要求,并使这种严格思想贯彻落实到治理工作的全过程,在实际工作中要常讲、常查,要不怕得罪人,必要时还要制定各种奖惩措施。
3〕做好日常运维和巡检工作,包括配电、空调、消防等设施的检查工作。
4〕不断学习。
机房治理牵涉面广,事务又多,是一项专业性强、〝繁〞、〝杂〞、〝难〞、〝累〞的工作,具有一定的不可预见性,且不同程度地存在技术难度。
目前国内许多报刊杂志包括互联网络中,有关机房治理的介绍层出不穷,机房治理科长需要有责任心和不断学习的进取心。
机房治理科长除了要把握丰富的运算机软硬件知识和具有较强的动手能力外,还需要把握一定的设备治理技巧,学习各种设备如配电系统、地线系统、空调、防火设备、UPS等的正确操作方法,从而杜绝因操作不当造成的人为事故。
不断学习,总结体会,取长补短,才能做好机房治理工作。
5〕做好机房的防火、防盗及供电系统、空调系统、通风系统的安全和日常养护工作,提高安全意识。
定期检查安全设施情形,并做好记录,发觉问题赶忙整改。
6〕定期检修,重视完善。
机房以及有关设备也有老化、更新、修复等问题,除进行日常的检修外,还应对机房建设时存在的缺陷,机件的磨损、老化,紧固件的松动,装修变形等问题定期检修、更换或完善。
坚持每年定期对机房整修一次,即检测安全防火设备、检修空调设备、除尘、玻璃隔断调整加固、照明设备检修、安全防盗、和谐相关设备修理人员进行修理,安排好相关修理工作。
7〕关于发生的故障与事故及时逐级上报,并做和谐工作,做好故障与事故的记录工作,做好问题的分析和跟进处理工作。
8〕完善电气系统设备技术档案和资料,建立相关治理制度、操作规程、应急预案等。
9〕在制度化治理上下功夫,组织、指导、制定年度工作打算和各种操作规程、治理规定、岗位职责和安全责任制等,并监督落实,以实现科学、有序、安全的治理。
10〕机房不能显现事故,加强巡视巡检。
要治理好机房不是一件容易的情况在条件许可的情形下,应建立经济合理的易损件、易耗件的备用库,保证及时更换,定期更换。
对设备的运行情形进行分析,制定预防和常用解决方案,从而保证机房的正常运转。
11〕严格机房钥匙治理,机房钥匙只承诺治理人员配带。
1.1.2 机房治理科长的〝三心〞
机房治理科长的三心即责任心、学习心、宽容心。
1.责任心
责任心要紧有如下内容:
〔1〕安全治理
机房安全是第一位的,能够说是机房治理体系的灵魂。
威逼机房安全的因素要紧有火灾、设备故障、病毒。
机房安全治理确实是告诉人们,在进行机房治理的同时,通过采纳打算、组织、技术等手段,依据机房、环境因素的运动规律,采取操纵措施,预防事故的发生。
〔2〕六个坚持
六个坚持是指:
1〕坚持管机房同时管安全;
2〕坚持按操作规程治理机房;
3〕坚持预防为主;
4〕坚持全员治理;
5〕坚持设备爱护;
6〕坚持日常巡检工作。
〔3〕四不放过
四不放过是指在调查处理机房事故时:
1〕必须坚持事故缘故分析不清不放过;
2〕职员及事故责任人受不到教育不放过;
3〕事故隐患不整改不放过;
4〕事故责任人不处理不放过。
〔4〕文明治理
文明治理是指在治理时:
1〕具有文明的措施〔机房的各项规章制度〕;
2〕建立治理组织,明确岗位职责,健全治理制度〔培训教育、检查、奖惩、卫生等专项治理制度〕;
3〕进行现场治理。
2.学习心
科长的大部分时刻是做机房治理的实际工作。
他要不断地学习各种设备的正确操作方法和治理方法,治理的思维方式与知识结构要紧跟时代的步伐,并在技术上与项目一起成长。
只有如此才能让科长提高领导能力,在治理工作中舒展自如、张弛有度。
3.宽容心
科长要有宽容的心态,专门是对比较年轻的职员。
现在的职员都比较年轻,没有社会的阅历,自我为中心的意识强、自尊心强,有时候会做出一些过分的行为。
当职员做了错事或工作中显现差错时,不要声讨,不要去追究责任。
作为科长,应该多花一些精力去关怀职员,多给予明白得,做到〝宰相肚里能撑船〞,了解情况的起因,幸免今后再犯错。
年轻职员有自己的长处和短处,要经常夸奖他的长处,求同存异,具有一颗宽容的心。
1.1.3 治理人员岗位职责
机房日常运行、爱护是治理人员的全职工作岗位。
治理人员的岗位职责需要重点注意如下内容:
1〕负责机房电气系统的运行、爱护、保养、治理工作。
2〕认真贯彻落实岗位责任制,遵守各项规章制度,严格执行操作规程和职员守那么。
严格执行机房值班制度,做好值班记录;
严格执行机房设备使用登记制度,做好设备登记工作。
3〕熟悉设备操作规程,熟悉仪器外表使用方法。
熟悉、把握设备的原理、布置、操纵、设备性能、使用状况及运维操作。
爱护工作应遵循设备故障与修理的操作步骤、差不多原那么和修理方法进行。
机房应备有设备所用的各种零配件,供修理使用。
4〕服从领导的调度和工作安排,按时、按质、按量地完成任务,不擅自离岗和串岗,禁止在上班时刻炒股、扫瞄无关新闻、网上游戏、看在线电影、听音乐等。
5〕努力学习,不断提高思想素养和业务技术水平,全面熟悉管辖范畴内的各种操作规程,提高工作效率、质量。
6〕认真填写原始记录,分析设备运行情形,并把握其规律,发觉问题及时解决,准确无误地填制各种报表和表格。
7〕勤巡查,发觉问题及时向治理科长汇报,听取指示。
8〕参与并协助设备的爱护和保养工作。
设备发生故障及时组织检修,发觉隐患及时组织处理,做好技术把关工作,保证所管辖系统设备处于优良的技术状态。
做到〝三洁净〞〔设备洁净、机房洁净、工作场地洁净〕、〝四不漏〞〔不漏电、不漏油、不漏气、不漏水〕、〝五良好〞〔使用性能良好、密封良好、润滑良好、紧固良好、调整良好〕。
9〕发扬主人翁精神,开动脑筋,大胆提出合理化建议。
10〕做好本班设备的年月检修保养打算和备品备件打算,报主管审核。
1.2 机房内治理的内容
1.2.1 制定机房治理的规章制度
建立健全运算机机房各项规章制度是做好机房治理的关键。
在机房日常治理工作中应依照系统的具体情形、工作性质,制定出一套完善的机房治理规章制度,以保证机房正常运行。
规章制度用来规范机房的治理,是机房治理的标准。
规章制度要通过日常工作中对它的执行来表达和完善。
机房治理制度一样包括:
治理科长岗位负责制、技术治理岗位职责、中心机房治理制度、安全运行治理制度、运算机病毒防范治理制度、安全治理制度、故障机修理登记制度、机房违章处理制度、机房巡检制度等。
有了章法,机房治理就有了依据,严格治理的指导思想也能落在实处。
1.2.2 大、中型机房的日常爱护工作治理的内容
大、中型机房的日常爱护工作的治理要重点注意如下内容:
1〕保持机房整洁卫生,治理人员负责日常爱护及机房卫生工作,做到一天一小扫,一周一大扫,保持机房清洁洁净,防尘防潮,防止鼠虫进入。
2〕不准在机房内会客,谢绝外单位人员进入机房,禁止谈天、喧哗、吃零食、抽烟、乱扔杂物等,保持机房整洁安静。
3〕严禁携带易燃、易爆及强磁性物品进入机房。
4〕设备一样不得用于私事,严禁在设备的运算机终端上玩游戏,禁止装入其他无关的软件或将运算机挪作他用。
5〕日常检测,包括对设备运作情形及系统应用情形的检测。
①设备运行情形检测:
·
每日分8次〔每3小时〕定时进行要紧网络设备的检测。
做好每日网络巡查与服务器运行情形记录。
每日对外网服务器日志进行分析,对长时刻扫描的IP做好记录,并采取跟踪,一旦发觉问题及时处理,把隐患消灭在萌芽状态。
定期运用系统的网络监视器、网管软件,对网络漏洞进行自我扫描检测,进行分析,做好相应记录。
②系统应用情形检测:
对应用软件要每天进行检测,及时升级,专门是防毒软件的升级。
各种应用功能配置参数进行修改时必须与值班人员一同进行,并登记记录。
新增加功能必须通过主管领导签字同意。
6〕如发觉机器故障应及时向主管及上级领导报告,并负责运算机及外设的日常爱护与排除故障,处理不了的问题应赶忙向有关单位联系解决。
遇到紧急情形不要慌张,切忌手忙脚乱。
在遇到三包范畴内的故障时,应及时督促公司上门或将机器送公司修理。
7〕机房运算机只供机房工作人员使用。
未经组长同意,任何人不准随意删改和增加系统文件,不得将机房内资料、工具等物品带出机房。
8〕机房内的一切公用物品〔包括低值易耗品、软件及资料〕未经许可一律不得私自挪用和外借。
外单位需借出设备及物品,应有单位证明和经手人签名的借条,经主管领导批准后,机房工作负责人才能开具放行条。
未经主管领导同意,不准自行复制系统内所有的软件和数据或将其赠送、转借给外单位人员。
9〕经常检查网络和各设备运行情形,发觉问题及时解决,并向主管领导报告。
10〕其他人员需使用机房内设备应征得治理人员许可,并报经主管同意后方可进入机房。
11〕对机房内网络与设备的运行、应用、爱护、查看等情形,建立档案,做好系统日志。
要对发生的故障〔隐患〕以及排除故障情形做好详细记录;
值班人员必须认真、如实、详细填写«
机房日志»
等各种登记簿,详细记录来人、事件、处理通过等,以备后查。
定时做好中心服务器的日志和存档工作,任何人不得删除运行记录的文档,否那么追究责任。
如机房发觉意外和紧急情形要及时报告,对重大事故要注意爱护好现场。
12〕要统一治理机房内的设备,运算机及其相关设备的驱动程序、保修卡等随机文件与资料要储存完整。
要明确专人负责运算机文档、信息化等资料的保管,要做到资料齐全,存放安全。
13〕机房内的交换机和服务器是公司办公自动化的关键设备,任何人不得自行配置或更换系统参数。
14〕各客户机应及时做好自身数据的储存工作,不得擅自更换系统及网络设置。
如确有工作需要应报至办公室,由办公室指派专人进行,并记录在案。
15〕要做好机房的安全工作,对服务器的各种账号、密码严格保密。
对网络运行做好监控、做好记录。
16〕要及时做好各服务器系统的补丁修正与升级工作。
17〕治理人员要有较强的病毒防范意识,要定期对病毒库进行检测,并做好病毒库系统的定时升级工作。
发觉病毒应及时处理,并做好记录。
18〕未经许可,不得在各服务器上安装新软件。
如确实工作需要安装,要通过有关领导批准。
19〕应及时做好数据的备份工作,保证在系统发生故障时,数据能够快速、安全地复原。
所有备份数据不得更换,并要求做到本地和异地双备份储存。
20〕机房内所有设备应妥善保管,任何人不得擅自开关、移动或者使用机房中的任何设备,如有此方面的需要,需有主管领导的批示。
1.2.3 大、中型机房的日常安全治理的内容
大、中型机房的日常安全治理,要重点注意如下10点内容:
1.出入机房治理的内容
1〕严禁非机房工作人员进入机房,专门情形需经中心负责人批准,并认真填写登记表后方可进入。
严禁非工作人员上机操作。
进入机房人员应遵守机房治理制度。
2〕进入机房人员不得携带任何易燃、易爆、腐蚀性、强电磁、辐射性、流体物质等对设备正常运行构成威逼的物品。
严禁将其他与机房工作无关的物品带入机房。
3〕假设治理人员申请调走,报告经单位批准前,重大的治理工作提早交接,把密码、钥匙、注意的问题等交接给单位指定人员。
2.机房防火治理的内容
机房是重点防火单位,应做好防火工作。
机房工作人员必须严格遵守各项操作规程。
拆装设备时必需断电,不承诺带电作业;
修理设备时必须先切断设备电源,再行修理;
禁止使用汽油、酒精等易燃易爆品清洗带电设备;
严禁在机房内吸烟和使用加热器具。
防火治理的重点是气体灭火系统能否发挥正常作用。
对气体灭火系统爱护治理要注意如下4点内容:
1〕气体灭火系统应由通过专门培训,并经考核合格的人负责定期检查和爱护。
2〕应做好对气体灭火系统的定期检查,并做好记录。
检查中发觉的问题应及时处理。
3〕每月应对系统进行一次检查,发觉问题应及时处置,检查内容及要求如下:
对全部系统组件进行外观检查,系统组件应无碰撞变形及其他机械性损害,表面应无锈蚀,爱护漆层应完好,铭牌应清晰,手动操作装置的爱护罩、铅封和安全标志应完整。
全部系统组件的安装位置不得有其他物件阻挡或阻碍其正常工作。
驱动操纵盘面板上的指示灯应正常,各开关位置应正确,各接线应无松动现象。
火灾探测器表面应保持清洁,应无任何会干扰或阻碍火灾探测器探测性能的擦伤、油渍及油漆。
储存容器上的压力表,其指针应在正常的范畴内。
设备可否移位。
设备工作是否正常。
4〕每年应对系统进行两次全面检查,检查内容和要求除按月检查的内容外,还应符合如下要求:
①防护区的开口情形、防护区的用途及可燃物的种类、数量、分布情形,应符合设计规定。
防护区外的疏散通道应保持畅通。
②储存容器的固定支架,应无松动现象。
③灭火剂输送管路与喷嘴的连接、灭火剂输送管路本身的连接应安装牢固。
④灭火剂输送管路及电气管路的固定支架应无松动现象。
⑤高压软管应无变形、裂纹及老化。
⑥各喷嘴孔口,应无杂物堵塞。
⑦对每个防护区进行一次模拟自动启动试验。
⑧手动操纵、手动/自动切换、紧急停止操作、备用灭火剂储存容器切换操作应正常。
⑨探测设备运行情形检查:
要紧检查连接线路及探测器灵敏性。
⑩操纵设备运行情形检查:
操纵器同意火灾信号情形〔包括探测、急启、急停、反馈〕。
操纵器同意故障信号情形〔包括探测、急启、急停、反馈、主备电、阀线〕。
操纵器联动性能及各个被联动器件的性能。
记录并分析操纵器储存信息。
[11]建立灭火系统使用档案,对使用、检查、修理与试验做详细记录。
3.机房用电安全治理的内容
1〕机房人员应学习常规的用电安全操作和知识,了解机房内部的供电、用电设施的操作规程,注意用电安全,无触电隐患,注意节约用电。
2〕机房应安排有专业资质的电工定期检查供电、用电设备、设施。
3〕机房内不得乱拉乱接电线、电源,应选用安全、有保证的供电、用电器材。
4〕在真正接通设备电源之前必须先检查线路、接头是否安全连接以及设备是否差不多就绪、人员是否差不多具备安全爱护。
5〕严禁随意对设备断电、更换设备供电线路;
严禁随意串接、并接、搭接各种供电线路。
6〕如发觉用电安全隐患,应赶忙采取措施解决,不能解决的必须及时向相关负责人员提出解决。
7〕禁止在无人看管下在机房中使用高温、酷热、产生火花的用电设备。
8〕在使用功率超过特定瓦数的用电设备前,必须得到机房治理人员批准,并在保证线路保险的基础上使用。
9〕在外部供电系统停电时,机房工作人员应全力配合完成停电应急工作。
4.设备安全治理的内容
机房设备要保持清洁、卫生,定期打扫,不定期对机房内设备进行检查,发觉故障及时检修,并要登记、报告。
因违章作业造成事故缺失的,要按责任事故处理。
设备安全治理的具体内容如下:
1〕机房人员必须熟知机房内设备的差不多安全操作和规那么。
2〕定期检查、整理硬件物理连接线路,定期检查硬件运作状态〔如设备指示灯、外表〕,从而及时了解硬件运作状态。
3〕禁止随意搬动设备、随意在设备上进行安装、拆卸硬件或随意更换设备连线,禁止随意进行硬件复位。
4〕路由器、交换机和服务器以及通信设备是网络的关键设备,不得自行配置或更换,更不能挪作他用。
要定期检查是否规范,经有关领导同意后再变更。
5〕网管人员应做好网络安全工作,服务器、各种核心设备等的各种重要账号严格保密,规范治理。
监控网络上的数据流,从中检测出攻击的行为并给予响应和处理。
做好操作系统的补丁修正工作。
6〕禁止在正式运行的服务器上进行试验性质的配置操作,需要对服务器进行配置,应在其他可进行试验的机器上调试通过并确认可行后,才能对服务器进行准确的配置。
7〕不承诺任何人在服务器、交换设备等核心设备上进行与工作范畴无关的任何操作。
未经机房治理人员承诺,更不承诺他人操作机房内部的设备,关于核心服务器和设备的调整配置,更需要小组人员的共同同意后才能进行。
8〕对会阻碍到全局的硬件设备的更换、调试等操作应预先公布通知,同时应有充分的时刻、方案、人员预备,才能进行硬件设备的更换。
9〕对重大设备配置的更换,必须第一形成方案文件,通过讨论确认可行后,由具备资格的技术人员进行更换和调整,并应做好详细的更换和操作记录。
对设备进行更换、升级、配置等操作之前,应对更换、升级、配置所带来的负面后果做好充分的预备,必要时需要先预备好后备配件和应急措施。
10〕网管人员统一治理运算机及其相关设备,完整储存运算机及其相关设备的驱动程序、保修卡及重要随机文件。
11〕值班人员必须紧密监视中心设备运行状况以及各网点运行情形,确保安全、高效运行。
12〕未经负责人批准,不得在中心机房设备上编写、修改、更换各类软件系统及更换设备参数配置。
各类软件系统的爱护、增删、配置的更换,各类硬件设备的添加、更换必须经负责人书面批准后方可进行;
必须按规定进行详细登记和记录,对各类软件、现场资料、档案整理存档。
13〕健全中心全部设备固定资产账目,机房内所有设备、仪器、外表等物品要妥善保管。
治理人员每学期核对一次,做到账、物相符。
14〕机房内的一切公用物品〔包括低值易耗品、软件及资料〕未经许可一律不得私自挪用和外借。
5.运算机病毒防范治理的内容
1〕对新购进的运算机及设备,为防止原始运算机病毒的侵害,要组织专业人员检查后方可安装运行;
软盘、光盘等移动媒体,以及外来的系统和软件、下载软件等要先进行运算机病毒检查,确认无运算机病毒后才能够使用;
严禁使用未经清查的、来历不明的软盘、光盘等。
2〕要定期进行运算机病毒检查,系统中的程序要定期进行比较测试和检查。
要安装防运算机病毒软件,并定期或及时〔随时〕更新〔升级〕运算机病毒防范产品的版本;
要使用国家规定的、具有运算机使用系统安全专用产品销售许可证的防运算机病毒产品。
3〕跟踪运算机病毒进展的最新动态,及时了解运算机病毒,专门是有严峻破坏力的运算机病毒的爆发日期或爆发条件,在一些破坏性较大的运算机病毒发作日期前,要及时在网上公布通知。
4〕禁止任何人利用本单位运算机下载、复制、观看和传播各类与工作无关的视频文件。
5〕禁止任何人利用本单位运算机查看、复制互联网上与工作无关的信息。
6〕严禁使用盗版软件,专门是盗版的杀毒软件,严禁在工作运算机上安装、运行各类游戏软件。
7〕外来人员携带来的各种能够在运算机上运行的文件及软件等数字信息,未经同意,禁止复制到本单位运算机内。
如遇专门情形,必须由相应的信息治理部门人员使用最新版本的反病毒软件检测通过后,方可使用,检测人员及时做好来访和检测记录,以备查看。
8〕服务器要尽量做到专机专用,专门是具有读写权限、身份确认功能的认证服务器一定要专用;
对共享的网络文件服务器,应专门加以爱护,操纵读写权限,不在服务器上运行无关软件和程序。
9〕随时注意运算机的各种专门现象,一旦发觉,应赶忙用查毒软件认真检查。
10〕服务器要定期进行运算机病毒检查,系统中的程序要定期进行比较测试和分析;
专门是邮件服务器。
发觉病毒赶忙处理并通知上级治理人员。
11〕一旦发觉中心服务器有被侵入及恶意攻击的记录,应及时采取措施遏止并向主管领导报告;
一旦发生运算机病毒疫情,要启动应急打算,采取应急措施,将缺失降到最小。
12〕发觉或受到〝运算机病毒〞攻击后的治理措施:
当显现运算机病毒传染迹象时,赶忙隔离被感染的系统和网络,并进行处理,不应带〝毒〞连续运行;
发觉运算机病毒后,一样应利用防杀运算机病毒软件清除文件中的运算机病毒;
杀毒完成后,重启运算机,再次用防杀运算机病毒软件检查系统中是否还存在运算机病毒,并确定被感染破坏的数据是否确实完全复原;
假如破坏程度比较严峻,或感染的是重要数据文件,那么自己不要盲目修复,而要请运算机病毒防范的专业人员处理,即使是运算机专业人员也要慎重;
关于杀毒软件无法杀除的运算机病毒,应将运算机病毒样本送交有关部门,以供详细分析。
假设发觉网上有色情及政治敏锐内容,及时报告有关部门处理。
13〕单位应定期与不定期对制度的执行情形进行检查,督促各项制度的落实,并作为人员考核的依据。
6.防雷治理的内容
1〕防雷装置应当每年检测一次,对爆炸和火灾危险环境场所的防雷装置应当每半年检测一次。
2〕防雷装置投入使用后,应建立治理制度,指定专人负责,做好防雷装置的日常爱护工作。
发觉防雷装置存在隐患时,应当及时采取措施进行处理。
对防雷装置的设计、安装、隐藏工程图纸资料、年检测试记录等,均应及时归档,妥善保管。
3〕每年雷雨季节前应对接地系统进行检查和爱护。
要紧检查连接处是否紧固、接触是否良好、接地引下线有无锈蚀、接地体邻近地面有无专门,假如发觉问题应及时处理。
4〕接地网的接地电阻宜每年采纳数字式接地电阻测量仪进行一次测量。
5〕每年雷雨季节前应对运行中的防雷元器件进行一次检测,雷雨季节中要加强外观巡视,发觉专门应及时处理。
6〕当发生雷击事故后,应及时调查分析缘故和雷害缺失,提出改进防护措施。
设备遭受雷击后应对损坏情形进行调查分析,调查分析内容要紧包括:
各种电气绝缘部分有无击穿闪络的痕迹,有无烧焦气味,设备元件损坏部位,设备的电气参数变化情形;
各种防雷元件损坏情形,参数变化情形。
安装了雷电测量装置的,应记录测量数据,运算出雷电流幅值。
了解雷害事故地点邻近的情形,分析邻近地质、地势和周围环境特点及当时的气象情形。
保留雷击损坏部件,必要时对现场进行拍照或录像,做好各种记录。
依照上述调查情形,组织有关专家分析,写出调查分析报告及改进措施。
7.软件安全治理的内容
1〕必须定期检查软件的运行状况,进行数据和软件日志备份。
2〕禁止在正式运行的服务器上进行试验性质的软件调试,禁止在服务器上随意安装软件。
需要对服务器进行配置,必须在其他可进行试验的机器上调试通过并确认可行后,才能对服务器进行准确的配置。
3〕对会阻碍到全局的软件更换、调试等操作应先公布通知
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据中心 机房 工程 管理 实施方案