机房基础设施运行维护管理规范.docx
- 文档编号:25592142
- 上传时间:2023-06-10
- 格式:DOCX
- 页数:12
- 大小:24.38KB
机房基础设施运行维护管理规范.docx
《机房基础设施运行维护管理规范.docx》由会员分享,可在线阅读,更多相关《机房基础设施运行维护管理规范.docx(12页珍藏版)》请在冰豆网上搜索。
机房基础设施运行维护管理规范
机房基础设施运行维护管理规范
为保障××××××××机房基础设施的安全、可靠、连续、稳定运行,提高机房基础设施运行维护的科学化、规范化水平,根据《××××××××管理办法》以及机房运维管理相关制度,制定本规范。
第一章总则
第一条制定本规范的目标是保证机房基础设施稳定运行。
通过落实制度要求,强化机房基础设施基础管理工作,促进机房运行管理标准化、规范化。
第二条本规范所指的运行维护对象是指部署在总行机房的基础设施系统及设备。
第三条机房基础设施指机房内为生产系统提供运行保障和运行环境的场地设施。
包括容纳生产系统的机房、支持生产系统运行的供电系统(含UPS系统)、空调系统、消防系统、安防系统、监控系统等配套设施及维护IT系统的辅助设施。
运行维护管理指对机房基础设施进行日常运行和维护,确保各项基础设施安全稳定地运行。
运维管理包括日常管理、人员管理、设备管理、运行巡检、故障管理、应急处置、档案管理等内容。
第二章机房运行环境日常管理
第四条为保证机房生产设备及基础设施稳定运行,机房应持续保证以下环境要求:
一、机房各区域内的温度、湿度、空气洁净度等环
境条件应符合要求,确保机房各区域良好的工作环境,保证设备的正常运行,并采取相应的节能措施。
主机房、网络机房、UPS室温湿度标准:
温度:
23±2℃,湿度:
40%-70%,机房设备不得结露。
二、机房各区域内应清洁、少尘,无悬浮颗粒物,无积水,无异味。
三、定期完成机房环境清洁工作,保持地面干爽、整洁、卫生,门、窗、玻璃保持明亮干净,门牌和标签标识清楚,墙面干净无污迹,贴挂整齐,没有杂物。
四、机房内不得有食物存放,采取措施严防鼠害、蚁害等。
五、物品如清洁用具、安全用具、记录资料、仪表工具、门禁卡、设备钥匙等应摆放在指定位置,标识清楚,整洁有序。
六、温湿度、水浸、烟雾、红外、门磁、摄像机等监测探头保持性能良好、运行正常。
七、配电柜、箱内外要保持干净整洁、无蜘蛛网和杂物。
闸刀必须使用额定保险丝、禁止使用铜、铁、铝丝等代替。
八、任何人不得擅自变动机房各区域现有环境及设备设施。
第五条机房禁止带入易燃、易爆和危险物品,不得在机房内、走廊、通道和窗口附近堆放杂物,消防通道、紧急疏散通道应确保畅通,对机房各区域的电缆井、管道井、孔洞的防火封堵进行检查,确保封堵严密。
第六条机房禁止使用各种炉具和电热器具等大负荷用电设备,严格执行有关明火管理的制度要求。
第七条机房各区域实施7x24小时实时监控,监控录像最短保存三个月,并能随时调阅。
第八条机房各区域应实施严格的门禁管理措施,XX不得进入,门禁系统的出入记录应最少保存一年,超出一年的须下载保存。
第九条建立定期检查计划,对机房空调、供电、消防、监控、防磁、防雷、防静电、防水、防盗、防鼠及门禁等相关设施进行检查、维护。
第十条机房电气管理应遵循以下规定:
一、机房禁止乱拉临时电源线,必须使用临时线时要采用双护套线。
二、机房使用的微机必须使用固定电源插座,禁止临时电源线和活动插线板长期使用。
三、机房配电柜、PDU和其他输供电设施部件配备的防雷装置要定期测试与维护。
防雷装置受到损坏的、动作迟缓不起作用的要及时更换。
四、所有电力线、地线线缆必须为一条完整线缆,禁止中间驳接。
五、电力线截面积应与负载相符,禁止超负荷运行。
增加设备超出原设计供电容量或电力线截面积负载的,应进行相应扩容或更换电力线。
六、机房应有严格的防尘、防静电措施。
进入机房的人员在对生产设备和基础设施设备进行操作时必须严格按照防静电操作要求进行。
七、在机房开展安装和使用动力设备、配电设备及供电线路工作,应严格遵守用电管理规定。
未经负责安全保卫和信息技术部批准,任何部门和人员不得将用电设备擅自接入供电系统。
机房内部用电必须报负责安全保卫和信息技术部批准、备案后方可实施。
八、所有基础设施电源线室外部分(如空调室外机等)穿放的保护套管以及室外电源端子板、压力开关、温湿度传感器等的防水防晒措施应保持完好。
第十一条机房消防管理应遵循以下规定:
一、机房工作人员必须做到“三懂”“、“三会”、“三能”。
“三懂”即:
懂得本岗位工作过程和设备的火灾危险性、
懂得预防火灾的措施、懂得火灾扑救的方法。
“三会”即:
会用消防器材、会处理事故、会报警。
“三能”即:
能自觉遵守消防安全规定制度、能及时发现火险、能有效扑救初期火灾。
二、任何人不能随意更改消防系统工作状态、设备位置。
需要变更消防系统工作状态和设备位置的,必须经机房运维管理部门负责人批准,重要变更须经部门主管负责人审批核准。
机房工作人员应保护消防设备不被破坏。
三、根据实际情况配备消防设施,对消防设施禁止擅自搬动和挪作他用。
四、禁止对机房生产设备和基础设施设备使用水、干粉或泡沫等易产生二次破坏的灭火剂。
五、对于机房内可能发生的局部范围的小型火情,可以采用现场配备的手提式消防设备进行灭火。
六、一旦出现消防安全事故,应按照机房消防应急预案处理。
第十二条机房各区域内设备的安放应符合承重、散热、抗干扰等方面的要求,不得超出用电和承重负载。
第十三条机房施工作业指对机房各区域、生产设备与基础设施的巡检、维护、测试、清洁、勘察和施工改造等;设备作业指生产设备和基础设施设备检查、安装或变更。
施工作业和设备安装必须遵循以下规定:
一、维护(巡检、测试、清洁等)作业应按照维护规程要求和作业计划实施。
实施非维护作业需有相关主管部门核准的作业计划及方案。
由外单位人员实施的施工作业和设备作业计划应取得相关主管部门批准,并按要求安排陪同人员。
二、施工作业和设备作业人员必须遵守各项机房管理制度,禁止在机房内吸烟、饮食。
外来作业人员必须服从机房工作人员及陪同人员的管理。
三、施工作业涉及线、缆布放及设备、器件安装的,必须严格遵照机房工艺规范要求和其他技术要求,不得因作业而破坏机房原有工艺规范或降低机房安全标准。
四、陪同人员对施工作业和设备作业人员必须严格监督管理,并配合对施工作业和设备安装全过程的安全、工艺、环境卫生等管理,及时制止可能影响机房安全的操作及其它违章操作,发现问题及时报告。
施工作业和设备作业结束后,陪同人员应负责检查和验收,并督促现场杂物和垃圾的及时清理。
陪同人员需详细记录过程中所发生的任何重要问题。
五、因施工作业和设备作业需要使用电缆槽道、桥架、竖井、爬梯时,需获得维护部门的同意;需要对电缆孔洞进行拆封的,必须征得负责安全保卫同意;完成后必须遵循“谁拆封,谁恢复”的原则,进行规范封堵。
六、禁止设备外包装在机房内开箱、并禁止在机房内堆放设备包装、材料等。
七、施工作业和设备作业禁止使用明火(如焊枪、喷灯等)。
确因工作需要的明火作业必须经负责安全保卫批准、核发《动火证》,并制定安全防范措施后方可实施。
八、禁止使用卤钨灯等高温照明灯具作临时照明,如确需使用,必须经负责安全保卫批准、核发《动火证》,并制定安全防范措施后方可实施。
九、使用油机等含油设备、工具时,禁止使用明火。
十、涉及墙、顶、地板等易产生灰尘的施工作业和设备作业,必须采取严格、有效的防尘措施,并及时清理。
十二、施工作业和设备作业人员每日离场时必须清理现场,将使用过的机房物品、设备复位,带走临时使用的设备和工具,不得遗留作业垃圾。
施工作业和设备作业完成后,作业人员应彻底清洁现场,保证机房环境整洁。
机房工作人员应严格监督检查上述清理工作,对违反现场清理要求的行为及时制止。
十三、禁止将机房作为施工作业和设备作业人员的休息场所。
十四、设备安装或变更后,作业人员或陪同人员应及时更新机柜上的设备标签,并向机房工作人员提供设备信息,包括设备名称、型号、用途、安装位置、设备用电功率、重量等。
第十四条机房各区域设计和施工技术资料、机房基础设施使用手册、机房维修和维护指南,以及设备、供电、布线等配置文档,应由专人保管,及时更新,保证资料的有效性。
第三章机房人员管理
第十五条由于机房基础设施中与电气相关的工作存在着固有危险,涉及电气工作必须由具有资质人员和具备合理安全工作流程的前提下进行操作,并应利用防护设备和其他控制手段,如上锁挂牌设备,以防止现场人员受到电击、烧伤、电弧和其他潜在电气安全隐患。
电气工作人员在进行相关工作时应遵守相关法规标准,包括但不限于:
GB26860电力安全工作规程、DL408电业安全工作规程。
不具有电气工作资质的人员不能擅自操作电气设备、线缆。
第十六条机房应建立人员出入区域控制:
主机房允许部门负责人、信息安全处、系统网络处、机房运维管理部门及系统技术负责人进入;网络机房允许部门负责人、信息安全处、系统网络处、机房运维管理部门人员进入;UPS室允许部门负责人、信息安全处、机房运维管理部门人员进入。
机房各区域出入控制通过机房门禁权限设置控制。
外部及本部门人员进入未授权区域需按照机房出入管理规定进行审核、登记,并由有权人员全程陪同。
第十七条非授权人员不得触碰、移动、损坏机房基础设施、各种控制开关;不得改变机房基础设施系统、监控系统配置。
第十八条机房工作人员要接受基础设施安全培训,包括安全原则、危险识别、控制风险等内容,掌握基础设施安全操作技能,确保机房工作人员人身安全。
第十九条为确保机房工作人员具备履岗能力,应进行全面培训。
包括:
机房基础设施的工作原理、操作流程、应急预案、以及管理制度等。
对于机房工作人员应不断提升理论知识,以便在缺乏操作程序的应急状态下进行正确的处置。
第二十条机房工作人员应将机房基础设施历史事件的总结分析作为培训的重要素材,进行全员培训;对于新员工应在上岗前予以培训,以避免相同的事件再次发生。
第四章机房基础设施设备管理
第二十一条机房应建立完整的基础设施设备登记,并及实时更新。
基础设施设备登记应包括所有基础设施设备的清单,关键设施设备应记录事件情况、变更情况、维护保养频次等信息。
基础设施登记应至少包括以下信息:
种类、设施设备说明、制造厂家、产品型号、规格、位置、序列号、投产日期、维护频次等。
第二十二条机房基础设施的所有操作,均应事先制定详细的标准维护流程,经过审核后存档并严格执行。
标准维护流程用于规范和明确机房各项基础设施各项设施的检查和维护操作步骤。
应将操作步骤和要求以统一的格式描述出来,用来指导和规范日常的运维工作。
制定标准维护流程还应包括所有关键基础设施设备在各种情况下都能执行的常用操作。
例如手动重启UPS的操作流程、精密空调的温湿度范围控制等。
基础设管理员岗位人员负责制定标准维护流程。
第二十三条对机房关键基础设施设备的重大维修、安装操作,应事先制定标准维护流程。
可要求外部技术支持公司提供制定标准维护流程的标准和操作建议,机房运维管理部门负责最终确认审核,并由部门主管负责人批准实施。
第二十四条机房基础设施属于关键设施,应确保外部技术支持公司及派出人员具备机房基础设施的运维服务资质。
机房运维管理部门应在开展运行维护作业前审查资质证明、考察专业能力和经验。
第二十五条外部技术支持人员在现场工作时要严格遵循机房基础设施操作流程和安全要求,机房工作人员应监督并及时纠正与制度要求不符的工作方式和行为。
机房运维管理部门负责人应及时协调和处理现场问题。
第二十六条对外部技术支持公司及其派出人员的现场管理应符合外包和合作方管理的制度要求。
外部技术支持人员在现场执行维护程序之前,应接受机房相关制度的培训,并获得机房运维管理部门以及部门主管负责人批准。
在执行维护活动的过程中要严格遵循操作流程。
操作时需由机房工作人员陪同并监督记录流程的执行情况。
外部技术支持人员的巡检、维护、修理工作应提交现场服务报告并存档。
陪同人员登记机房基础设施检修记录。
第二十七条对于具备条件的机房基础设施冗余设备(如精密空调等)应设立轮换运行机制,以延长整体设备的生命周期和节约能耗。
第二十八条对机房基础设施设备和物理环境应建立完整的、清晰的标签标识,便于清晰、快捷地掌握区域及整个机房系统的配电、制冷、消防等关键提示。
应至少包括:
●设备标识:
包括设备名称、型号、编号等;
●警示标识:
如“设备已带电/危险”、“禁止合闸”、“禁止分闸”、“自动/手动”等;
●物理环境标识:
如位置标识、区域标识等。
第二十九条机房运维管理部门应明确在机房的生产设备摆放区域、基础设备设施摆放区域、临时设备或工具摆放区域。
第五章机房基础设施巡检
第三十条机房巡检分为每日巡检、每月巡检和每季巡检。
巡检对象包括机房机房环境、基础设施运行、生产设备运行、机房环境监控系统和集中监控系统等。
其中生产设备运行和集中监控系统巡检要求按照相关制度要求执行。
第三十一条每日巡检由机房工作人员完成,至少保证每两小时对机房所有区域进行现场检查,如发生运行故障或可能影响生产设备和基础设施设备运行的异常情况时,应视情况缩短巡检时间间隔。
每月巡检和每季巡检由外部技术支持公司和机房工作人员共同完成,是对机房基础设施、机房环境等的专项检查维护。
重点排查设备运行隐患、解决遗留问题、定期完成设备部件更换等。
第三十二条每日巡检应包括以下内容:
一、检查机房设备标识、标签,保持标示、标签清晰牢固。
二、对机房物品码放进行整理。
保持设备、设施和环境整洁。
三、检查机房环境监控系统运行状况,包括温湿度、水浸等运行情况,保持性能良好和工作正常,发现异常和报警信息应及时报告、处理。
四、检查生产设备和基础设施设备的指示灯状态、面板信息,发现异常和报警信息应及时报告、处理。
五、检查门禁运行情况,检查机房各区域门开合情
况是否良好,有无变形。
检查机房外墙窗户的密闭情况,保持外墙窗户密闭。
六、检查机房各区域上下水管、阀门、供暖等装置有无漏水、破损、阀门关闭不严的情况。
七、检查机房天花板、墙体、地面有无漏水、渗水、破裂等情况。
八、检查机房精密空调附件地板有无油污。
九、检查机房各区域温湿度控制是否达标。
十、检查机房各区域配电柜、箱电闸开关闭合情况等有无异常;检查UPS室和强电间UPS设备有无异常。
十一、对UPS室和强电间的UPS蓄电池组各单体进行外壳鼓胀、开裂、极柱变型、爬酸、渗漏等现象检查,对各单体电池间连接部位检查是否牢靠。
机房工作人员每日至少需使用测温仪器对UPS室和强电间的UPS蓄电池组进行一次全面温度检测,及时发现蓄电池温度异常情况。
十二、检查机房各区域内消防报警探测器和消防设备,及时报告异常并处理火警信号。
检查内容包括机房的火灾探测器(烟感和温感探测器)、喷淋头、防火门、防排烟设备、消防器材(灭火器、防毒面具、消防栓等)、疏散标志、指示灯和其他各类安全设施,发现异常、报警、损坏等情况应及时报告和处理。
十三、检查机房钢瓶间是否存在钢瓶压力不足、阀门和连接线是否牢靠;检查机房各区域消控设备、阀门是否存在异常情况。
十四、检查机房各区域消防通道、紧急疏散通道,应确保畅通、张贴疏散路线图、应急照明设施有效可用。
第三十三条每月和每季度巡检是对机房基础设施设备运行的专项检查和维护,包括对基础设施设备各部件运行状态的检测、对易损耗部件(如空调滤网等)和损坏部件(如损坏的蓄电池等)进行更换、对基础设施设备进行维护(如清洗空调室外机、清除UPS设备风扇灰尘等)。
由具有专业资质的外部技术支持人员和机房工作人员共同完成。
外部服务公司应在巡检完成后出具巡检报告,机房工作人员登记机房基础设施检修记录。
第三十四条机房工作人员对在巡检中发现的报警信息、设备仪表提示的异常情况、受损的设备部件、其他影响或可能影响机房设备运行的异常情况等应及时报告、处理。
第六章机房基础设施故障管理
第三十五条机房基础设施发生运行故障或发现各类可能出现的异常情况,机房工作人员应按照突发事件处理,必须立即确认,马上处理,不得拖延。
突发事件响应和处置应按照不同等级事件下相应的处理流程开展。
当故障暂时无法排除时,需要逐级报告,进入事件升级流程。
如遇特殊情况,与直接负责人联系不上时,可越级向上一级负责人报告。
第三十六条机房基础设施故障处理完毕后,机房运维管理部门应及时组织故障分析,基础设施管理人员负责记机房基础设施运行故障登记。
重大运行故障应提交故障分析报告,包括发生的时间、设备、位置、故障影响、故障分析和原因、故障处理过程说明、故障风险和后果、优化建议等。
第三十七条应建立机房基础设施应急预案,并及时更新。
基础设施应急预案应适用于有可能发生的严重故障情况。
基础设施管理人员负责制定应急操作流程。
应急预案用于规范应急操作过程中的流程及操作步骤,确保运维人员可以迅速启动,确保有序、有效地组织实施各项应对措施。
机房基础设施严重故障场景包括但不限于:
●一路市电供电时中断;
●双路市电供电时同时中断;
●发电机组启动失败;
●发电机在带关键负载时故障停机;
●单个空调故障停机;
●全部空调故障停机;
●单台UPS故障停机;
●机房发生消防报警;
●机房发生严重漏水、渗水,影响生产设备或基础设施设备运行等。
第三十八条机房运维管理部门应针对应急操作流程开展演练工作,演练形式包括桌面推演(可以采取口述与现场模拟方式)、实战演练。
实战演练应充分评估演练风险,并针对可能出现的突发事件场景提出应急处置措施,避免演练过程发生突发事件。
应急演练参与人员应准确掌握应急预案的场景判断和应急操作步骤。
第七章机房环境监控管理
第三十九条机房环境监控系统是对动力、温湿度控制、漏水等机房环境状态提供实时不间断监测及故障报警的监控系统,便于机房工作人员及时了解基础设施运行状态和及时发现异常情况。
第四十条基础设施管理人员负责管理机房环境监控系统。
对机房基础设施运行阈值的设定应基于安全性、运行效率和节约能耗的综合考虑,同时相应设置监控报警阈值等。
第四十一条基础设施管理人员应根据机房环境监控系统记录的基础设施运行数据、故障发生情况、设备维修情况等每年出具基础设施运行报告,针对存在问题提出改进建议。
第八章机房基础设施档案管理
第四十二条机房基础设施档案包括基础设施运行文档和技术文档。
第四十三条机房基础设施运行文档包括维修记录、故障处理记录、巡检记录、值班记录、安全生产检查记录等。
第四十四条机房基础设施技术文档包括但不限于:
机房的规划设计资料及竣工图纸(含建成后变更、改造的)、基础设施设备的清单及相关操作文档和保修保养资料、与基础设施相关的自动操作系统的逻辑图及说明文档、机房环境监控系统控制点配置表、基础设施验收测试文档、机房建筑设计资料和竣工图纸。
完整并准确的技术文档是机房基础设施后期运行、维护、维修、故障诊断、优化改造的基础。
第四十五条机房基础设施文档管理应严格执行总行及信息技术部关于档案管理的制度要求,设定文档的起草、变更、审核、批准、保存、分发等职责权限和工作流程。
第四十六条机房应建立完整的机房基础设施文档登记表,并及时更新。
机房基础设施文档登记表应包括文档收录、保存、上交、更新、废除等信息。
第九章附则
第四十七条本规范由信息技术部负责解释。
第四十八条本规范在发布之日起执行。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 机房 基础设施 运行 维护 管理 规范