中国移动IDC维护管理规定云计算资源管理分册版Word格式.docx
- 文档编号:21163360
- 上传时间:2023-01-28
- 格式:DOCX
- 页数:27
- 大小:270.61KB
中国移动IDC维护管理规定云计算资源管理分册版Word格式.docx
《中国移动IDC维护管理规定云计算资源管理分册版Word格式.docx》由会员分享,可在线阅读,更多相关《中国移动IDC维护管理规定云计算资源管理分册版Word格式.docx(27页珍藏版)》请在冰豆网上搜索。
V1.0
修改
文档名称
2016-11-17
V1.1
根据2015版本增补文档内容
2016-12-06
V1.2
第一章概述
第一条为了规范中国移动IDC云计算资源的维护管理,合理、可靠、安全、高效地组织管理IDC云计算资源,确保IDC云计算资源有效满足上层应用对基础资源的使用需求,有效提高基础资源的使用效率,充分发挥云计算高可靠性、弹性扩展、快速部署等优势,特制定本管理规定。
第二条本管理办法适用于IDC云计算资源的维护管理,上层业务应用不属于本管理办法适用范畴。
第三条本管理规定按照《中国移动IDC维护管理规定》框架编制,未详尽描述部分参照《中国移动IDC维护管理规定》执行。
第四条各级维护管理部门应认真执行本规定。
总部及各省公司应在本规定的基础上,结合实际情况编制实施细则,以确保中国移动IDC云计算资源安全、可靠、高效地管理和使用。
第五条本管理规定的解释权和修改权属于中国移动通信有限公司网络部。
第一节IDC云计算资源定义与构成
第六条云计算资源由服务器、存储设备和网络设备等物理设备构成,通过硬件虚拟化、安全隔离、集中管理、灵活计量和弹性资源调度等技术将静态分配、长期固定的物理设备抽象为可管理、易于调度、按需分配的虚拟资源池,向用户提供能按需灵活使用的各类IT资源。
第七条中国移动IDC云计算资源由中国移动规划建设,按照服务对象的不同可划分为公有云和私有云。
1.公有云:
为中国移动外部政企和个人客户提供云计算服务的云资源池;
2.私有云:
为中国移动自有业务提供云计算服务的云资源池。
第八条《中国移动IDC维护管理规定》中的各项管理规定,所涉及到的云计算资源如无特别说明,均特指私有云资源池,并统一使用“私有云”来简化对中国移动IDC云计算资源的称谓。
第九条公有云资源池不在本规定管理范围内。
第二节IDC云计算资源的管理对象
第十条中国移动IDC云计算资源由统一运营管理的云资源管理平台系统和私有云资源池系统构成。
第十一条云资源管理平台由集中部署的云资源管理平台和部署在私有云资源池的远端模块构成,实现对全网私有云资源池内的各类IT资源进行统一管理和集中维护。
第十二条私有云资源池系统由计算资源、存储资源、网络资源和其他资源池对象构成:
1.资源池计算资源:
私有云资源池中所有提供计算服务的物理设备和逻辑资源,包括但不限于X86物理机资源、虚拟机资源等。
2.资源池存储资源:
私有云资源池中提供存储服务的物理设备和逻辑资源,包括但不限于磁盘阵列、NAS、分布式文件存储、日志详单存储、NOSQL数据存储、对象存储和数据备份等。
3.资源池网络资源:
私有云资源池中提供网络服务的物理设备和逻辑资源,包括但不限于路由器、交换机、防火墙、负载均衡、IP地址、网络带宽、路由协议等。
4.资源池其他对象:
私有云资源池中除计算、存储、网络之外提供的其他服务资源,如虚拟化软件、DCOS、数据库服务、中间件服务等。
第二章维护组织
第一节IDC云计算资源维护工作模式
第十三条中国移动私有云的维护管理按照“一级管理,两级维护”的原则,在总部统一领导下,充分发挥总部一级云资源管理平台的管理支撑作用,对全国的云资源池进行统一的监控、调度与管理,一级私有云、省级私有云均需逐步纳入总部一级云资源管理平台。
第十四条总部网络部负责制定全网私有云的维护管理办法,并作为一级私有云的维护管理职能部门。
各省公司网络部为各自管辖范围内省级私有云的维护管理职能部门。
各省公司、基地私有云维护部门统称为私有云维护部门,负责各私有云的具体维护工作。
第二节维护组织机构及职责
第十五条总部网络部主要职责为:
1.负责组织制定全网私有云的维护管理规定,明确资源管理、故障管理、性能管理、安全管理、日常维护等私有云相关流程制度和要求,监督各省网络部和属地省公司私有云维护部门对维护规定的落实情况,对各省的维护工作给予指导。
2.负责制定私有云运行质量指标体系和考核办法,定期检查私有云运行质量,组织考核评比。
3.负责制定私有云网络组织、资源管理、局数据配置、需求和版本管理相关原则,指导各省网络部和属地省公司私有云维护部门落实相关安全要求。
4.组织制定私有云应急通信保障原则,制定一级私有云应急保障方案并组织实施,指导各省制定省级私有云应急保障方案。
5.负责组织一级私有云、省级私有云纳入总部一级云资源管理平台。
6.参与私有云相关技术规范的编制工作,结合私有云实际运维情况提出私有云相关技术规范的修订要求。
7.负责私有云重大故障和重大安全事件的管理。
8.负责为私有云的设备维护、优化和故障处理提供技术支援,指导属地省公司私有云维护部门开展私有云的优化调整工作。
9.负责一级私有云资源管理,包括资源的分配、变更和回收。
10.对一级私有云的日常维护情况、故障处理、资源管理、性能管理及其他维护工作进行监督、考核。
11.负责监督一级私有云的运行情况,对一级私有云重大、严重故障进行实时监控和派单督办。
12.参与一级私有云建设和验收,参与一级私有云业务方案的制定和部署。
13.组织私有云维护人员的技术、业务交流与培训。
第十六条各省公司网络部主要职责为:
1.贯彻总部关于私有云维护管理规定,根据实际情况制定切实可行的维护管理实施细则。
2.负责落实总部关于私有云运行质量管理要求,建立质量分析和质量监督制度。
3.在总部的指导下,负责省级私有云资源管理、故障管理、性能管理、版本管理、安全管理等维护管理工作。
4.参与省级私有云建设和验收,参与省级私有云业务方案制定和部署。
5.按照重大故障管理要求及时向总部上报省级私有云的重大故障。
6.定期组织维护技术人员的交流和培训工作。
第十七条私有云维护部门主要职责为:
1.在总部和省网络部的指导下,负责私有云日常维护、资源管理、故障管理、性能管理、版本管理、安全管理、局数据制作等具体维护工作。
2.在总部和省网络部的指导下,制定私有云应急保障方案并定期演练;
一级私有云所在省参与总部组织的一级私有云应急演练。
3.在总部和省网络部的指导下,负责所维护私有云与总部一级云资源管理平台的对接。
4.负责7×
24小时实时监控私有云运行状况。
5.按照重大故障管理要求及时向总部和各省网络部上报私有云的重大故障。
6.负责定期统计分析私有云的运行状况,在总部和省网络部指导下开展私有云优化提升工作。
7.在总部和省网络部的指导下,完成私有云网络结构调整、资源管理、局数据配置、私有云系统软件与补丁测试及装载等具体实施工作。
8.参与私有云建设和验收,参与私有云业务方案制定和部署。
9.定期组织维护技术人员的交流和培训工作。
第三章维护工作内容
第一节资源管理
第十八条私有云资源管理包括对私有云各类资源管理对象全生命周期管理,包括资源的需求建设、评估、分配、上线、变更、下线、回收以及维护优化等工作,同时涉及软件版本管理、资料管理、备品备件和维保管理等基础运维工作。
第十九条私有云在“资源需求和建设、资源评估、资源分配、资源回收和调整”等方面存在三个主要主体责任方,计划建设部门、私有云维护部门、业务需求部门。
第二十条“计划建设部门”承担私有云的建设职责。
1.负责定期征集各“业务需求部门”IT系统资源需求,结合私有云运行情况,开展私有云各资源池的建设,牵头组织完成立项、设计和工程建设相关工作;
2.负责提供各“业务需求部门”的项目投资计划(包括所占用私有云IT资源建设成本),作为私有云IT资源的分配依据;
3.如果建设单启用私有云资源虚拟结算,“计划建设部门”负责编制私有云按照建设成本核算的“资源服务目录单价”,作为业务系统资源申请核算依据;
4.参与审核各“业务需求部门”的系统设计方案,评估方案和资源需求类型、数额的合理性。
第二十一条“私有云维护部门”承担私有云运营、运维职责。
1.负责根据“计划建设部门”发布的“业务需求部门”的项目投资计划,受理各“业务需求部门”提出的私有云资源申请需求,并根据实际资源分配情况核算业务系统占用的私有云硬件投资数额;
2.参与审核各“业务需求部门”的系统设计方案,评估方案和资源需求类型、需求数额的合理性,并实施资源配置,协助业务系统部署上线;
3.负责评估私有云上部署的各“业务需求部门”应用系统占用资源的利用率情况,对所占用资源实施变更或回收。
第二十二条“业务需求部门”为私有云资源使用单位。
1.负责根据自身业务需求进行系统立项,按照分布式架构规划上层应用软件,根据私有云架构组织制定业务设计方案;
(由计划建设部门负责的项目由计划建设部门牵头完成项目立项和方案设计工作)
2.负责组织包括计划建设部门、私有云维护部门、设计单位、集成商等相关单位进行设计方案会审,根据运营维护要求完善设计方案,与各部门就项目资源分配达成一致方案;
3.负责在业务部署上线后,维护业务操作系统及其之上的应用软件,保障私有云监控代理软件的运行状态,配合“私有云维护部门”根据业务系统实际资源利用率情况对资源占用进行调整和优化;
4.负责所申请的主机资源的操作系统及业务应用的安全管理,配合安全检查,并对不符合要求的主机或应用系统进行整改;
5.负责依照公司私有云发展规划实施包括但不限于业务系统云化、容器化架构改造,逐步减少小型机的使用,积极采用业务系统分布式架构,业务系统尽量以虚拟化方式部署,在私有云具备DCOS环境后,应配合进行业务系统容器化架构改造和部署,进一步提升资源利用率和开通效率。
第一小节资源管理原则
第二十三条业务系统使用云资源采用“预先评估,按需申请,自动伸缩,空闲释放”的原则,通过建立资源需求分析评估模型、资源使用情况后评估、资源分阶段配置、资源预算管理、资源回收等方式,实现各类私有云资源的科学管理,最大化地提高云资源池的效率,发挥私有云的规模效益。
第二十四条私有云维护部门应不断完善资源管理水平,完善相应支撑手段,提升资源利用率,提升各类资源对于上层业务的支撑能力。
第二十五条私有云维护部门应持续关注私有云各类资源的维护优化工作,应通过代理软件、资源管理软件接口上报等方式对已占用的私有云资源使用情况进行监控、统计和后评估,在资源即将用尽或不能满足业务需求时应进行预警,并进行相应的优化调整,在业务系统因业务量萎缩、退网等情况下进行资源回收,并提出私有云资源管理建议。
第二小节资源需求和建设管理
第二十六条“计划建设部门”定期(建议提前6-12个月)向各“业务需求部门”提出规划期内IT资源使用需求调查,各“业务需求部门”反馈规划期内本单位各个项目资源使用需求。
“私有云维护部门”定期向计划建设部及业务需求部门通报私有云资源使用情况。
第二十七条私有云资源池建设应保证一定量冗余,“资源池建设部门”应保证在资源池利用率达到指定门限(原则上>
70%)时,启动应急扩容工程。
第二十八条“计划建设部门”根据收集的各“业务需求部门”资源需求,结合“私有云维护部门”提交的私有云资源使用情况报告,组织相关单位进行建设需求评审,开展私有云各个节点的建设,牵头组织完成立项、设计和工程建设相关工作,并移交“私有云维护部门”进行运营管理。
第三小节资源申请和需求评估
第二十九条业务需求部门申请分配私有云资源,需同时具备两个前提条件:
(1)该系统属于当期计划建设部门的“项目投资计划”内的项目。
(2)该系统的IT资源需求在私有云当期计划建设部门的需求调查阶段已经申报并作为当期私有云建设依据。
如不能满足上述条件
(1)或
(2)的项目均属于“计划外需求”项目,对于“计划外需求”项目申请资源流程说明如下:
对于不满足上述条件
(1)的项目,需请私有云计划建设部门参加设计方案评审会,并在会议纪要中明确评审意见和该项目占用的私有云IT资源建设成本,根据评审意见开展后续流程;
对于不满足上述条件
(2)的项目,若私有云仍有冗余资源可以满足,则按后续流程经评估后予以分配,否则计划建设部门将其作为私有云下期工程建设需求依据。
第三十条“业务需求部门”业务系统申请私有云IT资源,需提前通过计划建设部门立项并批复通过。
立项文件中需要详细陈述本项目IT硬件资源通过一级私有云或省级私有云予以满足。
第三十一条“业务需求部门”在获得立项批复后,按照私有云架构规划上层应用软件,组织制定业务设计方案。
第三十二条“业务需求部门”负责组织包括私有云计划建设部门、维护部门、设计单位、集成商等相关单位进行设计方案会审,明确项目来源、业务容量估算、IT资源需求和系统逻辑拓扑,通过完善设计方案,确保系统IT资源需求合理,设计方案符合私有云网络架构、安全域划分、容灾安全设计和私有云的其他运营运维要求,各方就项目资源分配达成一致方案。
第三十三条“业务需求部门”向私有云维护部门进行私有云资源申请,并抄送计划建设部门,申请材料中需包含立项批复文件、项目设计方案、资源申请等内容。
第四小节资源分配和业务上线
第三十四条“私有云维护部门”收到“业务需求部门”的资源申请后,根据方案评审会达成的资源分配方案,启动资源配置工作。
第三十五条“私有云维护部门”应在规定的工作日内完成资源配置并交付“业务需求部门”。
第三十六条资源配置完成以后,“业务需求部门”项目负责人牵头项目集成商、设计院,完成系统的部署和测试。
“私有云维护人员”配合完成网络配置、存储划分和数据制作,解决已分配资源存在的问题,确保云资源正常运行,双方共同完成系统上线运行。
第三十七条业务系统正式上线前,“私有云维护部门”应与“业务需求部门”通过召开业务上线沟通会等形式,就接口人、基础配置信息进行核对和交接,明确维护分工界面以及责任和权利,确保各项支撑工作高效开展;
“私有云维护部门”应根据维护管理规定,对业务系统安全加固、漏洞扫描、Agent安装、4A接入等情况进行审查,明确系统符合入网条件后业务需求部门方可启动业务上线;
业务上线后,“私有云维护部门”将持续进行相关合规检查和监控,发现问题并通知“业务需求部门”及时处理恢复。
第三十八条“私有云维护部门”在资源池上的部署业务系统时应满足“跨集群、跨宿主机”的原则,通过选择不同的资源池集群、不同的宿主机,同时以备份手段做为补充,保障资源可用性。
第三十九条“业务需求部门”在设计业务架构时要实现关键业务冗余部署,保障业务连续性。
第五小节资源运行评估及调整回收
第四十条“私有云维护部门”对各个业务系统已占用的私有云资源使用情况进行监控、统计和后评估,在资源即将用尽或不能满足业务需求时应进行预警,并根据“业务需求部门”的申请进行相应的优化调整。
第四十一条“业务需求部门”结合业务系统运行情况可以提出资源变更申请,“私有云维护部门”评估系统资源利用率情况和私有云资源余量,审核通过后予以实施。
第四十二条业务系统因业务量萎缩、退网或调整等原因造成资源闲置,应由“私有云维护部门”与“业务需求部门”共同协商启动资源回收流程。
第四十三条私有云资源调整回收的四种情况:
1.“私有云维护部门”定期召集所有业务需求部门,对管辖的业务系统进行存在必要性评估,对于评估认为不需要继续使用的,向“业务需求部门”提出回收该部分资源的建议,双方制定具体资源回收方案,维护部门执行资源回收操作;
2.“业务需求部门”根据市场动态、公司最新发展动向、上级部门相关要求评估认为不适合继续使用的云业务,则由“业务需求部门”及时发起下线流程申请;
3.云平台安全组进行不定期业务安全抽检,发现存在无法弥补型安全隐患或不符合公司安全管理要求的服务,由云平台安全组向业务管理部门发起下线处理建议,并抄送给云业务需求部门知晓,达成一致之后由业务管理部门进行下线处理;
4.“私有云维护部门”对云平台资源使用情况进行资源统一管理,原则上单台计算资源月均CPU及内存利用率过低,应对业务使用资源进行调整或回收。
第四十四条业务系统下线后要求执行“资源回收,再分配”过程。
“业务需求部门”不能将下线的主机等资源直接划拨其他业务系统使用,应保证业务系统与资源数据对应关系的准确性,由私有云管理部门进行定期抽查并进行相关考核。
第四十五条私有云中业务下线或迁移时,所有相关资源要同步下线,数据资料同步变更。
业务迁移时,各资源管理人员可为资源制定一个保留期限,到期后进行资源回收。
第六小节资源流程管理
第四十六条资源申请流程:
业务系统需要占用新的计算、网络、存储、数据库、中间件、备份等私有云资源时,相关需求部门应启动“资源申请流程”,流程包括“申请、审批、配置、测试、归档”等环节。
资源申请流程图见附录一。
第四十七条资源变更流程:
业务系统需要对已占用资源的相关配置进行变更且不占用新增资源时(如安全策略调整、网络配置调整等),相关需求部门应启动资源变更流程;
变更流程包括“申请、审批、配置、测试、归档”等环节。
资源变更流程图见附录一。
第四十八条资源回收流程:
业务系统退网、下线或不满足私有云整体运营要求时,应启动“资源回收流程”;
业务系统“退网、下线”由业务部门主动发起流程,“不满足私有云整体运营要求”由“私有云维护部门”发起流程。
私有云资源回收流程包括“发起、评估、启动、审核、回收、确认、归档”等环节。
资源回收流程图见附录二。
第七小节资产管理和日常维护
第四十九条资源生命周期管理:
“私有云维护部门”应建立私有云“基础设施、虚拟化资源、服务实例”等的物理和逻辑资源的生命周期管理流程,对私有云物理、逻辑资源以及实例等进行全生命周期管理。
第五十条割接管理:
“私有云维护部门”应制定完善的私有云割接、升级、调整等操作实施方案,尽量降低对上层业务系统的影响;
对于可能影响上层业务系统的各类操作,应全面评估操作影响,并提前通知相关业务部门具体操作计划安排,在相关业务部门同意后方可执行操作。
私有云系统割接流程见附录三。
第五十一条变更管理:
“私有云维护部门”应通过标准统一的方法和步骤来管理和控制所有变更和发布、部署管理,正确引导和管理变更请求;
评估变更的风险,并制定风险的应对措施;
变更和变更实施得到正确记录,并提供审核统计;
减少或者消除变更对系统和服务带来的风险和影响;
控制变更过程,使变更高效完成,对服务质量影响最小。
第五十二条监控管理:
“私有云维护部门”应提供对基础设施、虚拟资源、实例、进程以及上层应用系统的监控能力,周期性将关键性能指标、资源池容量信息通过标准接口上报至上级管理部门。
第五十三条备份管理:
“私有云维护部门”应提供数据库、操作系统、业务数据、配置文件、日志文件等数据备份能力,备份频度、保留周期要符合集团下发的相关要求,集团没有明确要求的系统根据业务的必要性与“业务需求部门”协商确定。
第五十四条基础资料管理:
“私有云维护部门”应集中存放和管理私有云项目资料、交维资料、技术文档、管理办法、应急预案、作业计划、配置备份等文档资料。
第五十五条配置管理:
“私有云维护部门”应负责集中存储和管理资产软硬件版本、license信息、维保信息等信息。
第五十六条备品备件管理:
应遵循“统一管理、统一调配、统一存储、资源共享”的原则,备品备件台帐中应详细记载进出库设备名称、属性代号、规格、数量、位置编号、进出库时间、经办人等,备品备件管理员应定期盘点,并动态随时反映。
第五十七条软件版本管理:
私有云维护部门根据集团公司公布的一级设备软件版本和软件补丁入网情况,结合本省情况向网络部提出软件版本升级需求,在集团公司发布入网许可的前提下,组织维护部门进行本省软件版本升级,维护部门应控尽量制私有云中软件版本的数量。
第二节故障管理
第五十八条私有云维护部门应建立完善的私有云故障管理体系,加强私有云故障响应和处理能力,提升私有云运行质量和维护水平,降低对业务系统的不良影响。
按照职责分工,私有云资源池层面的故障由私有云维护部门牵头处理,业务应用层面的故障由业务部门牵头处理。
第五十九条因上层业务应用系统发生故障导致私有云资源池正常运行受到影响时(例如因业务系统中毒产生大量异常网络流量影响私有云资源池其他业务网络通信),所属业务负责部门应配合私有云维护部门立即修复,消除对私有云资源池其他系统产生的影响。
第六十条私有云故障管理中故障分类分级、故障时间定义等以《中国移动IDC维护管理规定-总册》要求为准。
第六十一条各资源管理软件关键模块、功能故障导致资源使用异常或资源管理功能异常;
1.私有云下辖核心交换机、汇聚交换机、接入交换机、负载均衡器、IP专用承载网出口路由器、CMNet出口路由器、CMNet出口防火墙等关键模块、功能故障,导致业务受阻;
2.私有云下辖虚拟防火墙(池)或虚拟交换机(池)整体故障退出服务或关键功能故障;
3.私有云下辖存储设备、存储光纤交换机关键模块、功能故障,导致业务受阻;
4.私有云管理平台关键模块、功能故障;
5.资源池管理模块至私有云管理平台管理接口故障;
6.私有云下辖其它关键硬件设备或系统功能故障,导致上层业务应用受影响或存在较大风险;
7.除上述情况外,私有云维护部门可根据实际情况对严重故障进行补充。
第一条私有云一般故障:
除重大故障和严重故障外的其他故障为一般故障。
第六十二条由于私有云系统与上层业务应用关系较为密切,维护人员应关注私有云故障对上层业务的影响情况;
对于影响上层业务应用的故障,应立即通知业务部门相关情况,并按照“优先抢通业务”的原则协同业务部门进行故障处理和业务恢复,避免故障影响进一步扩大。
第六十三条故障处理完成后,应由私有云维护部门组织各相关专业对故障进行深入分析,并及时输出故障报告。
故障报告至少应包括故障发生时间、处理时长、影响范围、处理过程、故障原因、整改措施等内容。
第六十四条私有云故障处理流程见附录四。
第六十五条私有云通信保障:
1.集团网络部和各省网络部分别组织各级私有云维护部门,联合网络、传输、动力等其他相关专业共同编制、修改保障方案。
保障方案至少应包括保障的时间、人员、范围、目标、措施等内容。
2.保障方案应根据保障任务的要求和现网情况进行修改,如涉及容量性能等方面需求,则应协同计划、工程部门做好私有云资源的建设和调度。
3.私有云维护部门以及相关专业、涉及部门根据保障方案开展保障工作。
4.保障结束后,由私有云维护部门在规定时间内,向维护管理部门输出保障报告,报告至少应包括时间、地点、人员、保障结果、重要事件等。
第六十六条应急预案和演练:
1.集团网络部和各省网络部分别组织各级私有云维护部门,联合网络、传输、动力等其他相关专业共同编制、修改应急预案。
应急预案应根据私有云组网结构、承载业务等现网变化情况同步进行更新。
2.私有云应按照应急预案制定定期演练计划。
各专业应按计划,制定演练方案,开展应急演练工作。
演练方案至少应包括时间、地点、人员、目标、触发条件、影响范围、演练步骤、回退步骤、业务验证等内容。
应急演练需提前通知业务需求部门,在征得业务需求部门的同意后方可实施。
如演练过程发生故障,则应立刻中断演练,执行回退方案。
3.应急演练结束后,应由私有云维护部门在规定的工作日内,向维护管理部门输出演练报告,对演练方案、演练过程、演练结果等进行总结。
第三节性能管理
第六十七条私有云性能管理是对私有云资源在运行状态下的关键指标数据进行监控和展示,使维护人员能及时发现系统异常并产生预警,实
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 中国移动 IDC 维护 管理 规定 计算 资源管理 分册