SRM容灾解决方案.docx
- 文档编号:232023
- 上传时间:2022-10-07
- 格式:DOCX
- 页数:45
- 大小:6.76MB
SRM容灾解决方案.docx
《SRM容灾解决方案.docx》由会员分享,可在线阅读,更多相关《SRM容灾解决方案.docx(45页珍藏版)》请在冰豆网上搜索。
软件定义的容灾解决方案(VMwareSiteRecoveryManager)
2022/10/7
目录
1 概述 3
1.1 灾难恢复的重要意义 3
1.2 XXX企业容灾方案现状分析 4
2 灾难恢复解决方案 6
2.1 vCenterSiteRecoveryManager 6
2.1.1 概述 6
2.1.2 SiteRecoveryManager的主要功能特性 8
2.1.3 SRM支持灵活的拓扑 10
2.1.4 超越灾难恢复:
灾难规避和计划内迁移 11
2.1.5 VMwareSiteRecovery的工作方式 11
2.1.6 灾难恢复自动化和利用软件定义的存储 12
2.2 vSphereReplication 13
2.2.1 概览 13
2.2.2 利用vSphereReplication来扩大灾难恢复的覆盖范围 14
2.2.3 实现原理与工作机制 18
2.2.4 vSphereReplication的优势 20
3 方案架构设计 22
3.1 客户容灾设计要求 22
3.2 实施方案选择 23
3.2.1 将基于阵列的复制与SRM结合使用 23
3.2.2 将vSphereReplication与SRM结合使用 24
3.2.3 将基于阵列的复制和vSphereReplication与SRM结合使用 25
3.3 网络设计 26
3.3.1 在恢复站点配置相同或不同的IP地址 26
3.3.2 SRM通讯端口设置 28
3.4 存储设计 30
3.4.1 存储复制 30
3.4.2 占位虚拟机 31
3.4.3 快照空间 31
4 配置清单及说明 32
4.1 硬件配置需求 32
4.2 虚拟化软件配置需求 32
5 方案总结 34
5.1 方案要点 34
5.2 方案优势 34
6 专业服务 36
6.1 VMware专业服务介绍 36
6.2 专业咨询服务内容 36
6.2.1 VMwareAccelerate咨询服务 36
6.2.2 技术咨询服务 37
6.2.3 技术客户经理(TAM)服务 37
6.3 专业服务实施流程 38
6.3.1 评估 39
6.3.2 规划与设计 39
6.3.3 实施 39
6.3.4 运维 40
7 支持服务概述 41
7.1 VMware支持的角色和职责 41
7.2 全球技术支持服务 41
7.3 自助服务支持 42
7.3.1 社会支持 42
7.3.2 其他资源 43
8 缩略语解释 44
1概述
1.1灾难恢复的重要意义
统计数据表明:
93%的企业,一旦发生数据中心失效达10天的情况,通常在一年内就会破产。
图:
业务可用性与灾难恢复对企业的影响
来自Forrestor在2014年第二季度的咨询报告表明,正常运行时间和数据保护对业务而言非常关键,灾难带来的员工工作效率下降、士气低落、收入下降、声誉受损和影响合规性将对企业产生巨大的消极影响。
图:
中断造成的不良影响
灾难的发生往往是出乎人们意料的,当突然发生大的灾难,日常建立的控制措施已不再有效时,组织如何才能保护核心业务不被中断,使灾难的造成的风险降到最低呢?
这正是灾难恢复需要考虑的问题。
数据中心的灾难会以不同形式发生,比如电力中断、硬件故障、人为操作失误、以及自然灾害。
大量的事例表明,业务中断不是“假如”的问题,而是“何时”的问题。
因此,只要是拥有IT信息系统的组织,都应为随时可能发生的中断作好准备。
保证业务连续性也就是确保业务连续运作,不管发生什么情况,重要的系统和网络必须具有不间断的可用性。
事实上,灾难恢复的影响不仅仅局限于上面提到的金融领域,政府、公安、医疗、教育等诸多行业都需要使用业务可用性解决方案来保证其业务的可用性,对于这些企业,机关,单位而言,当IT基础设施突然停运,不仅企业内部的业务流转、办公等面临瘫痪,更重要的是,对外与客户或合作伙伴的所有业务交流都不得不陷入停滞。
1.2XXX企业容灾方案现状分析
在国内,很多企业都不具备灾难恢复能力,甚至是一些金融相关的公司都没有真正意义的灾难演练过。
主要是设备成本、技术复杂度已经人员IT技能等多方面因素造成的。
XXX公司的采用传统灾备解决方案,并有了多年的积累和发展,但是传统的解决方案还是存在如下诸多问题的。
首先,传统的可用性解决方案是利用特定于应用的解决方案(如:
OracleRAC、MSSQL集群、ExchangeDatabaseAccessGroups(DAG)等)在应用级别实施业务可用性。
虽然这种方法通常可以提供不错的可用性,但是由于每一组应用都有自己的解决方案,因此这种方法有如下弊端:
·复杂且昂贵
·对管理员的技术要求较高
·出错的风险大
·许可证较贵(如RAC)
·专用的备份架构
其次,虽然有一些基础架构层的解决方案可以比应用级解决方案更加经济高效,但是这些解决方案往往在正常运行时间和RTO(恢复时间目标)方面表现得比较差。
除此之外,传统的灾难恢复解决方案很难在现有的物理X86环境中实现,这是因为:
传统的灾难恢复计划依赖于一套非常复杂的流程和基础架构:
复制数据中心、复制服务器基础架构、将数据转移到恢复站点的流程、重启服务器的流程、重新安装操作系统的流程等等。
由于灾难恢复可能非常复杂,因此各个企业常常发现他们只能为少数几个重要的生产工作负载提供良好的保护,而其他的工作负载(如文件/打印服务器、内部Web服务器、部门级应用)则得不到保护或者保护的不充分。
因为灾难恢复计划和基础架构非常复杂,所以各个企业都极为依赖大量的人员培训、准确且完整的恢复纪录,以及发生停机时恢复流程的准确执行。
除此之外,由于恢复计划的测试过程会造成中断,而且成本非常高昂,所以各个企业无法确保所有培训、文档和执行过程都切实可行并且能够成功恢复IT服务。
图:
传统的灾难恢复解决方案所面临的挑战
上图描述了传统的灾难恢复解决方案所面临的挑战,由于存在这些挑战,该方案往往会产生如下的后果:
·恢复计划的测试往往会失败
·关键工作负载的基本恢复(如能成功)通常要花费数天或数周的时间
·管理和维护恢复计划要耗费IT人员大量的时间和资源
简言之,当前的灾备解决方案还无法满足其企业所设定的业务可用性要求。
由此,XXX公司提出重新设计和实施中心总部应用到北京IDC的异地远程灾备的需求。
XXX总部应用虚拟化改造完毕后,目前服务器虚拟化比例已经达到大约XX%,XX%的应用已经由虚拟化承载,其中包括XX%的关键应用。
需结合应用系统架构给出中心总部应用到北京IDC的异地远程灾备方案及实施日程表,按照日程表完成异地远程灾备。
2灾难恢复解决方案
VMware提出的基于虚拟化环境的软件定义的可用性解决方案,该方案不仅可以提供与应用级别可用性方案相类似的RTO与RPO(恢复点目标),同时,它还可以提供基础架构层解决方案所具备的简易性和成本效益。
同时,由于该方案充分利用了虚拟化环境的优势,因此它可以达到传统的非软件定义解决方案无法达到的效果。
VMware灾难恢复解决方案包括vCenterSiteRecoveryManager和全新的vSphereReplication。
2.1vCenterSiteRecoveryManager
如今,企业发现越来越难以提供符合要求的灾难恢复解决方案。
而SiteRecoveryManager可以帮助企业应对传统灾难恢复方法的各种挑战,满足他们的恢复时间目标(RTO)、恢复点目标(RPO)以及法规遵从性要求。
利用SiteRecoveryManager,企业可以管理从生产数据中心到灾难恢复站点的故障切换,同时,还可以管理两个互为恢复站点且具有活动工作负载的站点之间的故障切换。
2.1.1概述
VMware的灾难恢复解决方案分为三个大的模块,如下图不同颜色模块所示:
其中灾难恢复编排属于自动化解决方案;复制、备份和恢复属于数据保护解决方案;计算存储属于基础架构解决方案。
图:
VMware灾难恢复解决方案
SiteRecoveryManager可以自动执行及简化故障切换至新数据中心的过程,从而让所计划的数据中心故障切换(如数据中心迁移)变得更加顺畅。
它是一款领先的灾难恢复管理和自动化解决方案,它通过自动执行恢复过程来加快恢复的速度,并将灾难恢复作为VMware虚拟基础架构管理的集成要素,从而简化灾难恢复计划的管理工作。
SRM省去了复杂的手动恢复步骤,支持无中断的恢复计划测试,确保恢复过程的安全可靠。
它密切集成vSphere及其他领先存储供应商提供的存储复制软件,使故障切换和恢复变得快捷、可靠、经济,而且便于管理。
因此,企业不仅无需担心灾难恢复的风险,还可将所有重要的系统和应用程序纳入到保护范围。
自从2008年面世以来,SRM已得到长足发展。
到目前为止,VMware已向一万五千多家客户售出12.5万个许可证,并且该产品还在以每年50%~60%的速度继续增长。
SRM为vSphere平台上的灾难恢复计划增加的巨大价值推动了这种增长,而所增加的成本却相对较低。
VMware的许多客户已利用SRM从实际灾难(例如最近在日本发生的海啸和在美国发生的飓风)中快速恢复。
下图是一些主要的客户以及SRM的相关市场数据。
图:
SiteRecoveryManager的发展趋势与部分客户
SRM需要若干个组件。
首先,受保护的站点和故障切换站点都需要一个SRM实例。
SRM实例可通过与vSphere和vCenter紧密集成来提供管理和自动化功能。
SRM还需要底层复制产品来将虚拟机复制到故障切换站点。
借助SRM,客户可以选择使用vSphereReplication或者使用基于存储的复制。
因为vSphereReplication与SRM捆绑在一起,所以无需支付额外费用。
基于存储的复制由第三方存储供应商提供,并通过StorageReplicationAdapater(SRA)与SRM紧密集成,以使SRM能够利用该存储层协调复制和恢复活动。
最后,SRM在这两个站点上都需要配置vSphere集群和单独的vCenter实例。
图:
SRM的主要功能组件
2.1.2SiteRecoveryManager的主要功能特性
VMwarevCenterSiteRecoveryManager可提供先进的复制、灾难恢复管理、无中断测试、自动故障切换和故障恢复以及计划内迁移功能。
它可以管理从生产数据中心到灾难恢复站点的故障切换,以及两个具有活动工作负载的站点之间的故障切换,甚至还可以将多个站点恢复为一个共享的恢复站点。
SiteRecoveryManager经常用于计划内迁移和预防性故障切换以避免发生灾难,它的主要功能特性如下:
集中式恢复计划
·直接从vCenterServer中创建并管理恢复计划。
· 自动发现并显示由vSphereReplication或基于阵列的复制保护的虚拟机。
·将虚拟机映射到故障切换站点上的相应资源(资源池、虚拟交换机和虚拟机文件夹)。
·指定虚拟机引导顺序。
·自定义虚拟机IP地址。
·自定义故障切换站点上的低优先级虚拟机的关机。
·利用自定义脚本扩展恢复计划。
·利用基于角色的访问控制来控制对恢复计划的访问。
·将多个站点恢复至一个共享的恢复站点。
自服务,基于策略的调配
·可以为SiteRecoveryManager安装了VMwarevCenterOrchestrator插件
·多租户可以根据需求通过vRea
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- SRM 解决方案