数据中心切换.docx
- 文档编号:10812068
- 上传时间:2023-02-23
- 格式:DOCX
- 页数:30
- 大小:1.23MB
数据中心切换.docx
《数据中心切换.docx》由会员分享,可在线阅读,更多相关《数据中心切换.docx(30页珍藏版)》请在冰豆网上搜索。
数据中心切换
Exchange2021中有三种类型的切换:
1、 数据库切换:
单个主动数据库切换到另一个数据库副本〔被动副本〕的过程,此被动数据库副本将成为新的主动数据库副本。
数据库切换在数据中心内及数据中心之间都可进展
2、效劳器切换:
将DAG成员上的所有主动数据库在一个或多个其他DAG成员上激活的过程。
与数据库切换一样,效劳器切换在数据中心内及数据中心之间都可进展
3、数据中心切换:
数据中心故障被认为是灾难事件,因此与前两种切换不同,需要管理员手动执行来激活第二个数据中心,从而实现效劳器的高可用
本篇主要介绍数据中心切换,数据中心切换一般有以下几种情况:
主数据中心断电、与Internet连接中断、主数据中心停机维护或例行灾难演练,根据不同情况,我们要采取的措施和相关步骤不太一样,本篇将分别介绍如何进展数据中心切换以及在主数据中心恢复后如何进展回切操作,实验拓扑图如下
实验环境介绍:
1、主数据中心站点和灾备站点各一台DC,同时担任DNS、GC角色,两台DC分别承当见证效劳器和备用见证效劳器以及见证目录
2、主数据中心FA站点两台效劳器VAN-EX1、VAN-EX2,同时担任效劳器、客户端访问效劳器、集线器传输效劳器角色
3、灾备中心HQ站点一台效劳器VAN-EX3,担任效劳器、客户端访问效劳器、集线器传输效劳器角色
4、因实验环境有限,且本篇重点在DAG,所以环境中三台效劳器配置为DAG,客户端访问效劳器使用DNS轮询方式实现简单负载均衡,DAGIP地址192.168.32.55、192.168.0.67;DAG名字DAG.adatum.
5、两个数据库MDB1、MDB2,激活首选效劳器分别为VAN-EX1、VAN-EX2,这两台效劳器同时也承当另一数据库的副本,灾备站点效劳器VAN-EX3承当两个数据库副本
6、所有效劳器操作系统为WindowsServer2021R2
下面列出环境配置简要截图:
1、数据库副本及激活首选项
2、DAG配置
3、DAGIP地址
3、DAC模式
DAC
DatacenterActivationCoordination,数据中心激活协调,是数据库可用性组的属性设置,DAC旨在防止数据中心切换后并在执行回切过程中数据库产生脑裂。
DAC模式默认情况下禁用,建议在跨站点的DAG环境中启用DAC模式,只可使用PowerShell命令启用DAC模式,如下,启用名为DAG的数据库可用性组的DAC模式:
Set-DatabaseAvailabilityGroup-IdentityDAG-DatacenterActivationModeDagOnly,关于DAC模式,可查阅TechNet:
technet.microsoft./en-us/library/dd979790(v=exchg.141).aspx
数据中心激活协调(DAC)模式是数据库可用性组(DAG)的属性。
DAC模式默认处于禁用状态,但应该为具有两个或更多使用连续复制的成员的所有DAG启用该模式。
不应为采用第三方复制模式的DAG启用DAC模式,除非第三方供给商指定这样做。
DAC模式用于控制DAG的启动数据库装入行为。
在数据中心故障回复期间,此控件旨在防止数据库级别上出现网络分区。
分区〔也称为“分区症〞〕是导致正在装入的数据库副本成为同一个DAG上两个无法进展通信的成员上的主动副本的病症。
分区无法使用DAC模式,因为DAC模式要求DAG成员首先获得装入数据库的权限,然后才能装入数据库。
例如,请考虑一种情况,即主数据中心包含两个DAG成员和见证效劳器,第二个数据中心包含两个其他DAG成员。
在这种情况中个,DAG并不处于DAC模式中。
因为主数据中心断电了,因此您在第二个数据中心激活DAG。
最终,主数据中心恢复了供电,在断电前已进展了仲裁的主数据中心的DAG成员将启动并装入其数据库。
因为主数据中心恢复供电时没有通过网络连接到第二个数据中心,而且因为DAG并非处于DAC模式中,因此DAG内的活动数据库出现了分区症。
DAC模式的工作原理
DAC模式包含了数据中心激活协调协议(DACP),以此防止出现网络分区。
在启用DAC模式时,即使DAG成员已进展了仲裁,也不会自动装入数据库。
相反,DACP可用于确定DAG的当前状态,以及活动管理器是否应尝试装入数据库。
您可能将DAC模式视为用于装入数据库的应用程序级别仲裁。
假设要了解DACP的用途以及工作原理,必须了解其旨在处理的主要情况。
请考虑双数据中心的情况。
假设主数据中心中电源完全中断。
在这种情况下,所有效劳器和WAN都停顿运行,所以组织决定激活备用数据中心。
在几乎所有这种恢复方案中,当主数据中心恢复通电时,WAN连接通常不会立即恢复。
这意味着主数据中心中的DAG成员将通电,但无法与已激活的备用数据中心的DAG成员通信。
主数据中心应始终包含大局部DAG仲裁投票者,这意味着恢复通电后,即使备用数据中心的DAG成员未连接WAN,主数据中心中的DAG成员也占大局部,因此拥有仲裁。
拥有仲裁后,这些效劳器可以装入其数据库,这又会导致与现已装入激活的备用数据中心的实际主动数据库有差异,所以这是个问题。
创立DACP就是为了解决此问题。
活动管理器在内存中存储一个数位〔0或1〕,该数位告诉DAG是否允许装入效劳器上以活动状态分配的本地数据库。
当DAG正以DAC模式运行时,活动管理器每次启动时,该数位都被设置为0,表示不允许装入数据库。
因为DAG处于DAC模式,所以效劳器必须尝试与其知道的DAG的其他所有成员通信,以便获取另一个DAG成员,告诉它是否可以装入以活动状态分配给它的本地数据库。
答案将以DAG中其他活动管理器的数位设置形式提供。
如果另一个效劳器将其数位设置为1进展响应,这意味着效劳器允许装入数据库,这样效劳器启动时将其数位设置为1,并装入其数据库。
但是当主数据中心恢复供电时〔这时效劳器恢复,但WAN连接尚未恢复〕,主数据中心内所有DAG成员的DACP位值将为0;因此开场在已恢复的主数据中心内备份的效劳器都不会装入数据库,因为它们都无法与DACP位值为1的DAG成员通信。
具有两个成员的DAG的DAC模式
具有两个成员的DAG的固有限制会导致仅靠DACP位无法完全防止应用程序级网络分区病症。
对于仅有两个成员的DAG,DAC模式也会使用DAG见证效劳器的启动时间来确定是否可以在启动时装入数据库。
会将见证效劳器的启动时间与DACP位设置为1时的时间进展比拟。
∙如果设置DACP位的时间早于见证效劳器的启动时间,那么系统会假设DAG成员和见证效劳器同时重新启动〔可能是因为主数据中心断电〕,不允许DAG成员装入数据库。
∙如果设置DACP位的时间晚于见证效劳器的启动时间,那么系统会假设DAG成员由于某种其他原因〔可能是用于执行维护的方案中断,或可能是与DAG成员无关的系统崩溃或断电〕而重新启动,允许DAG成员装入数据库。
重要说明:
因为见证效劳器的启动时间用于确定DAG成员是否可以在启动时装入活动数据库,所以绝不能同时重新启动见证效劳器和唯一的DAG成员。
这样做可能会使DAG成员处于无法在启动时装入数据库的状态。
如果发生这种情况,那么必须在DAG上运行 Restore-DatabaseAvailabilityGroup cmdlet。
这可重置DACP位并允许DAG成员装入数据库。
DAC模式的其他好处
除了在应用程序级防止网络分区病症之外,通过DAC模式还可以使用用于执行数据中心切换的内置站点恢复cmdlet。
其中包括:
∙Stop-DatabaseAvailabilityGroup
∙Restore-DatabaseAvailabilityGroup
∙Start-DatabaseAvailabilityGroup
为不处于DAC模式的DAG执行数据中心切换需要结合使用Exchange工具和群集管理工具。
有关详细信息,请参阅 数据中心切换。
启用DAC模式
只能通过使用Exchange 命令行管理程序启用DAC模式。
具体来说,您可以使用 Set-DatabaseAvailabilityGroup cmdlet启用DAC模式,如以下例如所示。
Set-DatabaseAvailabilityGroup-IdentityDAG2-DatacenterActivationModeDagOnly
在前面的例如中,为DAG2启用了DAC模式。
有关启用DAC模式的详细信息,请参阅 配置数据库可用性组属性和 Set-DatabaseAvailabilityGroup。
一、下面介绍数据中心切换
1、停顿主数据中心数据库可用性组成员效劳器VAN-EX1、VAN-EX2
注:
数据中心切换大致可分为两种情况:
A、故障发生前进展方案内切换,如数据中心需停机维护;B、灾难发生后进展切换,如数据中心意外断电或Internet连接断开;针对两种情况,需要执行的命令不一样
A、故障发生前,在主数据中心效劳器VAN-EX1上执行命令:
Stop-DatabaseAvailabilityGroup-IdentityDAG-ActiveDirectorySiteFA
B、灾难发生后,在灾备中心效劳器VAN-EX3上执行命令:
Stop-DatabaseAvailabilityGroup-IdentityDAG-ActiveDirectorySiteFA-ConfigurationOnly:
$true
注:
如果主数据中心DC不可访问,上述两条命令可能会报错,可以忽略掉
2、检查上述命令执行结果,继续在相应效劳器上执行如下命令:
Get-DatabaseAvailabilityGroup-IdentityDAG|FLname,start*,stop*
检查数据库状态,执行如下命令:
Get-MailboxDatabase|Get-MailboxDatabaseCopyStatus
数据库可用性组现在是不可用状态,
3、手动执行一次AD同步,将更改同步到灾备数据中心
4、灾备效劳器VAN-EX3上停顿群集效劳,执行PowerShell命令:
Stop-ServiceClusSvc,当然,也可以使用services.msc控制台手动关闭该效劳
注:
如果灾备数据中心有多台效劳器,需要都关闭群集效劳
5、激活灾备数据中心的效劳器,在VAN-EX3上执行命令:
Restore-DatabaseAvailabilityGroup-IdentityDAG–ActiveDirectorySiteHQ
考前须知:
1、这条命令作用:
A、读取DAG配置信息中停顿的效劳器即VAN-EX1、VAN-EX2,并将其驱逐出群集;B、将灾备数据中心的效劳器群集效劳启动并参加DAG,根据成员效劳器数量自动设置仲裁模式,如果成员效劳器数量为奇数,那么会自动利用见证目录强制仲裁模式为“节点和文件共享多数〞
2、如果使用该命令出现上述图中的0x46错误,我们只需要重新执行一遍该命令即可,具体可查阅TechNetBlogs:
blogs.technet./b/timmcmic/archive/2021/05/04/exchange-2021-restore-databaseavailabilitygroup-fails-to-evict-nodes-error-0x46.aspx
3、如果在开场本实验之前没有配置备用见证效劳器和备用见证目录,这里就需要使用如下命令而不是上述命令:
Restore-DatabaseAvailabilityGroup-IdentityDAG-ActiveDirectorySiteHQ–AlternateWitnessServerVAN-DC2-AlternateWitnessDirectoryC:
\DAGFileShareWitnesses
6、在VAN-EX3上翻开故障转移群集控制台验证群集效劳状态、当前节点以及仲裁模式
7、检查DAG网络,在VAN-EX3上pingDAG.adatum.,如以下图,DAGIP已经自动解析为192.168.0.67
8、查看数据库状态,在EMC控制台——组织配置————数据库,如以下图,数据库已经安装在VAN-EX3上
注:
如果灾备数据中心中的效劳器拥有激活阻止设置,那么系统将不会从主数据中心自动故障转移到任何数据库的备用数据中心,此时,可以使用两种方法将数据库在灾备数据中新激活:
1、去除阻止激活设置,系统将恢复为默认行为,即激活所有可用副本;2、保持激活阻止设置不变,使用Move-ActiveMailboxDatabase完成灾备数据中心的数据库激活
9、更改客户端访问效劳器〔OutlookWebApp、自动发现、ExchangeActiveSync、OutlookAnywhere、POP3、IMAP4以及RPC客户端访问阵列〕以及集线器传输效劳器〔SMTP〕的DNS记录,将地址指向VAN-EX3的地址192.168.0.64
10、客户端会在原始DNS条目的TTL过期以及客户端的DNS缓存条目过期之后进展自动连接,我这里就直接使用VAN-EX3的IP测试是否能正常访问
二、下面介绍数据中心回切
将效劳复原到先前发生故障的数据中心的过程称为“故障回复〞,用于执行数据中心故障回复的步骤与用于执行数据中心切换的步骤类似。
一个重要区别是数据中心故障回复按方案执行,中断时间通常较短。
效劳器角色应当是故障回复到主数据中心的第一个角色。
数据中心回切前提条件:
DC、DNS、GC、见证效劳器、客户端访问效劳器、集线器传输效劳器、与灾备数据中心网络连接正常
1、验证主数据中心的DAG成员效劳器VAN-EX1、VAN-EX2的群集效劳启动类型是否为禁用,
VAN-EX1
VAN-EX2
注:
如果两台效劳器的群集效劳启动类型不是禁用状态,那么有两种情况:
1、执行数据中心切换时运行Stop-DatabaseAvailabilityGroup命令没有成功;2、在两个站点间网络恢复后,DAG成员效劳器没有成功接收驱逐出群集的通知。
如果效劳器的群集效劳启动类型没有设置为禁用,需要手动执行以下命令来强制去除过时的群集信息并从群集中退出:
cluster
2、回复数据库可用性组设置并将主数据中心DAG成员效劳器自动参加DAG群集,在VAN-EX1或VAN-EX2上执行如下PowerShell命令:
Start-DatabaseAvailabilityGroup-IdentityDAG-ActiveDirectorySiteFA
3、为确保DAG使用正确的仲裁模式,继续在效劳器上执行如下命令:
Set-DatabaseAvailabilityGroup--IdentityDAG
注:
上图中出现警告可以忽略
4、检查上面两条命令执行结果,包括当前群集节点、仲裁模式,翻开VAN-EX1的故障转移群集控制台
5、检查DAG的设置,在VAN-EX1上执行如下命令:
Get-DatabaseAvailabilityGroup-IdentityDAG|FLName,Start*,Stop*
6、将主数据中心中的效劳器合并到DAG中之后,这些效劳器需要一些时间来同步其数据库副本,具体取决于故障的性质、中断的时间长短、网络连接状况以及管理员在中断期间采取的操作,例如:
管理员在中断期间,在发生故障的主数据中心站点删除了数据库副本,那么需要对数据库副本进展重新种子设定操作。
VAN-EX1上执行以下命令查看各效劳器上的数据库副本状态:
Get-MailboxDatabase|Get-MailboxDatabaseCopyStatus|sortstatus
7、当主数据中心的数据库副本处于正常状态后,便可方案将活动的数据库副本在主站点效劳器上激活。
将VAN-EX3上的所有活动数据库副本在VAN-EX1上激活,执行命令:
Move-ActiveMailboxDatabase-ServerVAN-EX3-ActivateOnServerVAN-EX1stopstop-
8、更改客户端访问效劳器〔OutlookWebApp、自动发现、ExchangeActiveSync、OutlookAnywhere、POP3、IMAP4以及RPC客户端访问阵列〕以及集线器传输效劳器〔SMTP〕的DNS记录,将该记录指向主数据中心的相应效劳器即可
9、客户端会在原始DNS条目的TTL过期以及客户端的DNS缓存条目过期之后进展自动连接,我这里就直接使用VAN-EX1的IP测试是否能正常访问
至此,数据中心切换就完成了,下面给大家分享一个微软Exchange团队发布的数据中心切换向导工具,个人感觉比拟实用,下载地址:
gallery.technet.microsoft./Exchange-2021-Datacenter-09a81fc
数据中心切换
Exchange2021
此主题尚未评级
适用于:
ExchangeServer2021SP2,ExchangeServer2021SP3
上一次修改主题:
2021-02-14
通过将MicrosoftExchangeServer2021ServicePack1(SP1)中的本机站点恢复功能和正确的规划结合使用,可以迅速激活第二个数据中心,从而效劳于发生故障的数据中心的客户端。
数据中心或站点故障的管理方式不同于可能引起效劳器或数据库故障转移的故障类型的管理方式。
在高可用性配置中,自动恢复将由系统启动,故障通常会使系统处于全功能状态。
相比之下,数据中心故障被认为是灾难恢复事件,因此,必须手动执行和完成恢复才可复原客户端效劳并完毕中断。
您执行的过程称为“数据中心切换〞。
与很多灾难恢复方案一样,数据中心切换的前期规划和准备工作可简化恢复过程并缩短中断的持续时间。
在决定激活第二个数据中心之后,需要完成以下四个根本步骤才能执行数据中心切换:
终止局部运行的数据中心:
如果有任何效劳仍在运行,此步骤将终止主数据中心中的和统一消息效劳。
这对效劳器角色尤其重要,因为此效劳器角色使用主动/被动高可用性模型。
如果局部故障的数据中心中的效劳未停顿,那么局部故障的数据中心中的问题可能会在切换回主数据中心期间对效劳产生负面影响。
重要说明:
如果由于主数据中心故障而导致网络或ActiveDirectory根底构造可靠性存在风险,那么我们建议关闭所有效劳,直到将这些依存关系复原到运行正常的效劳。
验证并确认第二个数据中心的先决条件:
此步骤可以与步骤1同时执行,因为验证第二个数据中心的根底构造依存关系的运行状况与第一个数据中心效劳根本无关。
每个组织通常需要其自己的方法来执行此步骤。
例如,您可以决定是通过查看由根底构造监视应用程序收集和筛选的运行状况信息,还是通过使用组织根底构造独有的工具来完成此步骤。
这是关键步骤,因为在第二个数据中心的根底构造不正常和不稳定时进展激活操作可能会产生不良结果。
激活效劳器:
此步骤启动激活第二个数据中心的过程。
此步骤可以与步骤4同时执行,因为MicrosoftExchange效劳可以处理数据库中断和恢复。
激活效劳器涉及一个过程,即将主数据中心的故障效劳器标记为不可用,然后对第二个数据中心中的效劳器进展激活。
效劳器的激活过程取决于DAG是否处于数据库激活协调(DAC)模式。
有关数据库激活协调模式的详细信息,请参阅了解数据中心激活协调模式。
如果DAG处于DAC模式,您可以使用Exchange站点恢复cmdlet来终止局部出现故障的数据中心〔如果需要〕并激活效劳器。
例如,在DAC模式中,可以使用 Stop-DatabaseAvailabilityGroup cmdlet执行此步骤。
在某些情况下,必须两次〔在每个数据中心中各标记一次〕将效劳器标记为不可用。
然后,通过将DAG成员减少到仍可进展正常运行的状态,在第二个数据中心中运行 Restore-DatabaseAvailabilityGroup cmdlet以复原数据库可用性组(DAG)的剩余成员,从而重建仲裁。
如果DAG没有处于DAC模式,必须使用Windows故障转移群集工具来激活效劳器。
完成上述两过程中的任一过程后,以前在第二个数据中心中处于被动状态的数据库副本可以变为活动状态并被装入。
此时,效劳器的恢复完成。
激活其他效劳器角色:
这涉及使用URL映射信息和域11名系统(DNS)更改方法来执行所有所需的DNS更新。
映射信息描述要执行的DNS更改。
完成更新所需的时间量取决于所用的方法和DNS记录上的生存期(TTL)设置〔以及部署的根底构造是否承受此TTL〕。
在步骤3和4完成后的某个时间,用户应开场有权访问效劳。
本主题后面将对步骤3和4进展详细描述。
假设要了解与高可用性和站点弹性相关的管理任务,请参阅管理高可用性和站点恢复。
终止局部故障的数据中心
激活效劳器
激活其他效劳器角色
将效劳复原到主数据中心
重新建立站点弹性
终止局部故障的数据中心
如果发生故障的数据中心中仍有DAG成员在运行,那么应将其终止。
当DAG处于DAC模式时,可以终止主
数据中心中任何仍存在的DAG成员的特定操作如下:
主数据中心中的DAG成员在主数据中心中必须标记为已停顿。
“已停顿〞是活动管理器的一种状态,可阻止数据库装入。
通过使用 Stop-DatabaseAvailabilityGroup cmdlet,可将故障数据中心中的每个效劳器上的活动管理器置于此状态。
只需单个命令,即可通过此cmdlet的 ActiveDirectorySite 参数将主数据中心中的所有效劳器全标记为已停顿。
可能无法执行此步骤,具体取决于故障。
如果数据中心的状态允许,那么应执行此步骤。
应当对主数据中心中的所有效劳器运行 Stop-DatabaseAvailabilityGroup cmdlet。
如果效劳器不可用,但ActiveDirectory在主数据中心中正常运行,那么必须对主数据中心中处于此状态的所有效劳器运行具有 ConfigurationOnly 参数的 Stop-DatabaseAvailabilityGroup 命令,不然就必须关闭效劳器。
无法关闭发生故障的数据中心中的效劳器,或无法成功对效劳器执行 Stop-DatabaseAvailabilityGroup 命令,均可能会发生跨两个数据中心的网络分区病症。
可
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据中心 切换