HACMP 第 5 部分后期安装工作和管理任务1.docx
- 文档编号:9789408
- 上传时间:2023-02-06
- 格式:DOCX
- 页数:26
- 大小:138.65KB
HACMP 第 5 部分后期安装工作和管理任务1.docx
《HACMP 第 5 部分后期安装工作和管理任务1.docx》由会员分享,可在线阅读,更多相关《HACMP 第 5 部分后期安装工作和管理任务1.docx(26页珍藏版)》请在冰豆网上搜索。
HACMP第5部分后期安装工作和管理任务1
使用C-SPOC
本文描述使用集群单点控制(C-SPOC)的HACMP系统管理的优点。
在我们的测试实验环境中(请参见图1),集群配置由以下各项组成:
∙三个节点(IBMpSeries630-6C4,机架安装)
∙两个用于客户端网络的10/100网络交换机,使用两个交换机是为了提供高可用性
∙一个千兆比特以太网交换机,用于进行高速互连
∙一个光纤通道交换机,型号为2109-F32
∙一个存储子系统,型号为1742-9RU(FAStT900),带一个EXP700磁盘箱和1TB的原始存储容量
图1ITSO测试环境
为方便管理集群中的操作,HACMP提供了一种方法,通过该方法可以在多个集群节点执行命令并维护要执行操作之间的协调。
一些集群维护操作可能影响HACMP配置(拓扑和资源),但通过HACMP系统管理工具(C-SPOC),无需停止关键作业即可执行这些任务(如添加或删除资源、用户和更改拓扑元素)。
注意:
C-SPOC使用一种新的集群通信守护进程(clcomdES)在远程节点上执行命令。
如果此守护进程没有运行或者无法验证来自发起者节点的请求,将不会执行远程节点上的命令,因此C-SPOC操作将会失败。
C-SPOC注意事项
C-SPOC工具简化了多达32节点的集群中的共享LVM组件的维护。
与单一节点上运行的标准AIX命令相比,C-SPOC命令在集群环境中提供了与之相当的功能。
通过自动执行重复任务,C-SPOC消除了潜在的错误根源,加快了处理过程。
如果没有C-SPOC,系统管理员将需要花费较长时间在每个集群节点上分别执行管理任务。
例如,要将一个用户添加到集群中的某些(或者所有)节点,则必须在每个集群节点上执行此任务。
使用C-SPOC实用工具,在一个节点(发起更改的节点)上执行的命令也会在其他集群节点上执行。
C-SPOC最大限度地减少了管理开销,并降低了节点状态不一致的可能性。
例如,在使用C-SPOC添加某个用户时,会将该用户添加到所有指定的集群节点上。
注意:
C-SPOC命令位于/usr/es/sbin/cluster/cspoc目录中。
C-SPOC通过其本身的一组集群管理命令提供了此功能,可以通过SMIT菜单和面板使用这些命令,也可以通过命令行使用。
除非确实知道您要尝试获取的内容,否则,我们不建议您使用命令行界面。
要使用C-SPOC,请从HACMPSMIT菜单中选择ClusterSystemManagement选项。
回页首
C-SPOC概述
通过使用C-SPOC,您可以执行下列任务:
∙启动和停止HACMP服务
∙通信接口管理
∙资源组和应用程序管理
∙安全和用户管理
∙逻辑卷管理
∙并发逻辑卷管理
∙物理卷管理
∙GPFS文件系统配置(可选)
∙在一个节点上打开SMIT会话
启动和停止HACMP服务
假设向HACMP定义的IP通信路径对远程节点可用,您可以在集群中的一个节点或多个节点上启动或停止HACMP服务(从同一个节点)。
可以通过以下三种模式执行停止HACMP服务:
∙Graceful
∙Gracefulwithtakeover
∙Forced
限制:
∙不应使用Forced选项一次在多个节点上停止集群服务。
∙如果一个节点包含一个具有并发卷组的资源组,则无论该并发卷组的类型如何(传统并发或增强的并发),都不得使用Forced选项停止该节点。
否则可能会导致数据损坏。
通信接口管理
使用此功能,您可以修改集群中所有节点的通信接口设置。
当您希望在节点上添加或从中删除通信接口时,包括替换(热交换)现有通信接口,此菜单特别有用。
可以在不停止HACMP服务的情况下执行这些操作,但前提是在每个网络上向HACMP定义了足够的通信接口,以避免使受影响的资源组脱机。
资源组和应用程序管理
可以对资源组和应用程序执行的操作有:
∙使资源组联机
∙使资源组脱机
∙将资源组移动到其他节点
∙挂起和恢复应用程序监视(如果已配置)
安全和用户管理
在HACMPV5.1中,与HACMP的远程命令扩展相关的操作是通过集群通信守护进程和提供的实用工具(cl_rsh、cl_rexec等)执行的。
只有集群命令(位于/usr/es/sbin/cluster中的命令)可以作为root用户运行;所有其他命令只能作为“nobody”用户运行。
集群通信守护进程根据HACMP配置中定义的通信接口的IP地址提供自己的身份验证(基于主机的身份验证)。
此外,还可以通过Kerberos服务器执行身份验证(假设在环境中已经设置服务器并且服务器可用)。
您可以将clcomdES身份验证从“标准”更改为“增强”(Kerberos)。
对于用户管理,您可以添加、删除和修改集群中所有节点或者指定节点或资源组上的用户和组。
还可以更改一个节点、集群中的所有节点、或者属于特定资源组的节点上的用户密码。
限制:
在HACMPV5.1中,只有root用户才可以使用C-SPOC更改其他用户的密码。
而且,HACMP无法阻止用户在单个节点上更改自己的密码。
逻辑卷管理
在使用此功能时,您可以添加新的和修改现有的卷组、逻辑卷和文件系统,但无法删除以前创建的LVM对象。
对于此操作,需要确保卷组不属于任何资源组,然后才可以从所有节点上手动导出卷组定义。
重要:
在向集群定义卷组后,应该运行HACMP配置自动发现(auto-discovery)功能,并将以前创建的卷组添加到资源组。
如果不将新卷组添加到资源组,则即使在预定节点上成功地进行了挂载,也无法使用C-SPOC对此卷组创建逻辑卷或文件系统。
并发逻辑卷管理
并发逻辑卷管理类似“逻辑卷管理”,不同的是您可以创建并发卷组。
请记住,使用AIX5LV5.2,您无法创建传统(classic)的并发卷组(即使使用32位内核也如此);只能创建增强(enhanced)的并发卷组。
无论并发卷组的类型如何(传统的或增强的),还必须运行发现并在资源组中包括新卷组才能进一步使用(逻辑卷创建)。
物理卷管理
使用此选项,可以向集群节点添加或从中删除物理磁盘。
这有助于在所有节点上维护磁盘配置。
由于硬盘数在每个集群节点上可能不一样(由于不同的内部磁盘配置等原因造成),因此HACMP无法使用硬盘号进行C-SPOC操作。
将使用物理卷ID进行进一步的操作。
在向集群添加物理磁盘时,HACMP可以确保在所有集群节点上统一标识磁盘。
GPFS文件系统配置(可选)
此选项也称为HACMPGPFS集成功能,它仅在安装了cluster.es.cfs包时才可用,并可以将其与GPFS包一起使用,以便在与HACMP集群相同的节点上配置GPFS集群。
有关先决条件和详细信息,请参阅GeneralParallelFileSystem(GPFS)forAIX5LinanRSCTpeerdomain:
Concepts,Planning,andInstallation,GA22-7974。
在一个节点上打开SMIT会话
此工具为集群节点提供了远程系统管理和配置(不只是HACMP菜单)。
此功能使用了客户端通信守护进程。
C-SPOC及其相关的资源组
修改LVM组件的C-SPOC命令需要一个资源组名称作为参数。
必须在资源组中配置作为此命令目标的LVM组件,才能实际更改此组件。
C-SPOC使用资源组信息来确定它必须在哪些节点上执行所需的操作。
回页首
HACMPV5.1中的C-SPOC增强功能
在HACMPV5.1中,为提高操作的速度和可靠性,我们改进了C-SPOC,并添加了许多增强功能。
其中的一些主要增强功能有:
∙性能
过去,用户之所以不愿意使用C-SPOC,是因为使用命令行等效项的速度更快一些。
性能改进的原因是由于C-SPOC使用了集群通信基础结构(clcomdES)。
∙增强的并发模式(ECM)支持
从AIX5LV5.1开始以及后续版本中,可以通过C-SPOC创建增强的并发卷组。
∙现在支持管理VPATH设备(在HACMPV4.5PTF5中也提供该支持)。
∙新名称SystemManagement(C-SPOC)已经添加到SMIT面板中。
∙HACMP软件版本验证
引入了更快的机制。
不是在每次执行验证时都计算具有最低HACMP版本的节点,而是仅执行一次计算,并在发起验证进程的节点上缓存一个小时数据,以便更快地访问。
∙为提高效率,更新了一些LVM脚本。
回页首
配置更改:
DARE
在配置HACMP集群时,配置数据存储在ODM中的特定于HACMP的对象类中。
AIXODM对象类的HACMP存储在缺省配置目录(DCD)/etc/es/objrepos中。
在集群运行时,可以对集群拓扑和集群资源执行特定的更改。
此操作称为动态自动重新配置事件(DARE)。
在HACMPV5.1之前,更改集群拓扑和集群资源非常耗时,这是因为需要在集群中运行多个DARE操作。
在同一操作中不可能对资源和拓扑同时执行动态重新配置更改。
HACMPV5.1允许通过一个动态重新配置操作组合资源和拓扑更改。
限制:
如果在集群中定义了站点,则无法使用DARE对集群资源或拓扑执行更改。
这是由于在重新配置过程中,辅助(远程)站点可能会错误地检测到主站点故障并启动一个接管进程。
DARE操作
动态重新配置需要对集群中所有节点上的HACMPODM类进行更改。
在以前的HACMP版本中,每当执行动态配置更改时,将为需要更改的每个类发送到集群中其他节点的多个远程连接。
在当前版本中,由于提供了集群通信基础结构(clcomdES),到远程节点的连接已经开放和保持活动状态,因此远程操作更快。
在集群启动时,HACMP将其ODM类复制到名为活动配置目录(ACD)的单独目录中。
在集群运行时,HACMP守护进程、脚本和实用工具引用ODM的活动配置目录(ACD)中存储的ODM数据。
如果当集群管理器在本地节点上运行时,同步集群拓扑或集群资源定义,此操作将触发动态重新配置(DARE)事件。
在动态重新配置事件中,将在分段配置目录(SCD)中启动重新配置进程的节点上收集所有集群节点上的缺省配置目录(DCD)中的ODM数据。
将在本地节点上收集来自远程节点的HACMPODM类,并执行和向节点发回带时间戳的校验和。
执行配置更改,更新分段配置目录中的ODM类,然后发回到原始节点。
如果从多个节点启动了验证/同步,则将验证校验和以避免数据损坏,如果校验和正确,将更新目标节点上缺省配置目录中的ODM类(覆盖)。
在最后一步中,活动配置目录中的ODM数据将被新的配置数据覆盖。
将刷新HACMP守护进程,以便新配置成为当前活动的配置(请参见图2)。
图2DAREODM操作
更改资源和拓扑的动态重新配置操作过程按以下顺序进行:
∙释放受重新配置影响的任何资源
∙重新配置拓扑
∙获取和重新获取受重新配置操作影响的任何资源。
在对集群定义进行更改之前,请确保:
∙在所有节点和在同一级别上安装了HACMP。
∙所有节点都可用(启动并正常运行)并能够相互通信。
即使集群服务可能不在集群节点上运行,也可以从具有集群服务活动的其他节点执行重新配置。
注意:
在DARE操作过程中,任何节点都不得处于强制停机状态。
停机状态可能会影响资源组的可用性和/或损坏数据。
∙集群处于稳定状态;最近没有事件错误或也不存在config_too_long消息。
同步配置更改
在更改集群的拓扑或资源时,HACMP将更新缺省配置目录(/etc/es/objrepos)中的ODM中存储的数据。
同步过程将导致本地集群节点上的缺省配置目录中存储的信息复制到其他集群节点上缺省配置目录中的ODM对象类。
在同步集群时,将触发动态重新配置事件,并且HACMP将验证集群拓扑和集群资源是否已正确配置(即使您仅修改其中之一也将验证)。
由于拓扑中的更改会导致资源配置无效(反之亦然),因此软件会检查这两种情况。
动态集群拓扑更改
注意:
在HACMPV5.1中,DARE已得到极大改进,可以在一个操作中同时支持资源更改和拓扑更改。
您可以在活动集群上动态地对集群拓扑进行以下更改:
∙添加或删除节点
∙添加或删除网络接口
∙交换网络接口卡(用于更换硬件)
∙更改网络模块优化参数
∙添加新的网络
重要:
为避免对资源进行不必要的处理,建议您在更改之前先使用clRGmove命令移动将受更改影响的资源组。
在动态重新配置集群时,HACMP将在必要时释放资源组,并在以后重新捕获。
在不停止HACMP服务、使应用程序脱机或重新启动节点的情况下,无法动态执行以下拓扑和资源组更改:
∙拓扑更改
o更改集群的名称。
o更改集群ID。
o更改集群节点的名称。
o更改通信接口的属性。
o将网络从通过IP别名的IPAT更改为通过IPAT替换,反之亦然。
o更改网络模块的名称。
o添加网络接口模块。
o删除网络接口模块。
o完成重新配置集群管理器依赖的RSCT对等域(拓扑和组服务)所需的任何其他更改。
∙资源更改
o更改资源组的名称。
o更改应用服务器的名称。
o更改节点关系。
如果由于意外集群事件导致动态重新配置失败,则分段配置目录(SCD)可能仍然存在。
这可以防止对集群进一步更改。
如果在同步过程中发生节点失败,则不会在所有节点上清除分段配置目录(SCD)。
存在分段配置目录可以防止进一步执行配置更改。
如果在同步结束时没有清除分段配置目录,则表明DARE操作没有完成;因此,分段配置目录将充当对进一步更改的锁定。
您可以观察到,在每个节点的集群管理器将更改复制到每个节点的活动配置目录之前,已对分段配置目录复制了DCD副本。
在某个节点上启动HACMP时,如果存在分段配置目录,会将该分段配置目录复制到活动配置目录,然后删除该分段配置目录并使用新的活动配置目录。
如果在DARE过程中任何时间发生了节点故障,则在某些节点上会存在“残余”的分段配置目录,在任何节点上重新启动HACMP之前必须删除分段配置目录,
否则可能会造成不同的集群节点使用不同的配置运行,这种情况会导致一个或多个集群节点宕机。
要从此情况中恢复,必须使用ReleaseLocksSetByDynamicReconfigurationSMIT菜单。
这将清除其余的分段配置目录并允许进一步执行集群同步。
如果在任一集群节点上存在分段配置目录,则在删除此目录之前不允许进一步同步。
要清除DARE锁定,请使用以下示例中的过程(从示例1开始)。
示例1ProblemDeterminationTools屏幕
HACMPforAIX
MovecursortodesireditemandpressEnter.
InitializationandStandardConfiguration
ExtendedConfiguration
SystemManagement(C-SPOC)
ProblemDeterminationTools
F1=HelpF2=RefreshF3=CancelF8=Image
F9=ShellF10=ExitEnter=Do
要释放DARE锁定,请使用HACMPProblemDeterminationTools菜单,如示例2所示。
示例2ReleaseLockSetDARE屏幕
ProblemDeterminationTools
MovecursortodesireditemandpressEnter.
HACMPVerification
ViewCurrentState
HACMPLogViewingandManagement
RecoverFromHACMPScriptFailure
RestoreHACMPConfigurationDatabasefromActiveConfiguration
ReleaseLocksSetByDynamicReconfiguration
ClearSSADiskFenceRegisters
HACMPTraceFacility
HACMPEventEmulation
HACMPErrorNotification
OpenaSMITSessiononaNode
F1=HelpF2=RefreshF3=CancelF8=Image
F9=ShellF10=ExitEnter=Do
等待命令完成并成功结束(参见示例3)。
如果此操作没有成功,则无法继续执行下一步,并且可能需要支持人员的干预。
示例3CheckstatusreleaseDARElock屏幕
COMMANDSTATUS
Command:
OKstdout:
yesstderr:
no
Beforecommandcompletion,additionalinstructionsmayappearbelow.
cldare:
SucceededremovingallDARElocks.
f1=HelpF2=RefreshF3=CancelF6=Command
F8=ImageF9=ShellF10=Exit/=Findn=FindNext
要在一步中执行相同的操作,还可以使用/usr/es/sbin/cluster/utilities/cldare-u命令。
回页首
管理用户和组
在HACMP中,C-SPOC允许您管理用户和组(创建和更改特征)。
HACMPV5.1中引入了一个新选项:
现在您还可以通过C-SPOC更改用户密码。
在创建用户或组时,您可以按资源组选择节点,也可以指定集群中的单个节点或所有节点。
注意:
在HACMPV5.1中,只有root用户可以更改用户的密码。
在使用HACMP更改用户密码之前,应先检查以下先决条件:
∙所有节点必须已经安装了HACMPV5.1。
∙已经配置了集群拓扑。
∙列表中的每个集群节点上必须存在该用户帐户。
∙此用户帐户必须在本地节点上存在。
(将在本地节点上更改密码,即使该节点不在所选节点列表或资源组中也如此。
)
∙必须在所有集群节点上运行AIX,并且所有节点必须能够通过clcomdES进行通信。
可以通过HACMPC-SPOC菜单或使用以下SMIT快捷路径访问用户管理:
#smittycl_usergroup
将出现示例4中的屏幕。
示例4选择密码选项
HACMPSecurityandUsersManagement
MovecursortodesireditemandpressEnter.
Change/ShowHACMPSecurityMode
UsersinanHACMPcluster
GroupsinanHACMPcluster
PasswordsinanHACMPcluster
F1=HelpF2=RefreshF3=CancelF8=Image
F9=ShellF10=ExitEnter=Do
要更改用户的密码,请使用示例5中所示的菜单。
示例5更改用户密码
PasswordsinanHACMPcluster
MovecursortodesireditemandpressEnter.
ChangeaUser'sPasswordintheCluster
F1=HelpF2=RefreshF3=CancelF8=Image
F9=ShellF10=ExitEnter=Do
您可以选择资源组(用户所属的节点集),并指定用户的名称,如示例6所示。
示例6选择节点和用户
ChangeaUser'sPasswordintheCluster
Typeorselectvaluesinentryfields.
PressEnterAFTERmakingalldesiredchanges.
[EntryFields]
Selectionnodesbyresourcegroupcustomrg
***Noselectionmeansallnodes!
***
*UserNAME[userp630n01]+
Usermustchangepasswordonfirstlogin?
true+
F1=HelpF2=RefreshF3=CancelF4=List
F5=ResetF6=CommandF7=EditF8=Image
F9=ShellF10=ExitEnter=Do
注意:
请考虑以下选项:
∙Selectingthenodesbyresourcegroup
如果保留该字段为空,则在缺省情况下将选中集群中的所有节点。
∙UsermustchangePasswordonfirstlogin?
如果设置为True,则该用户在下次登录时将需要更改每个节点上的密码。
如果设置为False,则该用户在下次登录时将不需要更改密码,缺省值为True。
输入用户名和当前密码,然后更改密码,如示例7所示。
示例7密码更改屏幕
COMMANDSTATUS
Command:
runningstdout:
nostderr:
no
Beforecommandcompletion,additionalinstructionsmayappearbelow.
userp630n01'sNewpassword:
Enterthenewpasswordagain:
有关详细信息,请参阅HACMPforAIX5LV5.1AdminstrationandTroubleshootingGuide,SC23-4862-02的第14章“ManagingUsers,Groups,andSecurityinaCluster”。
回页首
使用C-SPOCLVM管理集群存储
更改LVM组件是集群中最常见的更改类型。
使用C-SPOC可以执行以下操作:
∙对
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- HACMP 部分后期安装工作和管理任务1 部分 后期 安装 工作 管理 任务