使用 CSPOC HACMP 维护3.docx
- 文档编号:2816959
- 上传时间:2022-11-15
- 格式:DOCX
- 页数:17
- 大小:53KB
使用 CSPOC HACMP 维护3.docx
《使用 CSPOC HACMP 维护3.docx》由会员分享,可在线阅读,更多相关《使用 CSPOC HACMP 维护3.docx(17页珍藏版)》请在冰豆网上搜索。
使用CSPOCHACMP维护3
问题确定
HACMP提供了各种工具来确定问题。
集群配置和操作的每个方面都有多种对应的问题确定工具和技术。
在HACMP中进行问题确定需要有针对HACMP集群中的各个方面的特定技能,其中包括:
∙IBMpSeries硬件
∙AIX系统管理和问题确定
∙网络和TCP/IP
∙存储
∙应用程序
∙HACMP
HACMPProblemDetermination工具包括以下选项:
∙HACMP验证
∙集群状态
∙HACMP日志查看和管理
∙从脚本故障中恢复
∙从活动配置中还原配置数据库
∙释放由动态重新配置设置的锁
∙清除SSADiskFence注册
∙HACMP跟踪工具
∙事件模拟
∙错误通知
HACMP还提供了用于确定问题的SMIT菜单(请参见示例1)。
示例1问题确定工具
ProblemDeterminationTools
MovecursortodesireditemandpressEnter.
HACMPVerification
ViewCurrentState
HACMPLogViewingandManagement
RecoverFromHACMPScriptFailure
RestoreHACMPConfigurationDatabasefromActiveConfiguration
ReleaseLocksSetByDynamicReconfiguration
ClearSSADiskFenceRegisters
HACMPTraceFacility
HACMPEventEmulation
HACMPErrorNotification
OpenaSMITSessiononaNode
F1=HelpF2=RefreshF3=CancelF8=Image
F9=ShellF10=ExitEnter=Do
HACMP验证
在HACMPProblemDeterminationTools菜单下选择此选项即可使用缺省方法或自定义验证方法验证集群配置。
要访问此菜单,还可以使用smittyclverify.dialog快速路径(请参见示例2)。
示例2选择集群验证方法
VerifyCluster
Typeorselectvaluesinentryfields.
PressEnterAFTERmakingalldesiredchanges.
[EntryFields]
BaseHACMPVerificationMethodsboth+
(Clustertopology,resources,both,none)
Custom-DefinedVerificationMethods[my_app]+
ErrorCount[6]#
LogFiletostoreoutput[/tmp/my_app.log]
Verifychangesonly?
[No]+
Logging[Standard]+
F1=HelpF2=RefreshF3=CancelF4=List
F5=ResetF6=CommandF7=EditF8=Image
F9=ShellF10=ExitEnter=Do
缺省情况下,在基本HACMP验证方法中,系统会对集群拓扑和资源进行验证。
可以切换此输入字段来运行程序,也可以选择None在Custom-DefinedVerificationMethod字段中指定自定义验证方法。
∙自定义验证方法
自定义验证方法是客户提供的用于验证特定应用程序的HACMP配置的脚本,类似于应用程序启动/停止脚本。
在您想要将此脚本用于应用程序服务器时,必需向HACMP定义该脚本。
缺省情况下,如果您未选择任何方法,clverify实用程序将不会检查基本验证方法,并且会生成一条错误消息。
验证方法的列出顺序决定了所选方法的运行顺序。
此顺序在后续的验证中将保持不变,直到您选择了不同的方法。
选择All对所有自定义方法进行验证。
∙错误计数
缺省情况下,即使程序在运行过程中发现错误也会运行到最后。
要在错误数量达到某一特定值时取消此程序,请在此字段键入该数值。
∙创建日志文件来存储输出
输入用于存储验证输出的输出文件的名称。
缺省情况下,验证输出存储在缺省clverify日志中,路径为/var/hacmp/clverify/clverify.log。
∙验证模式
选择“normalverification”将运行适用于当前集群配置的所有验证检查。
选择“verifymodificationsonly”将对与HACMP配置中发生更改的部分相关的检查进行验证。
仅验证经过修改的配置类可加速验证过程。
注意:
系统仅在活动集群中对配置差异进行验证(DARE)。
在非活动集群中,选择“verifymodificationsonly”不起作用;无论是否选择它,系统都会对所有HACM配置类进行验证。
∙详细输出
选择“on”会将所有输出显示到通常存在于以下位置的控制台:
/var/hacmp/clverify/clverify.log。
缺省值为off。
Viewcurrentstate
在HACMPProblemDeterminationTools菜单中选择此选项将显示节点、通信接口、资源组的状态,以及最近五个事件的本地事件摘要。
HACMPlogviewingandmanagement
在HACMPProblemDeterminationTools菜单中选择此选项将转入与日志文件相关的实用程序的菜单。
在此您可以查看事件摘要,更改/显示日志文件参数,重定向日志文件,以及查看日志文件。
RecoverfromHACMPscriptfailure
在HACMPProblemDeterminationTools菜单中选择此选项可从HACMP脚本故障中恢复。
在集群事件失败及集群处于错误状态时,此选项是很有用的。
此类错误的一个示例是config_too_long事件,此事件在一个节点无法释放文件系统(由于“残余”进程)时可能会发生;因此,接管节点无法加载文件系统。
RecoverFromHACMPScriptFailure菜单选项调用/usr/es/sbin/cluster/utilities/clruncmd命令,该命令向指定节点上的ClusterManager守护进程(clstrmgrES)发送一个信号,指示该进程终止任何错误挂起事件脚本并稳定集群活动。
要从脚本故障中恢复,请运行smittyhacmp并选择SelectHACMPProblemDeterminationTools→RecoverFromScriptFailure,然后选择要对其运行clruncmd命令的节点的IP标签/地址,并按Enter。
Restoreconfigurationdatabasefromactiveconfiguration
在HACMPProblemDeterminationTools菜单中选择此选项,将在使用集群管理器当前使用的ActiveConfigurationDirectory(ACD)中的值恢复配置数据库之前,自动将快照中的任何配置更改保存到/usr/es/sbin/cluster/snapshots/UserModifiedDB文件中。
要执行此任务,请运行smittyhacmp并选择HACMPProblemDeterminationTools→RestoreHACMPConfigurationDatabasefromActiveConfiguration,然后按Enter。
Releaselockssetbydynamicreconfiguration
在动态重新配置(DARE)过程中,HACMP将为特定于HACMP的ODM类创建临时副本,并将这些副本存储在StagingConfigurationDirectory(SCD)中。
这允许您在动态重新配置进行的同时修改集群配置。
但是,在DARE完成之前您无法同步此新配置。
只要任何集群节点上存在SCD就会阻止动态重新配置。
如果节点在DARE过程中或由于其他任何原因而发生故障,则在动态重新配置完成之后节点上仍将存在StagingConfigurationDirectory(SCD),因此会阻止任何进一步的动态重新配置操作。
在这种情况下,您必需删除DARE锁;否则,您将无法执行任何配置更改(即使您将所有节点上的集群服务都停止也无济于事)。
要删除动态重新配置锁,请运行smittyhacmp→HACMPProblemDeterminationTools→ReleaseLocksSetByDynamicAutomaticReconfigurationEvent。
ClearSSAdiskfenceregisters
只有在紧急情况下,才可以在HACMPProblemDeterminationTools菜单中选择此选项(通常仅在IBM支持部门推荐这样做时才进行选择)。
注意:
共享存储的磁盘保留机制阻止从集群中的多个节点进行同时访问,这样可以避免数据损坏。
既可以在存储级别实施磁盘保留机制(SSA磁盘保留或SCSI3永久保留),也可以在软件级别实施磁盘保留机制(对特定的集群软件,如GeneralParallelFileSystem(GPFS))。
对于共享VG(非并发),HACMP依赖于硬件保留机制。
在集群操作过程中,发生故障的节点不能释放SSA存储的情况只占极少数,
因此,接管节点不能中断磁盘保留,这将让您能够通过启用共享卷组来接管资源组。
如果SSADiskFencing功能已启用,而出现了需要访问磁盘的一个或一组节点无法访问物理磁盘的情况,那么清除界限寄存器将允许访问。
执行此操作后,SSADiskFencing算法将被禁用,到HACMP从所有节点重新启动时此算法才会重新启用。
要中断DiskFencing,请运行smittyhacmp并选择HACMPProblemDeterminationTools→ClearSSADiskFenceRegisters。
然后选择一个或多个受影响的物理卷,并按Enter。
要再次启用SSADiskFencing,请在共享此存储的所有节点上重新启动集群服务。
我们建议您在清除SSA界限寄存器之前也应停止集群服务。
HACMPtracefacility
如果日志文件中没有相关的内容且逐组件分析不会产生具体的结果,则可以选择此选项。
您可能需要使用HACMP跟踪工具来尝试诊断问题。
此跟踪工具详细介绍了所选的系统事件。
请注意,必须同时运行HACMP和AIX软件才能使用HACMP跟踪。
请记住,此跟踪工具需要额外的磁盘空间来进行日志记录,并且还需要借助CPU之力来收集数据,因此会减慢集群节点上运行的应用程序的速度。
Eventemulation
选择
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 使用 CSPOC HACMP 维护3 维护