VCS双机检验方法.docx
- 文档编号:29072982
- 上传时间:2023-07-20
- 格式:DOCX
- 页数:12
- 大小:18.75KB
VCS双机检验方法.docx
《VCS双机检验方法.docx》由会员分享,可在线阅读,更多相关《VCS双机检验方法.docx(12页珍藏版)》请在冰豆网上搜索。
VCS双机检验方法
1双机检验
关于本章
必须保证双机系统的启动、切换和停止都正常。
检查双机启动
检查双机切换
检查双机停止
1.1检查双机启动
检查双机状态
1.在两个节点上执行如下命令,启动双机。
#hastart
2.执行如下命令,检查双机资源、资源组状态。
#hastatus
如果smcsrv1和smcsrv2的状态都为running,smccluster资源组的所有资源在其中一台主机为online,在另外一台主机为offline,表示双机正常。
显示信息如下所示。
查看资源的状态可以使用hares-state。
attemptingtoconnect....connected
groupresourcesystemmessage
---------------------------------------------------------------------------
smcsrv1RUNNING
smcsrv2RUNNING
smcclustersmcsrv1ONLINE
smcclustersmcsrv2OFFLINE
-------------------------------------------------------------------------
RawRessmcsrv1ONLINE
RawRessmcsrv2OFFLINE
SmcAppsmcsrv1ONLINE
SmcAppsmcsrv2OFFLINE
SmcVGsmcsrv1ONLINE
-------------------------------------------------------------------------
SmcVGsmcsrv2OFFLINE
serviceipsmcsrv1ONLINE
serviceipsmcsrv2OFFLINE
mountlv_billsmcsrv1ONLINE
mountlv_billsmcsrv2OFFLINE
-------------------------------------------------------------------------
SmcNicsmcsrv1ONLINE
SmcNicsmcsrv2ONLINE
LSNR_ora11_lsnrsmcsrv1ONLINE
LSNR_ora11_lsnrsmcsrv2OFFLINE
ORA_SRVsmcsrv1ONLINE
-------------------------------------------------------------------------
ORA_SRVsmcsrv2OFFLINE
如果有资源的状态为STALE_ADMIN_WAIT,请执行如下命令,手工拉起资源。
#hasys–forcesmcsrv1
3.执行如下命令查看双机状态:
#hastatus-sum
--SYSTEMSTATE
--SystemStateFrozen
Asmcsrv1RUNNING0
Asmcsrv2RUNNING0
--GROUPSTATE
--GroupSystemProbedAutoDisabledState
Bsmcclustersmcsrv1YNONLINE
Bsmcclustersmcsrv2YNOFFLINE
显示信息中状态为“ONLINE”的为主用。
检查浮动IP地址
在主备机上分别执行ifconfig-a。
在当前的主机上有bond0:
0,IP地址为浮动IP地址,如下所示。
bond0:
0Linkencap:
EthernetHWaddr00:
18:
82:
55:
93:
4A
inetaddr:
Bcast:
Mask:
UPBROADCASTRUNNINGMASTERMULTICASTMTU:
1500Metric:
1
检查SMC进程
4.以smc用户登录主备机,执行p命令,分别检查SMC的进程。
如果SMC启动成功,则显示信息如下所示。
ProcessListOfShortMessageCenter
----------------------------------------------------
USERPIDPPIDCOMMAND
smc80651clustermng
smc80828065smcapp
smc80888065dbdaemon
smc80768065billcreater
smc80708065backupdaemon
smc81068065filemirror
smc81008065mapserver
smc80948065mtiserver
smc80958065l2cachedaemon
smc80968065fcc
Count10
5.在主备机上执行smcdbg命令,检查SMC各进程的状态。
正常情况下,在当前主机上,clustermng监控的所有进程的状态应该为Master,在当前备机上,clustermng监控的所有进程为Slave状态。
以下是在主机上的显示结果。
Linuxsmcsrv22.6.16.#1SMPThuMay1714:
00:
09UTC2007x86_64
===Copyright(C)1988-2009,HuaweiTech.Co.,Ltd.===
SMSCCenterSmcdbgVersion:
infoX[Page1/3]
°¤¤¤¤¤¤¤¤¤¤¤¤¤¤¤¤¤¤¤¤¤¤¤¤¤¤¤¤¤¤¤¤¤¤¤¤¤¤¤¤′
|CommonOptionsPage|
||
|TraceStatInfoResetMaster|
|FlagFlagDispStatSlave|
|SmcApp[][][][clr][Master]|
|DBDaemon[][][][clr][Master]|
|BackupDaemon[][][][clr][Master]|
|BillCreater[][][][clr][Master]|
|ClusterMng[][][][clr][Master]|
|FileMirror[][][][clr][Master]|
|MapServer[][][][clr][Master]|
|MTIServer[][][][clr][Master]|
|L2CacheDaemon[][][][clr][Master]|
|AlertDaemon[][][][clr][Slave]|
|Fcc[][][][clr][Master]|
|MTServer[][][][clr][Slave]|
|CMapServer[][][][clr][Slave]|
|CCM[][][][clr][Slave]|
¤¤¤¤¤¤¤¤¤¤¤¤¤¤¤¤¤¤¤¤¤¤¤¤¤¤¤¤¤¤¤¤¤¤¤¤¤¤¤¤
DCSProxy[][][][clr][Slave]
检查数据库状态
以oracle用户登录主备机,执行如下操作,连接数据库。
oracle@smcsrv1:
~>sqlplus/nolog
SQL>connsystem/oracle
在当前主机上的显示结果如下所示。
Connected.
在当前备机上的显示结果如下所示。
ERROR:
ORA-01034:
ORACLEnotavailable
ORA-27101:
sharedmemoryrealmdoesnotexist
Linux-x86_64Error:
2:
Nosuchfileordirectory
ProcessID:
0
SessionID:
0Serialnumber:
0
在当前主机上执行如下命令,验证tnsname配置是否生效。
SQL>quit
oracle@smcsrv1:
~>tnspingorasmc
执行成功后,显示信息如下所示。
TNSPingUtilityforLinux:
Version11.1.0.-Productionon26-MAR-200908:
44:
39
Copyright(c)1997,2008,Oracle.Allrightsreserved.
Usedparameterfiles:
/home/oracle/product/11g/db/network/admin/
UsedTNSNAMESadaptertoresolvethealias
Attemptingtocontact(DESCRIPTION=(ADDRESS_LIST=(ADDRESS=(PROTOCOL=TCP)(HOST=)(PORT=1521)))(CONNECT_DATA=(SERVER=DEDICATED)(SERVICE_NAME=orasmc)))
OK(0msec)
检查文件系统状态
在主备机上执行如下命令,检查文件系统。
#df
在当前主机上可以看到如下文件系统,在备机上则不会显示如下文件系统。
/dev/mapper/appvg-lv_bill
1314881%/home/smc/billdata
1.2检查双机切换
操作步骤
步骤1手工切换双机。
在主机或者备机上执行如下命令,切换双机。
#hagrp-switchsmccluster-tosmcsrv2
其中,“smccluster”是在文件中配置的群组名。
“smcsrv2”是希望切换到的节点名。
请以实际配置的名称为准。
切换完成后,请参见检查双机启动,检查双机状态、SMC进程、数据库状态和文件系统状态。
双机切换后的结果如下。
切换前的主机变成当前的备机,切换前的备机变成当前的主机。
在主备机上均可查看到SMC的“”中配置的进程。
在当前主机上,所有监控进程的状态都为Master,在当前备机上,所有监控进程的状态都为Slave。
在当前主机上能够连接数据库,但是在当前备机上不能连接数据库。
在当前主机上执行df命令,能够查询到“/home/smc/billdata”和“/home/smc/mnt”文件系统。
步骤2检查网卡故障时的双机切换。
6.在当前主机上执行如下命令,检查绑定网卡当前的状态。
#cat/proc/net/bonding/bond0
显示信息如下所示。
EthernetChannelBondingDriver:
v2.6.0(January14,2004)
BondingMode:
fault-tolerance(active-backup)
PrimarySlave:
None
CurrentlyActiveSlave:
eth1
MIIStatus:
up
MIIPollingInterval(ms):
200
UpDelay(ms):
0
DownDelay(ms):
0
SlaveInterface:
eth1
MIIStatus:
up
LinkFailureCount:
0
PermanentHWaddr:
00:
18:
82:
55:
93:
4a
SlaveInterface:
eth2
MIIStatus:
up
LinkFailureCount:
0
PermanentHWaddr:
00:
18:
82:
55:
93:
4b
从以上信息可以看出bond0是由eth1和eth2绑定而成的,当前在eth1上为激活状态。
7.拔掉当前上层主用交换机到当前交换网板的网线,观察单板网络是否中断。
在正常情况下,不会发生双机切换,网络不会中断。
8.检查双机资源组和资源的状态。
#hastatus
双机资源不发生任何切换。
9.测试后,再把断开的网线连接好。
步骤3检查浮动IP地址故障时的双机切换。
在当前主机上执行如下命令,检查浮动IP地址切换。
#ifconfigbond0:
0down
在正常情况下,禁用浮动IP地址时会发生双机切换。
切换完成后,请参见检查双机启动,检查双机状态、SMC进程、数据库状态和文件系统状态。
步骤4检查应用故障时的双机切换。
在当前主机上执行kill-9ClusterMng的pid,停止SMC应用进程。
在正常情况下,停止应用进程会发生双机切换。
切换完成后,请参见检查双机启动,检查双机状态、SMC进程、数据库状态和文件系统状态。
步骤5检查数据库故障时的双机切换。
以oracle用户登录当前主机,执行dbshut,停止数据库。
在正常情况下,停止数据库会发生双机切换。
切换完成后,请参见检查双机启动,检查双机状态、SMC进程、数据库状态和文件系统状态。
----结束
1.3检查双机停止
操作步骤
步骤1在主机或者备机上执行如下命令,关闭双机:
#hastop-all
如果停止VCS失败,则可以执行如下命令,强制停止VCS。
#hastop-all-force
但是该命令不会停止双机资源,需要手工停止资源,否则下次启动VCS时会存在问题。
手工停止资源的过程如下:
10.停止数据库。
#su-oracle
dbshut
exit
11.卸载文件系统。
#umount/home/smc/billdata
12.去激活卷组。
#vgchange-an
13.在浮动IP地址存在的服务器上去激活浮动IP地址。
#ifconfigbond0:
0down
步骤2在两个节点上分别执行如下命令,检查双机的状态。
#hastatus-sum
如果显示如下信息,则说明关闭成功。
VCSERRORV-16-1-10600CannotconnecttoVCSengine
VCSWARNINGV-16-1-11046Localsystemnotavailable
步骤3在两个节点上执行如下命令,检查浮动IP地址是否释放。
#ping
如果返回“DestinationHostUnreachable”,则表明浮动IP地址已经释放。
步骤4在两台服务器上检查文件系统是否已经卸载。
#df
如果两个节点上都没有发现“/dev/billvg/lv_bill”与“/home/smc/billdata”的挂载信息,则表明文件系统已经成功卸载。
步骤5在两台服务器上检查LV的状态。
#lvscan
如果所有的LV的状态都是INACTIVE,则表明卷组已经去激活。
步骤6切换到oracle用户下,检查Oracle数据库是否已经关闭。
ps-fuoracle|greporacle
如果显示结果如下,则表明Oracle数据库已经关闭。
UIDPIDPPIDCSTIMETTYTIMECMD
oracle2259310Dec2400:
00:
02/home/oracle/app/oracle/product/11g/db/perl
oracle22660225930Dec2400:
01:
39/home/oracle/app/oracle/product/11g/db/bin/
oracle19265225930Dec2400:
03:
08/home/oracle/app/oracle/product/11g/db/jdk/
oracle165923899014:
58pts/200:
00:
00su-oracle
oracle1659316592014:
58pts/200:
00:
00-bash
oracle1693016593015:
01pts/200:
00:
00ps-fuoracle
步骤7以smc用户登录两块单板,检查SMC各进程的状态。
p
正常情况下,两台单板上都能查看到如下进程。
ProcessListOfShortMessageCenter
----------------------------------------------------
USERPIDPPIDCOMMAND
smc98591clustermng
smc98769859smcapp
smc98849859dbdaemon
smc98709859billcreater
smc98649859backupdaemon
smc99129859filemirror
smc99029859mapserver
smc98939859mtiserver
smc98949859l2cachedaemon
smc98959859fcc
Count10
执行smcdbg,查看检查SMC各进程的状态。
正常情况下,两块单板上Clustermng监控的所有进程的状态应该为Slave状态。
----结束
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- VCS 双机 检验 方法