常见DP问题中的trouble shooting.docx
- 文档编号:10566063
- 上传时间:2023-02-21
- 格式:DOCX
- 页数:35
- 大小:1.12MB
常见DP问题中的trouble shooting.docx
《常见DP问题中的trouble shooting.docx》由会员分享,可在线阅读,更多相关《常见DP问题中的trouble shooting.docx(35页珍藏版)》请在冰豆网上搜索。
常见DP问题中的troubleshooting
关于DP中的troubleshooting
目录
(一)备份被锁,无法进行
(二)磁带位置与IDB记录不一致
(三)卡带处理
(四)磁带出现fair状态
(五)Tape显示NOHW
(六)Deviceislocked
(七)ESL322efirmwareupdate
(八)Drive超时问题的处理
(九)DP中常用命令
(十)IDBExport&Import
(十一)TableSpace空间不足的相关问题
(十二)MediaPool无法打开
(十三)Driveabort无法继续备份
(一)备份被锁,无法进行
问题现象:
启动备份时产生如下错误:
问题判定:
产生此warning的原因是某个进程退出时没有正常退出而产生一个锁定文件,所以启动备份时不能正常启动。
解决办法:
删除该锁定文件后重新启动备份。
Command:
rm/var/opt/ignite/locked_filename
返回目录
(二)磁带位置与IDB记录不一致
问题现象:
在copy过程中因备份有问题,为了不影响业务重启了DP,重启成功后再重新启动该未完成的COPY任务时,备份中产生如下warning:
问题判定:
磁带的物理位置与IDB中所记录的不一致。
问题解决:
进行barcodescan后重新备份。
返回目录
(三)卡带处理
问题现象:
[Major]From:
BMA@bjdcbk01"HP:
Ultrium1-SCSI_1"Time:
9/27/069:
40:
22AM
[90:
51]/dev/rmt/19mn
Cannotwritetodevice([5]I/Oerror)
[Critical]From:
VBDA@bjmaxics"C:
"Time:
9/27/069:
58:
45AM
ReceivedABORTrequestfromSM=>aborting.
[Critical]From:
VBDA@bjmaxics"C:
"Time:
9/27/069:
58:
45AM
ConnectiontoMediaAgentbroken=>aborting.
[Normal]From:
VBDA@bjmaxics"C:
"Time:
9/27/069:
58:
45AM
ABORTEDDiskAgentforbjmaxics:
/C"C:
".
[Major]From:
BMA@bjdcbk01"HP:
Ultrium1-SCSI_1"Time:
9/27/069:
40:
26AM
[90:
159]ApparentlySCSIUnitAttention.
[Major]From:
BMA@bjdcbk01"HP:
Ultrium1-SCSI_1"Time:
9/27/069:
40:
29AM
[90:
162]Skippingwriteoffilemark.(ApparentlySCSIUnitAttention).
[Major]From:
BMA@bjdcbk01"HP:
Ultrium1-SCSI_1"Time:
9/27/069:
40:
29AM
[90:
162]Skippingwriteoffilemark.(ApparentlySCSIUnitAttention).
[Major]From:
BMA@bjdcbk01"HP:
Ultrium1-SCSI_1"Time:
9/27/069:
40:
30AM
[90:
135]Cannotejectmedium.(Trailingfilemark(s)couldnotbewritten.)
[Major]From:
BMA@bjdcbk01"HP:
Ultrium1-SCSI_1"Time:
9/27/069:
40:
30AM
[90:
64]By:
UMA@bjdcbk01@/dev/rac/c20t0d6
Cannotunloadexchangermedium(Detailsunknown.)
问题判定:
磁带卡在drive里,无法退出。
问题解决:
1.用命令将drive里的磁带强行退出
-到DP里看带子卡在哪个drive(如10-180-lto的SCSI_1)。
-再到那个drive里,看看他的物理路径(SDSIAddress)。
如:
bjdcbk01/dev/rmt/19mn
-然后到secureCRT里进入bjdcbk01,进入那个带库(omni_lto1)。
-statd,看看哪个磁带在那个drive里卡着呢(如s31)
-到bjdcbk01,#mt-f/dev/rmt/19mnoffline把磁带用命令导出
-然后在进入omni_lto1,moved1s31.把磁带放回原来的槽位。
-把磁带verity一下看看有没有损坏。
Ok!
2.如果1步未能成功,可以利用机械手将磁带退出
-找出卡带的drive
-查看机械手的设备文件(ioscan–fun查找/dev/rac/c*t*d*的地址)
-mc–p/dev/rac/c*t*d*-sDRIVE–dSLOT。
返回目录
(四)磁带出现fair状态
问题现象:
磁带显示为黄色,并在后面的状态栏中显示为fair。
问题判定:
磁带的默认使用时间为36个月,或写操作250次以上,超过此期限后,磁带将显示为fair状态,并不能再进行写操作。
问题解决:
清洗带库;
确认磁带是否超出使用期限:
✓Devices&Media->pool名称->properties->Condition->validforandMaximumoverwrites
注:
Validfor和maximumoverwrites这两个条件任意一个已超出就会出现问题现象。
✓Devices&Media->Devices->slots->选择tape->properties->Info->MediumCreatedtime
注:
此时间可以与上步中察看的值相结合来判断磁带是否超出使用期限。
如果超出使用期限,更换磁带;如果未超出使用期限,且备份的数据已过期,可以将磁带重新格式化后继续使用。
注:
如果磁带未超出使用期限,且数据未过期,建议不要格式化磁
带,因为此时的磁带只是不能进行写操作,读操作仍可以正常
进行。
返回目录
(五)Tape显示NOHW
问题现象:
1,备份任务启动后,无法继续进行,报出如下错误信息:
2,同时在相应的client主机上也会报出如下EMS错误:
Apr2511:
26:
44bjdcdbEMS[7593]:
------EMSEventNotification------Value:
"CRITICAL(5)"forResource:
"/adapters/events/TL_adapter/2_0_11_1_0"(Threshold:
>="3")Executethefollowingcommandtoobtaineventdetails:
/opt/resmon/bin/resdata–R497614871–r/adapters/events/TL_adapter
/2_0_11_1_0-n497614849–a
3,通过EMS报错信息的描述,可以判断为主机与备份介质之间的链路存在问题
4,在备份服务器上执行ioscan-fnCtape命令,来查看备份媒体的运行状态
此时为正常状态,所以都显示为CLAIMED;
出现问题时则为NOHW状态。
注:
如果此时只有某个drive出现NOHW状态,则可能为此drive存在问题;
而此次出现问题时,我们发现同时有4个drive出现异常状态,而且这4个drive连在同一个IFCCard上,所以经分析判断问题可能出现在IFCCard上。
问题判定:
1,因同时4个drive显示NOHW状态,而4个drive同时出问题的几率很小,所以可以判断为连接drive的IFCCard出现问题;
2,查看IFCCard的状态,从状态灯上查看,IFCCard上连接交换机的两个FCPort灯都不亮,检查交换机的相应端口,灯亦不亮;
3,登录交换机查看交换机状态,交换机以及相应端口状态正常,可以派出交换机出现问题,同时可判定IFCCard存在问题;
4,通过串口登录IFCCard,发现FCPort0&1状态均为down;进一步查看FCPort的配置,发现discoverymode是manual,而且FCPortSpeed为4G(而交换机端口均为2G)与交换机端口不符;
5,通过以上,可以判定问题出现于IFCCard的FCPort的配置中。
问题解决:
通过串口连接IFC7:
HPStorageWorkse2400-FC4GInterfaceController
5.9.28P09K7ZAD569-60002_PR507082F4
04/29/200801:
58:
33
1)PerformConfiguration
2)SystemUtilities
3)DisplayTraceandAssertionHistory
4)Reboot
5)DownloadaNewRevisionofTheFirmware
6)HpMenu
Command>1(Select1)
ConfigurationMenu
5.9.28P09K7ZAD569-60002_PR507082F4
04/29/200802:
00:
10
1)BaudRateConfiguration
2)EthernetConfiguration
3)FibreChannelConfiguration
4)DeviceMapping
5)TraceandEventSettingsConfiguration
6)Real-TimeClockConfiguration
7)ActiveFabricConfiguration
8)HostStatisticsConfiguration
A)SaveConfiguration
B)RestoreLastSavedConfiguration
C)ResettoFactoryDefaults
X)Returntomainmenu
Command>3(Select3)
FibreChannelConfigurationMenu
5.9.28P09K7ZAD569-60002_PR507082F4
04/29/200802:
00:
40
CurrentFibreChannelConfiguration-FCPort0:
FCLinkStatus:
UP/FABRIC
NodeName:
10:
00:
00:
E0:
02:
03:
BB:
56
PortName:
10:
00:
00:
E0:
02:
23:
BB:
56
PortMode:
N_PortMode
S_ID:
0x013a00
DiscoveryMode:
ManualonRebootEvents
BufferedTapeWrites:
Enabled,QueueDepth=5
CurrentDefaultMap:
'Indexed'
PortSpeed:
4GigaBit
1)ChangeWorldWideNodeNameHigh2)ChangeWorldWideNameLow
3)TogglePortMode4)ChangeALPAValue
5)ToggleDiscoveryMode6)ToggleBufferedTapeWrites
7)ChangeBufferedTapeQueueDepth8)ChangeDefaultMapValue
9)EditFCOverrideSettings
A)TogglePortSpeed
X)Returntopreviousmenu
Command,
FibreChannelConfigurationMenu
5.9.28P09K7ZAD569-60002_PR507082F4
04/29/200802:
00:
40
CurrentFibreChannelConfiguration-FCPort0:
FCLinkStatus:
UP/FABRIC
NodeName:
10:
00:
00:
E0:
02:
03:
BB:
56
PortName:
10:
00:
00:
E0:
02:
23:
BB:
56
PortMode:
N_PortMode
S_ID:
0x013a00
DiscoveryMode:
AutoDiscoveryonRebootEvents
BufferedTapeWrites:
Enabled,QueueDepth=5
CurrentDefaultMap:
'Indexed'
PortSpeed:
4GigaBit
1)ChangeWorldWideNodeNameHigh2)ChangeWorldWideNameLow
3)TogglePortMode4)ChangeALPAValue
5)ToggleDiscoveryMode6)ToggleBufferedTapeWrites
7)ChangeBufferedTapeQueueDepth8)ChangeDefaultMapValue
9)EditFCOverrideSettings
A)TogglePortSpeed
X)Returntopreviousmenu
Command,
FibreChannelConfigurationMenu
5.9.28P09K7ZAD569-60002_PR507082F4
04/29/200802:
01:
04
CurrentFibreChannelConfiguration-FCPort0:
FCLinkStatus:
UP/FABRIC
NodeName:
10:
00:
00:
E0:
02:
03:
BB:
56
PortName:
10:
00:
00:
E0:
02:
43:
BB:
56
PortMode:
N_PortMode
S_ID:
0x013a00
DiscoveryMode:
AutoDiscoveryonRebootEvents
BufferedTapeWrites:
Enabled,QueueDepth=5
CurrentDefaultMap:
'Indexed'
PortSpeed:
2GigaBit
1)ChangeWorldWideNodeNameHigh2)ChangeWorldWideNameLow
3)TogglePortMode4)ChangeALPAValue
5)ToggleDiscoveryMode6)ToggleBufferedTapeWrites
7)ChangeBufferedTapeQueueDepth8)ChangeDefaultMapValue
9)EditFCOverrideSettings
A)TogglePortSpeed
X)Returntopreviousmenu
Command,
ConfigurationMenu
5.9.28P09K7ZAD569-60002_PR507082F4
04/29/200802:
01:
45
1)BaudRateConfiguration
2)EthernetConfiguration
3)FibreChannelConfiguration
4)DeviceMapping
5)TraceandEventSettingsConfiguration
6)Real-TimeClockConfiguration
7)ActiveFabricConfiguration
8)HostStatisticsConfiguration
A)SaveConfiguration
B)RestoreLastSavedConfiguration
C)ResettoFactoryDefaults
X)Returntomainmenu
Command>A(selectA保存设置)
Updateconfig…..
Command>x(selectx返回上一级菜单)
HPStorageWorkse2400-FC4GInterfaceController
5.9.28P09K7ZAD569-60002_PR507082F4
04/29/200802:
01:
52
1)PerformConfiguration
2)SystemUtilities
3)DisplayTraceandAssertionHistory
4)Reboot
5)DownloadaNewRevisionofTheFirmware
6)HpMenu
Command>4(select4重新启动IFC7)
IFCCard重新启动后,再次确认FCPort的配置状态,确认discoverymode和FCSpeed状态修改成功,分别通过几个出现问题的drive启动备份任务,备份正常进行,问题解决。
返回目录
(六)Deviceislocked
问题现象
利用小磁带机备份时,因DP出现问题将DP服务中止,重启DP后
scan磁带时报出以下错误:
问题判定
由于备份过程中停止DP服务,导致进程没有正常结束,所以重新备
时会认为该进程占用设备,报出如上错误。
问题解决
执行ps–ef|grepomni命令,查看是否存在这样的进程占用设备,
kill该进程后重新启动备份任务即可。
返回目录
(七)ESL322efirmwareupdate
问题现象
Ø2008.4.25,由于BackupLibraryESL322e的机械手hang住,导致备份任务无法进行;
Ø根据HP工程师的建议,重新启动带库,机械手问题得到解决,恢复正常;
Ø重新启动带库后,在备份TEDarchlog时备份失败,原因为LTO3的9,10,11,12这4个drive显示为NOHW(4个drive连接在同一个IFCCard上);
Ø经过HP工程师的现场分析与诊断,发现两个FCPort灯均不亮,同时检查交换机端口为正常,可以断定IFCCard存在问题;
Ø通过端口登录IFCCard,发现FCPort0&1状态均为down;进一步检查FCPort的配置,发现
1discoverymode为manual(应为auto);
2FCPortSpeed为4GB(应为2GB);
Ø分别按照正常状态更改discoverymode和FCPortSpeed的状态,FCPort状态恢复正常,通过备份测试,问题解决。
问题判定
针对问题现象中出现的问题,FCPort配置改变是因为带库的非正常启动而致,所以HP认为带库的firmware版本较低,建议将firmware版本升级为最新版本。
升级步骤
ØHP准备最新的firmware文件,并通过ftp上传到带库;
ØSP备份重要系统的archlog,准备停止备份作业;
Ø重要系统的arch备份完成后,停止DP服务;
Ø登录带库,开始升级工作:
Linux2.6.0()(0)
login:
cliadmin
Password:
Lastlogin:
FriFeb1712:
19:
39from192.168.1.100
WelcometotheInterfaceManagerCommandLineInterface.
Type'help'atthepromptforcontext-sensitivehelp.
进入升级提示符
/>download
/download>
升级InterfaceManager的firmware
/download>mgmt
……………………………….
进入升级提示符
/>download
/download>
升级InterfaceManager的firmware
/download>lib
………………………………………….
Ø升级过程中,关注重要系统的archlog增长状况,必要时利用10-180启动备份,以确保系统的正常运行;
Ø升级完成并确认成功后,启动升级时间段内未启动的备份任务,并确保备份成功。
升级结果
Ø升级前的所有固件版本查看
Ø升级后的所有固件版本的查看
返回目录
(八)Drive超时问题的处理
问题现象:
备份任务启动时,因所分配的drive都在运行中,所以会处于等待
状态,并在等待超时后备份任务失败
设置目的:
基于上述现象,可以根据备份环境的需要在DP软件的配置文件中
设置超时等待时间,以保证备份顺利进行
设置方法:
vi/etc/opt/omni/server/options/global文件,修改其中的SmMaIdle和
SmDaIdle两个参数的值,以分钟为单位;需要注
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 常见DP问题中的trouble shooting 常见 DP 问题 中的 trouble