SUN 3510硬盘故障处理过程Word文档下载推荐.docx
- 文档编号:21023035
- 上传时间:2023-01-27
- 格式:DOCX
- 页数:18
- 大小:24.12KB
SUN 3510硬盘故障处理过程Word文档下载推荐.docx
《SUN 3510硬盘故障处理过程Word文档下载推荐.docx》由会员分享,可在线阅读,更多相关《SUN 3510硬盘故障处理过程Word文档下载推荐.docx(18页珍藏版)》请在冰豆网上搜索。
boxid=4targetfrom64to75
当前系统内SVMRAID组配置情况
root@JT-SJ3-APP1#metastat-sse3510-t
se3510/d209:
SoftPartition
Device:
se3510/d100
State:
Okay
Size:
104857600blocks(50GB)
ExtentStartBlockBlockcount
0943718720104857600
se3510/d100:
Mirror
Submirror0:
se3510/d101
OkayTueSep2905:
31:
312009
Submirror1:
se3510/d102
OkayThuSep1506:
58:
502011
Pass:
1
Readoption:
roundrobin(default)
Writeoption:
parallel(default)
1433391360blocks(683GB)
se3510/d101:
Submirrorofse3510/d100
Hotsparepool:
se3510/hsp001
Stripe0:
(interlace:
32blocks)
DeviceStartDbaseStateRelocHotSpareTime
d24s00NoOkayNoTueSep2905:
d8s00NoOkayNoFriMay2315:
09:
552008
d23s00NoOkayNoSatMar705:
39:
382009
d10s00NoOkayNoFriMay2315:
d11s00NoOkayNoFriMay2315:
se3510/d102:
Hotsparepool:
d12s00NoOkayNoFriMay2315:
592008
d13s00NoOkayNod17s0ThuSep1506:
d14s00NoOkayNoFriMay2315:
d7s00NoOkayNoWedDec2923:
02:
402010
d16s00NoOkayNoFriMay2315:
root@JT-SJ3-APP2#scstat-q
--QuorumSummary--
Quorumvotespossible:
3
Quorumvotesneeded:
2
Quorumvotespresent:
--QuorumVotesbyNode--
NodeNamePresentPossibleStatus
------------------------------
Nodevotes:
JT-SJ3-APP111Online
JT-SJ3-APP211Online
--QuorumVotesbyDevice--
DeviceNamePresentPossibleStatus
--------------------------------
Devicevotes:
/dev/did/rdsk/d6s211Online
当使用dd命令将d6s2数据读出时,1号插槽的盘在闪,当使用ctrl+c中断时,1号盘立即停止闪烁,这表明1号盘对应的应该就是投票盘d6s2
当继续使用dd命令将其余所有did设备都读出时,6号盘继续黄灯无法闪烁,9号盘始终未见闪烁,其余九块硬盘均持续闪烁,这表明6号盘或者9号盘其一应该是坏盘。
但是并不能根据经验就断定6号就一定是坏的那块,因为9号盘虽然是绿灯,但是始终不闪烁,这只能间接表明9号盘也许有问题。
2定位故障故障硬盘位置
使用dd或者format命令让所有可正常工作的硬盘闪烁的办法并不一定每次都能奏效,例如硬盘仅仅因为坏道增多而在SVM中标记为故障,磁盘柜的灯坏了而显示黄色。
当使用上面的方法确定6号和9号盘其一可能是故障盘时,可以用下面的方法辅助判断。
虽说3510JBOD不支持绝大多数sccli命令,但是可以支持一些基本指令例如showloop,可以为判断提供一定的依据
在sccli中执行
sccli>
showloop
15devicesfoundinloopmap
===LoopMap===
AL_PASEL_IDSEL_ID
(hex)(hex)(dec)
---------------
027C124
E8011
E1044
E4022
E2033
E0055
EF000
D9088
D6099
017D125
D40B11
DC066
D50A10
DA077
D30C12
此命令可以显示FC-AL光纤环路上所有的设备,包括ses,在环路上所有的设备都有一个地址,现在要确定地址和磁盘柜上插槽的对应关系。
showses
IdChassisVendor/ProductIDRevPLDWWNNWWPN
----------------------------------------------------------------------------
120A77B7SUNStorEdge3510FD10461000205000C0FF0A77B7215000C0FF0A77B7
Topology:
loop(a)
这说明十六进制0c或者十进制12表示的是同一个部件,即SES,这表明了loopID和设备位置有对应关系
在操作系统中查看FC-AL环路时,ID一列c表示SES设备,与sccli中的编号是一致的
root@JT-SJ3-APP2#luxadm-edump_map/dev/rdsk/c4t500000E0132F5870d0s2
PosAL_PAIDHard_AddrPortWWNNodeWWNType
0dc6dc210000186232261e200000186232261e0x0(Diskdevice)
1d5ad5500000e01a5167c1500000e01a5167c00x0(Diskdevice)
2da7da500000e0132f2931500000e0132f29300x0(Diskdevice)
3d3cd3215000c0ff0a77b7205000c0ff0a77b70xd(SESdevice)
427c0210000e08b9c51fb200000e08b9c51fb0x1f(UnknownType,HostBusAdapter)
5e81e8500000e0132e8d01500000e0132e8d000x0(Diskdevice)
6e14e15000cca004d1ade55000cca004d1ade40x0(Diskdevice)
7e42e4500000e0132f2af1500000e0132f2af00x0(Diskdevice)
8e23e2500000e012ac1f41500000e012ac1f400x0(Diskdevice)
9e05e0500000e0132f2a01500000e0132f2a000x0(Diskdevice)
10ef0ef500000e012acc391500000e012acc3900x0(Diskdevice)
11d98d9500000e0132f28c1500000e0132f28c00x0(Diskdevice)
12d69d6500000e0132f5871500000e0132f58700x0(Diskdevice)
1317d02100001b32026f3d2000001b32026f3d0x1f(UnknownType)
14d4bd4500000e0132f5af1500000e0132f5af00x0(Diskdevice)
在上面的结果中ID为1的NodeWWN一行对应为500000e0132e8d00,该设备类型为磁盘设备,可以发现对应的刚好是磁盘柜Slot1里面的硬盘d6s2
root@JT-SJ3-APP2#scdidadm-Ld6
6JT-SJ3-APP2:
/dev/rdsk/c4t500000E0132E8D00d0/dev/did/rdsk/d6
6JT-SJ3-APP1:
/dev/rdsk/c4t500000E0132E8D00d0/dev/did/rdsk/d6
通过dd读取数据可以知道d6对应slot1,因此slot1的插槽号与loop上ID列为1的磁盘能够对应。
如果找到NodeWWN和did对应为d13的盘,即可通过ID号找到硬盘插槽号。
root@JT-SJ3-APP2#scdidadm-ld13
13JT-SJ3-APP2:
/dev/rdsk/c4t500000E0132F5870d0/dev/did/rdsk/d13
对应环路上ID为9的盘,所以应该找到Slot9,而不是亮黄灯的Slot6
拔出该硬盘,比对在系统里面看到的序列号和盘体上的序列号,发现一一对应,表明通过loopID号硬盘插槽号判断的方法对于3510JBOD环路应该是可行的。
root@JT-SJ3-APP2#iostat-En
c4t500000E0132F5870d0SoftErrors:
0HardErrors:
0TransportErrors:
0
Vendor:
FUJITSUProduct:
MAX3147FCSUN146GRevision:
1103SerialNo:
0642G02GDJ
Size:
146.80GB<
146800115712bytes>
MediaError:
0DeviceNotReady:
0NoDevice:
0Recoverable:
IllegalRequest:
0PredictiveFailureAnalysis:
0
注意:
上面的方法应该适用于FC-AL环境,在非3510JBOD环境中作为判断依据时需要谨慎,在一般环境中还是要结合dd命令的反应或者硬盘大量IO硬盘闪烁的反应来综合判断。
另外不要发现硬盘灯黄了就确定该盘为坏盘,要综合判断才能下结论。
3更换过程
1)SCSIJBOD在SUNCluster环境中更换硬盘步骤建议参考handbook中
Solution1004951.1:
Sun[TM]Cluster3.x:
HowtochangeSCSIJBODdiskwithSolsticeDiskSuite[TM]SDS//SolarisVolumeManager[TM]SVM
2)先保存metaset
和要更换硬盘的信息
root@JT-SJ3-APP1#metastat-sse3510–p>
/metastat_p_se3510
root@JT-SJ3-APP1#prtvtoc/dev/did/rdsk/d13s0>
vtoc_d13s2
root@JT-SJ3-APP2#scdidadm-odiskid–Ld13
500000e0132f5870
此命令输出结果为该磁盘的NodeWWN
3)确定d13不是quorum盘,如果是投票盘,需要先添加新盘为quorum,然后将当前要替换的quorum删除,更换完成后再改回来
Nodevotes:
4)查看故障硬盘信息并将该磁盘offline
root@JT-SJ3-APP2#scdidadm-Ld13
13JT-SJ3-APP1:
3510JBOD只能使用下面的命令将磁盘删除,使用常规的remove_device参数是无效的,注意该命令要在两台机器上执行
root@JT-SJ3-APP1#luxadm-eoffline/dev/rdsk/c4t500000E0132F5870d0s2
root@JT-SJ3-APP2#luxadm-eoffline/dev/rdsk/c4t500000E0132F5870d0s2
将磁盘设备路径文件清除,需要在两台机器执行
root@JT-SJ3-APP1#devfsadm-Cv
root@JT-SJ3-APP2#devfsadm-Cv
devfsadm[21790]:
verbose:
removingfile:
/dev/dsk/c4t500000E0132F5870d0s0
/dev/dsk/c4t500000E0132F5870d0s1
/dev/dsk/c4t500000E0132F5870d0s2
/dev/dsk/c4t500000E0132F5870d0s3
/dev/dsk/c4t500000E0132F5870d0s4
/dev/dsk/c4t500000E0132F5870d0s5
/dev/dsk/c4t500000E0132F5870d0s6
/dev/dsk/c4t500000E0132F5870d0s7
/dev/rdsk/c4t500000E0132F5870d0s0
/dev/rdsk/c4t500000E0132F5870d0s1
/dev/rdsk/c4t500000E0132F5870d0s2
/dev/rdsk/c4t500000E0132F5870d0s3
/dev/rdsk/c4t500000E0132F5870d0s4
/dev/rdsk/c4t500000E0132F5870d0s5
/dev/rdsk/c4t500000E0132F5870d0s6
/dev/rdsk/c4t500000E0132F5870d0s7
5)物理拔出故障硬盘(已在第二章节详细描述),从SUNCluster
中清除did信息
root@JT-SJ3-APP1#scdidadm–C
root@JT-SJ3-APP2#scdidadm–C
确认did信息已清除:
root@JT-SJ3-APP2#scdidadm-L
1JT-SJ3-APP1:
/dev/rdsk/c0t0d0/dev/did/rdsk/d1
2JT-SJ3-APP1:
/dev/rdsk/c1t3d0/dev/did/rdsk/d2
3JT-SJ3-APP1:
/dev/rdsk/c1t2d0/dev/did/rdsk/d3
4JT-SJ3-APP1:
/dev/rdsk/c1t1d0/dev/did/rdsk/d4
5JT-SJ3-APP1:
/dev/rdsk/c1t0d0/dev/did/rdsk/d5
7JT-SJ3-APP1:
/dev/rdsk/c4t200000186232261Ed0/dev/did/rdsk/d7
7JT-SJ3-APP2:
8JT-SJ3-APP2:
/dev/rdsk/c4t500000E012ACC390d0/dev/did/rdsk/d8
8JT-SJ3-APP1:
10JT-SJ3-APP2:
/dev/rdsk/c4t500000E0132F2930d0/dev/did/rdsk/d10
10JT-SJ3-APP1:
11JT-SJ3-APP2:
/dev/rdsk/c4t500000E0132F2AF0d0/dev/did/rdsk/d11
11JT-SJ3-APP1:
12JT-SJ3-APP2:
/dev/rdsk/
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- SUN 3510硬盘故障处理过程 3510 硬盘 故障 处理 过程