IBM小型机故障处理指导书10424B.docx
- 文档编号:3260421
- 上传时间:2022-11-21
- 格式:DOCX
- 页数:22
- 大小:165.51KB
IBM小型机故障处理指导书10424B.docx
《IBM小型机故障处理指导书10424B.docx》由会员分享,可在线阅读,更多相关《IBM小型机故障处理指导书10424B.docx(22页珍藏版)》请在冰豆网上搜索。
IBM小型机故障处理指导书10424B
资料编码
产品名称
IBM小型机
使用对象
产品线
产品版本
编写部门
集成产品部
资料版本
V1.0
IBM小型机故障处理指导书
拟制:
日期:
审核:
日期:
审核:
日期:
批准:
日期:
华为技术有限公司
版权所有XX
修订记录
日期
修订版本
描述
作者
2005-3-28
V1.0
整合HACMP故障处理到文档中
李静
2006-4-11
V1.1
1、修改错误的命令示例;
2、调整文档格式。
胡建锋
目录
第1章故障的定义1
第2章故障信息的收集1
2.1收集故障信息对于判断诊断故障原因修复系统非常重要1
2.2系统故障记录(errorlog)1
2.3控制面板上的LED代码3
2.4SMS(SystemManagementService)故障记录4
2.5MAIL4
2.6运行故障诊断程序(Diagnostic)对系统硬件进行检查和诊断4
2.7其他用于收集系统信息的命令4
第3章硬件故障定位方法7
3.1IPL流程7
3.2系统的启动顺序:
7
3.3系统不能启动8
3.4系统停在551555或5578
3.5CDE图形界面挂死9
3.6系统dump10
第4章7133-D40SSA磁盘柜的故障定位12
第5章软件故障定位方法12
5.1文件系统空间不够12
5.2检查文件系统的完整性13
5.3查看卷组信息(lsvg-lvg_name)13
5.4检查内存交换区(pagingspace)使用率(lsps-s)13
5.5小型机内存泄漏问题13
第6章常用的系统状态查询命令15
第7章网络故障定位方法16
7.1网络不通的诊断过程16
7.2网络配置的基本方法16
第8章HACMP环境下的排错17
8.1了解问题的存在17
8.2判断问题的出处17
第9章附常用命令列表19
关键词:
故障处理IBMAIXHACMP
摘要:
缩略语清单:
参考资料清单:
内容简介
《IBM小型机故障处理指导书》主要包括以下内容:
故障的定义、故障信息的收集、硬件故障定位方法、7133-D40SSA磁盘柜的故障定位、软件故障定位方法、常用的系统状态查询命令、网络故障定位方法、HACMP环境下的排错、附常用命令列表。
故障的定义
根据以下这些方面来考虑故障定位:
弄清楚系统发生了什么问题
系统现在能做什么不能做什么
故障什么时候发生的
有没有做平时不同的操作
故障有没有规律定时还是不定时发生的频率有多高
是一台机器出现故障还是多台机器故障故障现象是否相同
最近有没有做改动如安装了新的硬件软件改变了系统的一些设置
故障信息的收集
收集故障信息对于判断诊断故障原因修复系统非常重要
系统故障记录(errorlog)
errdemon
errdemon进程在系统启动时自动运行
记录包括硬件软件及其他操作信息
故障记录文件为/var/adm/ras/errlog可备份下来或拷贝到别的机器上分析
errpt命令的使用(普通用户权限也可使用)
#errpt|more(列出简短出错信息)
ERROR_IDTIMESTAMPTCRESOURCE_NAMEERROR_DESCRIPTION
192AC0710723100300T0errdemonErrorloggingturnedoff
0E017ED10720131000PHmem2Memoryfailure
9DBCFDEE0701000000T0errdemonErrorloggingturnedon
038F25800624131000UHscdisk0UNDETERMINEDERROR
AA8AB2410405130900TOOPERATOROPERATORNOTIFICATION
TIMESTAMP:
MMDDHHMMYY(月日时分年
T类型:
P永久;T临时;U未知永久性的错误应引起重视
C分类:
H硬件;S软件;O用户;U未知
#errpt-dH(列出所有硬件出错信息)
#errpt-dS(列出所有软件出错信息)
#errpt-ajERROR_ID(列出详细出错信息)
#errpt-aj0502f666<---ERROR_ID用大小写均可
例
LABEL:
SCSI_ERR1
ID:
0502F666
Date/Time:
Jun1922:
29:
51
SequenceNumber:
95
MachineID:
123456789012
NodeID:
host1
Class:
H
Type:
PERM
ResourceName:
scsi0
ResourceClass:
adapter
ResourceType:
hscsi
Location:
00-08
VPD:
<---VirtalProductData
DeviceDriverLevel00
DiagnosticLevel00
DisplayableMessageSCSI
ECLevelC25928
FRUNumber30F8834
ManufacturerIBM97F
PartNumber59F4566
SerialNumber00002849
ROSLevelandID24
Read/WriteRegisterPtr0120
Description
ADAPTERERROR
ProbableCauses
ADAPTERHARDWARECABLE
CABLETERMINATORDEVICE
FailureCauses
ADAPTER
CABLELOOSEORDEFECTIVE
RecommendedActions
PERFORMPROBLEMDETERMINATIONPROCEDURES
CHECKCABLEANDITSCONNECTIONS
DetailData
SENSEDATA
000000000000000000000000000000000000000000000000
操作面板上的LED代码
8位代码通常系统故障灯会同时亮起某些机型还会同时显示故障设备位置代
码
4位代码通常是Exxx
3位代码通常为0yyy只看后3位
8位和4位代码可查看系统服务手册(ServiceGuide)
3位代码可查看IBM网站《RS/6000液晶显示屏上显示代码(LED)的含义》(
闪动的888,系统崩溃硬件或软件原因造成按reset键会显示更多内容
888-102一般为软件故障888-102-207例外
系统会产生一个dump
888-102-xxx-0C9系统正在做dump,请等待
888-102-xxx-0C0系统dump完成可关电重启
888-103或105
硬件故障一般有SRN代码及位置代码
SMS(SystemManagementService)故障记录
如何进入SMS菜单
当主控台出现键盘图标后(LED显示E1F1时)按1键
选择"Utilities"
选择"ErrorLog",抄下8位故障代码
在SMS中还可以更改系统启动顺序表
系统会向root用户发mail报告出错信息通常系统出现故障后没有进行检查
修复系统会定时提醒root
运行故障诊断程序(Diagnostic)对系统硬件进行检查和诊断
当发现有硬件故障时应立即使用diag
#diag
>选高级诊断AdvanceDiagnostic)
>选问题诊断ProblemDetermination)或
选系统检查SystemVerification)
(选PD会对系统错误记录进行分析)
diag运行后会给出SRN代码故障设备名称及百分比地址代码等
对于PCI机型应在系统报错7天之内运行diag程序对出错记录里的sense数据进行分析
其他用于收集系统信息的命令
lsdev-C系统设备信息
#lsdev-Ccdisk
hdisk0Available00-06-00-2,045GB16BitSCSIDiskDrive
hdisk1Available00-06-00-1,045GB16BitSCSIDiskDrive
hdisk2Defined00-06-00-4,016BitSCSIDiskDrive
lspv查看物理卷信息
#lspv
hdisk00007821160af3d76rootvg
hdisk1000782117f571294rootvg
hdisk20000000045c45bdedatavg
lsvg查看卷组信息
#lsvgdatavg
VOLUMEGROUP:
datavgVGIDENTIFIER:
0000000055e2458b
VGSTATE:
activePPSIZE:
4megabyte(s)
VGPERMISSION:
read/writeTOTALPPs:
2169(8676megabyt
MAXLVs:
256FREEPPs:
1(4megabytes)
LVs:
3USEDPPs:
2168(8672megabyt
OPENLVs:
2QUORUM:
2
TOTALPVs:
1VGDESCRIPTORS:
2
STALEPVs:
0STALEPPs:
0
ACTIVEPVs:
1AUTOON:
yes
MAXPPsperPV:
2032MAXPVs:
16
#lsvg-lrootvg
rootvg:
LVNAMETYPELPsPPsPVsLVSTATEMOUNTPOINT
hd5boot111closed/syncdN/A
lv00jfs511021closed/stale/ibmcxx
lv01jfs111open/syncd/cics_regions
lv02jfs441open/syncd/var/mqm
lslpp查看文件组信息
#lslpp-L|grep77102e01
devices.pci.77102e01.diag5.2.0.0CF1000Base-TXPCI-XiSCSITOE
devices.pci.77102e01.rte5.2.0.0CFPCI-X1000Base-TXiSCSITOE看某个文件组是否已安装如以太网卡驱动也用于查询补丁程序的版本
lsattr查看设备参数设置
#
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- IBM 小型机 故障 处理 指导书 10424