EMC Symmetrix 监控方法.docx
- 文档编号:23843067
- 上传时间:2023-05-21
- 格式:DOCX
- 页数:20
- 大小:58.37KB
EMC Symmetrix 监控方法.docx
《EMC Symmetrix 监控方法.docx》由会员分享,可在线阅读,更多相关《EMC Symmetrix 监控方法.docx(20页珍藏版)》请在冰豆网上搜索。
EMCSymmetrix监控方法
EMCSymmetrixDMX日常监控方法
客户操作及代码说明
EMC客户服务支持团队
1/8/2010
本文档仅供EMC客户使用,未经EMC公司授权,不得复制、转载、出版和传播
EMC公司推荐客户使用EMC远程监控及支持系统(包括callhome,Webex、ESRS等多种模式),客户也可以通过本文中提及的方法,实现对EMCSymmetrixDMX系列产品的监控。
一、在主机上建立或更新存储设备信息:
二、
这个操作在监控主机上执行一次后,将会在监控主机上建立存储设备信息的数据库,以后只有在存储设备配置变更后,才需要重新执行,用来更新存储配置信息。
登录到安装有SolutionsEnabler的主机,执行以下命令(需要一至二分钟):
symcfgdiscover
SolutionsEnabler安装目录
UNIX:
/usr/symcli/bin
Windows:
C:
\ProgramFiles\EMC\SYMCLI\bin
二、使用以下命令列出该主机所连接的存储信息:
symcfglist
列出主机所连接的存储,包括local和remote,输出示例如下:
SYMMETRIX
McodeCacheNumPhysNumSymm
SymmIDAttachmentModelVersionSize(MB)DevicesDevices
000290xxxx26LocalDMX457736553601042
000290xxxx82RemoteDMX45773655360353
三、查看存储设备的日志信息:
symevent-sid
收集序列号为SN的盘阵在startdate到enddate之间的日志信息。
例如:
symevent-sid19list-start12/20/2009
此命令为收集序列号尾数为19的盘阵在2009年12月20日以来的日志信息。
如果仅有以下输出:
SymmetrixID:
000290xxxx19
则表明存储系统在此期间没有Event出现。
如果输出示例如下:
SymmetrixID:
000290xxxx19
TimeZone:
GMTStandardTime
EventatTueFeb2408:
20:
182009:
ReportingDirector:
DF-1A
Source:
ServiceProcessor
Category:
Environment
Severity:
Error
NumericCode:
0x006a
EventCodeSymbol:
SYMAPI_SEVT_DAE_PSB_FAULTED
Description:
EnvironmentalError:
PowerSupplyBfaulted
需要关注以下几项:
Detectiontime:
日志时间,为存储设备时间,可能与本地实际时间不同。
ReportingDirector:
事件是从哪个director报出来的
Severity:
事件等级,分为information,warning,error,fatal。
EventCodeSymbol:
事件代码缩写,如上例,可用DAE_PSB_FAULTED在下面的ERRORCODE列表中查找
Description:
事件描述,上例中可知道是连接到director1A的DAE的PowersupplyB故障。
上面事件表明在此期间有DAE_PSB_FAULTED的ErrorCode出现,同一个事件代码可能会同时通过多个部件报出来,可以收集下面第四点所说的收集相关的命令输出,与EMC联系,进行进一步检查。
常见的EventCode可查阅本文附件。
四、发现ErrorCode/EventCode后的处理:
请客户致电EMC服务支持热线8008190009(手机用户可拨打4006700009),提供机器序列号,报告故障现象并提供以下的命令输出配合故障诊断。
(以下命令针对序列号尾数为19的存储)
symevent-sid19list-v-start10/30/2009:
9:
00-end10/30/2009:
17:
00
symcfg-sid19–vlist-env_data
symcfg-sid19–vlist-env_data-service_statefailed
symcfg-sid19–vlist-env_data-service_statedegraded
symdev-sid19–vlist-hotspare
symdisk-sid19-v-spare_info-hotsparelist
EMC公司收到客户的信息及资料后,会立即安排技术支持工程师进行分析处理,随后会安排工程师到客户现场进行进一步处理工作,现场工作可能包括数据采集、错误修复、部件更换等。
本文附件列举了大量的EventCode及其对应的说明,常见的告警及错误都在列表中,如果发现有不在列表中的EventCode,请拨打800或者400热线向EMC技术支持中心了解详细信息。
五、输出存储设备日志到文件
部分客户系统环境中安装有客户自己开发的监控系统或者第三方公司的监控系统,客户如果需要让监控系统读到设备日志,可以利用以下这个命令:
symevent-sidSIDlist-startmm/dd/yyyy:
hh:
mm:
ss-endmm/dd/yyyy:
hh:
mm:
ss-v-warn>symevent_SID_yyyymmdd.log
这里举个例子,例如需要列举设备序列号尾数为1440的存储设备日志,时间范围是2009/12/2422:
00到第二天23:
00
symevent-sid 1440list-start 12/24/2009:
22:
00:
00-end 12/25/2009:
23:
00:
00-v-warn>symevent_1440_20091225.log
那么就得到一个25小时范围的存储设备日志文件,文件名是symevent_1440_20091225.log。
文件名可以由客户在输入命令时自行设定。
附件:
常见ErrorCode/EventCode
HexCode
SeverityAlert
Description
12_VOLTS_ON
Warning
OneoftheSymmetrixsubsystemsisrunningintheabnormal12-Volts
Mode;
某一子部件的12V电源不正常,需要进一步检查,可能同时会有其它代码产生
AC_LINE_INTERRUPTED
Warning
ASymmetrixpowersubsystemAClineinterruptionwasdetected;
机柜输入电源故障或电源模块故障。
ACCESS_TO_NR_DEVICE
Warning
AccesswasattemptedtoaNotReadydevice;
主机尝试访问Notready设备
ALARM_SIGNAL
Warning
Analarmsignalwassetbutnoalarmwasfound;
有警告信号但没发现告警信息,需要手工检查。
ALARM_SIGNAL_POWER
Warning
Analarmsignalwassetindicatingapowersubsystemerror;
电源告警。
ALL_DEVICES_MIGRATED
Informational
AllSymmetrixmigrationdeviceshavecompletedthedatamigration
ALL_RDF_LINKS_DOWN
Warning
NoRDFlinksinanRDFgroupareoperational;
RDF
SRDF链路中断
ALL_RDF_LINKS_NOW_UP
Informational
AllRDFlinksinanRDFgrouparenowoperationalafteran'AllLinks
Down'event;RDF
SRDF链路中断后恢复
BATTERY_FAILED_TEST
Warning
Automaticbatterytestsdetectedfailures;
自动电源测试失败
BUS_PROBLEM
Informational
BusArbiterproblem:
primaryarbiterhasexperiencedaproblem
CANT_QUERY_MII_DIR
Warning
TheServiceProcessorcouldnotqueryadirector;
ServiceProcessor不能联系到director
CANT_READ_ENVIR_SENSOR
Warning
TheServiceProcessorfailedtoreadanenvironmentalsensor;
ServiceProcessor读不到环境传感器信息。
COMM_BOARD_MISMATCH
Error
TheSymmetrixcommunicationboardsoftwaredatahasamismatch;
通信卡信息不一致。
DAE_PSA_M_FAN_FAULT
Error
EnvironmentalError:
PowerSupplyAmultipleFanfault;
电源A多个风扇故障。
DAE_PSA_S_FAN_FAULT
Error
EnvironmentalError:
PowerSupplyAsingleFanfault;
电源A单个风扇故障。
DAE_PSA_FAULTED
Error
EnvironmentalError:
PowerSupplyAfaulted;
电源A故障或者相应的电池故障。
DAE_PSA_SHUTDOWN
Error
EnvironmentalError:
PowerSupplyAshutdown;
电源A故障,电源线松动或相应的电池故障
DAE_PSB_M_FAN_FAULT
Error
EnvironmentalError:
PowerSupplyBmultipleFanfault;
电源B多个风扇故障。
DAE_PSB_S_FAN_FAULT
Error
EnvironmentalError:
PowerSupplyBsingleFanfault;
电源B单个风扇故障。
DAE_PSB_FAULTED
Error
EnvironmentalError:
PowerSupplyBfaulted;
电源B故障相应的电池故障。
DAE_PSB_SHUTDOWN
Error
EnvironmentalError:
PowerSupplyBshutdown;
电源B故障,电源线松动或相应的电池故障
DAE_LCC_A_TEMP_HIGH
Error
EnvironmentalError:
LinkCardControllerAtemperaturehigh;
LCCA温度高
DAE_LCC_B_TEMP_HIGH
Error
EnvironmentalError:
LinkCardControllerBtemperaturehigh;
LCCB温度高
DAE_SPS_INTRN_FAULT
Error
EnvironmentalError:
SupplementalPowerSupplyinternalfault;
电池SPS故障
DAE_SPS_BAT_ENDLINE
Error
EnvironmentalError:
SupplementalPowerSupplybatteryendofline;电池SPS寿命到期,电池需要更换。
DAE_SPS_LOW_VOLTAGE
Error
EnvironmentalError:
SupplementalPowerSupplylowinputAC
Voltage;
电池SPS输入电源电压低
DB_CHECKSUM_TRIGGER
Informational
ADatabaseDoubleChecksumdetectioneventwastriggered
DEVICE_RESYNC_STARTED
Informational
ASymmetrixdeviceresynchronizationprocesshasstarted
DIAG_TRACE_TRIG
Informational
ASymmetrixdiagnosticevent-tracewastriggered
DIAG_TRACE_TRIG_REMOTE
Informational
Adiagnosticevent-tracewastriggeredforaSymmetrix
remotely-attachedviaRDFlinks
DIRECTOR_DEAD
Fatal
ASymmetrixDirectorisnotresponding;
一块director没有响应
DISABLED_MEMORY_BANK
Warning
ASymmetrixDirectorreported'DisabledMemoryBank'toahost;
director发现保留内存区
DISK_ADAPTER_DEAD
Fatal
ASymmetrixDiskDirectorisnotresponding;
一块diskdirector没有响应
ENABLED_ENVIR_TESTING
Informational
AneventwasdetectedtoenableenvironmentaltestingindiagnosisMode
ENVIR_READING_OUT_OF_LIMIT
Warning
TheServiceProcessorfoundenvironmentalreadingstobeoutofLimits;
ServiceProcessor发现环境指标将要超限
EXCESS_TEMP_DETECTED
Warning
TheServiceProcessordetectedexcessivetemperature;
ServiceProcessor发现温度过高告警
FC_OPTICAL_MOD_ERROR
Warning
AFibreChannelopticalmodulehasexperiencedaproblem;
FA端口SFP有问题
GEN_CHECKSUM_TRIGGER
Informational
AGenericDoubleChecksumdetectioneventwastriggered.
HIGH_CHARGE_MISSING
Warning
TheSymmetrixbatterysystemisnotfullycharged;
电池SPS没有充满电
HIGH_TEMP_DETECTED
Warning
TheServiceProcessordetectedhightemperature;
ServiceProcessor发现温度高告警
INVALID_ENVIR_BITS
Warning
Avalidityproblemwasdetectedduringanenvironmentaltest;
环境测试发现问题
LATCHED_ALARMS
Warning
ASymmetrixpowersubsystemdiscoveredlatchedalarms;
电源子系统有非临时告警,需要进一步检查
M1_RESYNC_WITH_M2
Informational
AnM1mirrorofaSymmetrixDeviceisresynchronizingwiththeM2mirror
M2_RESYNC_WITH_M1
Informational
AnM2mirrorofaSymmetrixDeviceisresynchronizingwiththeM1mirror
MEM_DISABLE_INVOKED
Informational
Oneormorememorybanksweredisabledduetocacheerrors
一个或者多个内存块由于错误而被禁止使用
MIRROR_NR
Warning
AdevicehasamirrorthatisNotReady;
设备有一个份MirrorNotready,可能是硬盘故障或是热备盘脱离。
MIRROR_WD
Warning
AdevicehasamirrorthatisWriteDisabled;
设备有一个份Mirrorwritedisable.
NO_COMM_TO_MII_DIR
Warning
TheServiceProcessorcouldnotcommunicatetoadirector;
ServiceProcessor和director通信有问题。
OLD_BOARD_MISMATCH
Error
TheSymmetrixcommunicationboardoldinformationdoesnotmatchcurrentinformation;
通信卡信息不一致
ONE_RDF_LINK_DOWN
Warning
AsingleRDFlinkinanRDFgroupisnotoperational;
RDF链路中有一条中断
ONE_RDF_LINK_NOW_UP
Warning
AsingleRDFlinkinanRDFgroupisnowoperationalaftera'SingleLinkDown'event;
RDF链路中有一条中断后恢复
PHONEHOME_TRIGGER
Informational
AcertaineventtriggeredaCallHomeforservice
POWER_ON_TIME_FAILED_TEST
Error
TheSymmetrixenvironmenttestsfoundinconsistenciesinPower-on-Time;
开机环境测试发现不一致
POWER_ZONE_5_HOURS_BEFORE_SHUDOWN
Error
Powerzone5hoursbeforeshutdown,oneofthepowerzonesisdown.5hoursbeforeVaultshutdown;
输入电源出现故障,单路供电,5小时后机器开始关机
POWER_ZONE_COUNTDOWN_STARTED
Error
Powerzonecountdownstarted.Oneofthepowerzonesisdown,countdown(20hours)forVault-Shutdownisstarted;
输入电源出现故障,单路供电,20小时后机器开始关机
POWER_ZONE_DOWN_FAILED
Error
Powerzonedownfailed;
输入电源故障
POWER_ZONE_ILLEGAL_STATUS
Error
Powerzonedownillegalstatus,foundfilewitholdinformation;
输入电源故障,发现文件包含旧信息
POWER_ZONE_WAIT_TIME_CHANGED_ON_GUI
Error
Powerzonedown-waittimechangedontheGUI;
输入电源单路故障,关机倒计时被更改
RDF_CG_TRIGGER
Informational
AnRDFCGtripeventwastriggered
RDF_ERROR
Error
TheRDFsubsystemhasexperiencedanerror;
发生了RDF错误
RDF_SIM_MESSAGE
Informational
TheRDFsubsysteminitiatedaSIMmessagetoaSymmetrixremotely-attachedviaRDFlinks
RDF2_DEVICE_NR
Informational
OneoftheRDF2deviceswasfoundtobeNotReady
RDFA_CONSISTENT_DEACTIVATE_ISSUED
Warning
SRDF/AsessiontransitionfromAsynchronoustoSynchronousmoderequested;
SRDF/A进程被转成同步模式
RDFA_CONSISTENT_DEACTIVATE_ISSUED_FROM
_HOST
Warning
SRDF/AsessiontransitionfromAsynchronoustoSynchronousmoderequested(hostsoftwareinitiated);
主机发起SRDF/A进程转成同步模式
RDFA_DEACTIVATE_ISSUED
Warning
SRDF/AsessiontransitionoutofAsynchronousmoderequested;
SRDF/A进程被停止
RDFA_DEACTIVATE_ISSUED_FROM_HOST
Warning
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- EMC Symmetrix 监控方法 监控 方法