T8000 Training Docs L21OSTA20 V200R0常维护指导书V100509B.docx
- 文档编号:24470498
- 上传时间:2023-05-27
- 格式:DOCX
- 页数:20
- 大小:38.41KB
T8000 Training Docs L21OSTA20 V200R0常维护指导书V100509B.docx
《T8000 Training Docs L21OSTA20 V200R0常维护指导书V100509B.docx》由会员分享,可在线阅读,更多相关《T8000 Training Docs L21OSTA20 V200R0常维护指导书V100509B.docx(20页珍藏版)》请在冰豆网上搜索。
T8000TrainingDocsL21OSTA20V200R0常维护指导书V100509B
资料编码
产品名称
OSTA2.0
使用对象
华为工程师、合作方工程师
产品版本
V200R020
编写部门
集成产品部
资料版本
V1.0
OSTA2.0V200R020日常维护指导书
拟制:
夏志祥
日期:
2007-5-8
审核:
日期:
审核:
日期:
批准:
日期:
华为技术有限公司
版权所有XX
修订记录
日期
修订版本
描述
作者
2007-5-8
V1.0
完成初稿
夏志祥
目录
第1章日常维护目的1
1.1基本原则1
1.2维护工具2
第2章设备运行环境检查3
2.1机房环境3
2.2机架内部环境3
第3章日常维护操作5
3.1维护任务列表5
3.2查询告警位置6
3.3查询单板传感器的健康事件7
3.4查询热插拔状态7
3.5查询单板在位信息8
3.6查询所有在位设备信息8
3.7查询电源等级9
3.8查询CPU工作频率10
3.9测量温度和湿度10
3.10查询单板事件日志11
3.11查询BMC日志13
3.12查询节能配置15
3.13检查线缆16
3.14测量地阻值17
关键词:
维护查询日志V200R020
摘要:
本文主要介绍日常维护的基本原则、安全注意事项、日常维护操作。
缩略语清单:
参考资料清单:
第1章日常维护目的
日常维护为达到以下目的:
●及时发现并消除设备运行过程中可能存在的缺陷或隐患,并采取适当的措施予以恢复和处理,维持设备的健康水平,降低设备的故障率。
●实时掌握设备和网络的运行状况,了解设备和网络的运行趋势,提高维护人员对突发事件的处理效率。
●通过定期维护和保养设备,使设备的健康水平长期处于良好状态,确保系统能够安全、稳定、可靠的运行。
●通过定期检查、备份、测试、清洁等手段,及时发现设备在运行过程中出现的自然老化、功能失效、性能下降等缺陷,并采取适当的措施及时予以处理,以消除隐患,预防事故的发生。
1.1基本原则
日常维护过程中,需遵循以下基本原则:
●设备采用唯一的标识或名称。
建立设备名称表,可避免多个组件使用同一资源的冲突。
●创建问题解决记录日志。
尽可能一次只做一个改动,并在改动之后,记录每次改动的结果,包括所收集的错误信息和其它额外信息。
●使用华为提供的工具、资源、软件,避免潜在问题或其它问题发生。
清楚操作系统和应用软件最近的更新情况,并根据需求更新软件。
●制定可靠的备份计划。
−根据服务器套件的运行情况,定时备份数据。
−如果数据频繁改变则需要随时备份。
−根据信息存储需要,保留备份库。
−定时检测备份以保证数据正确保存。
●现场保留一定数量的备件,以便出现故障时及时更换。
−备件使用后,需及时补充。
−增加设备前,检查潜在的设备冲突。
●保存最新的网络拓扑图,方便解决组网方面的问题。
1.2维护工具
维护BH23套件所需工具如表1-1所示
表1-1维护工具列表
维护项目
所需工具
测量温度、湿度
温湿度检测计
测量电压、电流
万用表
清洁单板
防静电刷、羊毛刷、电吹风、无水酒精、热熔胶、十字螺丝刀
测试地阻
地阻仪
第2章
设备运行环境检查
本章主要给出华为OSTA2.0产品运行环境的日常维护建议,包括机房环境、机柜内部环境等。
2.1机房环境
电信级设备对运行环境的要求比较高,一般是安装在专用机房,配备专用的空调、冗余供电系统等,主要的日常检查维护项目见表2-1
表2-1日常检查维护项
序号
技术指标项
结果
说明
1
长期工作温度
5℃~35℃(41℉~95℉)
2
温度变化率
15℃/h(59℉/h)
3
工作相对湿度
5%RH~85%RH
4
海拔高度
≤3000m
5
电源
两路冗余备份的–48VDC
6
最大功率
4500W
2.2机架内部环境
这部分的检查内容主要包括机柜内电缆布放、业务线缆标签粘贴等,具体检查内容如表2-2
表2-1机架内部环境检查表
序号
检查内容
结果
备注
1
线缆总布放
强电、弱电线应该分别从机柜两边走线,即业务、电源线分离。
特别注意光纤是否有被小角度弯曲或强行拉伸
2
电源线布放
整齐、美观、有序,尽量与机房内其余机柜布线风格保持一致
3
业务线布放
整齐、美观、有序,尽量与机房内其余机柜布线风格保持一致
4
线缆标签标注、粘贴
标签字体清晰,标注明确且含义准确,粘贴牢固
5
剩余空闲槽位处理
空闲槽位必须装有假面板,以保证设备散热效果及视觉美观
6
风扇过滤网
没有过多灰尘堵塞、堆积,以免影响设备正常散热
7
电源线插头检查
检查OSTA2.0及其配套的存储、KVM等设备的电源线是否牢固插入电源插座
8
信号线插头检查
检查OSTA2.0及其配套的存储、交换机等设备之间的信号、数据线连接是否牢固
第3章
日常维护操作
3.1维护任务列表
日常维护任务如表3-1所示。
表3-1日常维护任务表
任务
建议周期
查询告警位置
每日
查询单板传感器的健康事件
每日
查询热插拔状态
每日
查询单板在位信息
每日
查询所有在位设备信息
每日
查询电源等级
每日
查询CPU工作频率
每日
测量温度和湿度
每日
查询单板事件日志
每周
查询BMC日志
每周
查询节能配置
每周
检查线缆
每周
测试地阻值
每月
●更多的日常维护信息,请参见《TecalT8000服务器系统硬件维护指南》。
●本指南以SMMD机箱管理板的命令为例介绍BH23套件的日常维护操作方式,所有命令都在机箱管理板上执行。
●有关以下提及的操作命令的详细介绍,请参见《TecalSMM机箱管理板命令参考》。
3.2查询告警位置
任务说明
查询告警所在的位置,以定位发生故障的设备。
操作指导
使用命令smmget-lsystem-dunhealthylocations查询告警所在的位置。
●unhealthylocations命令可以查出整个机箱所有告警的位置。
●healthevents命令可以查看当前单板下的详细告警信息。
●health命令只是查询当前单板的健康状态。
●该命令用于查询所有设备的告警信息。
●
每个设备存在的不同级别的告警信息都会在终端上显示。
参数说明
无
使用实例
查询机箱所有告警的位置。
root@SMM:
/#smmget-lsystem-dunhealthylocations
Critical:
SMM1blade1blade3blade5blade8
Major:
SMM1
Minor:
blade3
3.3查询单板传感器的健康事件
任务说明
查询单板传感器的健康事件,以判断设备是否发生故障。
操作指导
使用命令smmget–lbladeN-tsensorname-dhealthevents查询当前传感器的健康事件。
参数说明
●sensorname:
传感器名称。
●N:
表示单板所在的槽位号。
使用实例
查询单板温度传感器的健康事件信息。
root@SMM:
/#smmget–lblade1-tpowertemp-dhealthevents
PowerTemphasnoproblem.
3.4查询热插拔状态
任务说明
查询单板的热插拔状态是否正常。
操作指导
使用命令smmget-lbladeN-dhotswapstate查询单板的热插拔状态。
热插拔状态如下:
●M[0]:
FRU未安装
●M[1]:
FRU未激活
●M[2]:
FRU激活请求
●M[3]:
FRU激活进程中
●M[4]:
FRU激活状态
●M[5]:
FRU去激活请求
●M[6]:
FRU去激活进程中
●M[7]:
通讯丢失
参数说明
N:
表示单板所在的槽位号。
使用实例
查询单板当前的热插拔状态。
root@SMM:
/#smmget-lblade1-dhotswapstate
Blade1hotswapstateisM4
3.5查询单板在位信息
任务说明
查询单板的在位信息。
如果显示结果异常,说明单板掉电或不在正确槽位上。
操作指导
使用命令smmget-lbladeN-dpresence查询单板的在位信息。
参数说明
N:
表示单板所在的槽位号。
使用实例
查询1号槽位单板的在位信息。
root@SMM:
/#smmget-lblade1-dpresence
Blade1ispresent
3.6查询所有在位设备信息
任务说明
查询所有在位设备信息,以了解当前设备配置情况。
操作指导
使用命令smmget-lsmm-dlistpresent查询当前所有在位设备信息。
参数说明
无
使用实例
查询所有在位设备信息。
root@SMM:
/#smmget-lsmm-dlistpresent
system
shelf
smm
blade1
blade3
blade5
blade7
blade8
fantray
3.7查询电源等级
任务说明
查询单板的电源等级,以判断单板当前的电源状态是否正常。
操作指导
使用命令smmget-lbladeN-dpresentpowerlevel查询单板当前的电源等级。
presentpowerlevel命令在主用板上可查询除机箱管理板以外的其它设备的电源等级,在备用板上只能查询当前机箱管理板的电源等级。
参数说明
N:
表示单板所在的槽位号。
使用实例
查询单板的电源等级。
root@SMM:
/#smmget-lblade12-dpresentpowerlevel
TheFRUPowerLevelis2Consuming180.00Watts.
3.8查询CPU工作频率
任务说明
查询服务器板上CPU的工作频率,以判断CPU是否正常工作。
操作指导
使用命令smmget-lbladeN-dcpufreq查询服务器板上CPU的工作频率。
该命令只能对支持节能的服务器板进行查询。
执行该命令前,您可以先使用smmget-lbladeN-dapssupport命令查询当前单板是否支持节能。
参数说明
N:
表示单板所在的槽位号。
使用实例
查询3号槽位服务器板CPU的工作频率。
root@SMM:
/#smmget-lblade3-dcpufreq
2.20GHz
3.9测量温度和湿度
任务说明
测量机房温度和湿度,以判断温度和湿度是否在设备的工作范围内。
操作指导
使用温湿度检测计。
参考标准
●长期工作温度:
5℃~40℃(41℉~104℉)
●工作相对湿度:
5%RH~85%RH
3.10查询单板事件日志
任务说明
查询单板事件的日志信息,可对历史数据进行分析,以帮助发现已经发生或潜在的问题。
操作指导
使用命令smmget-lbladeN-dsel查询单板的事情日志信息。
使用该命令查询到的事件日志信息是由单板上报到机箱管理板。
参数说明
N:
表示单板所在的槽位号。
使用实例
列出单板的部分事件日志信息。
root@SMM:
/#smmget-lblade1-dsel
PleaseWait...
Thenumberofsel:
18
Thedetailedcontent:
ThuJan1111:
16:
382007
IPMBLinkState:
IPMB-Aenabled(LocalControlstate,NoFailure),IPMB-Benabled
(LocalControlstate,NoFailure).Ok
ThuJan1111:
16:
382007
-48VPower2:
PowerSupplyFailuredetected.AssertionCritical
ThuJan1111:
16:
382007
I2CStatus:
I2CStatusok.AssertionOk
ThuJan1111:
16:
382007
HandleStatus:
Handlenormal.AssertionOk
ThuJan1111:
16:
382007
HAoddverify:
HardwareAddressisright.AssertionOk
ThuJan1111:
16:
382007
RTMMOSCTRL:
MonitorASIC/ICisok.AssertionOk
ThuJan1111:
16:
382007
-48VPower1:
Presencedetected.AssertionOk
ThuJan1111:
19:
022007
FRUHotSwap:
FRU0transitionedfromDeactivationInProgress(M6)toInactive
(M1)DuetoNormalStateChange.:
AssertionEventOk
ThuJan1111:
19:
062007
FRUHotSwap:
FRU0transitionedfromInactive(M1)toActivationRequest(M2)D
uetoStateChangebecauseofoperatorchangingaHandleSwitch.:
AssertionEven
tOk
ThuJan1111:
19:
082007
FRUHotSwap:
FRU0transitionedfromActivationRequest(M2)toActivationInP
rogress(M3)DuetoChangeCommandedbyShelfManagerwithSetFRUActivation.:
AssertionEventOk
ThuJan1111:
19:
092007
FRUHotSwap:
FRU0transitionedfromActivationInProgress(M3)toActive(M4)
DuetoNormalStateChange.:
AssertionEventOk
ThuJan1111:
19:
162007
-48VPower1:
Presencedetected.AssertionOk
ThuJan1111:
19:
162007
-48VPower2:
PowerSupplyFailuredetected.AssertionCritical
ThuJan1111:
19:
162007
HAoddverify:
HardwareAddressisright.AssertionOk
ThuJan1111:
19:
162007
RTMMOSCTRL:
MonitorASIC/ICisok.AssertionOk
ThuJan1111:
19:
162007
IPMBLinkState:
IPMB-Aenabled(LocalControlstate,NoFailure),IPMB-Benabled
(LocalControlstate,NoFailure).Ok
ThuJan1111:
19:
162007
I2CStatus:
I2CStatusok.AssertionOk
ThuJan1111:
19:
162007
HandleStatus:
Handlenormal.AssertionOk
3.11查询BMC日志
任务说明
查询BMC日志,以检查BMC的当前基本信息和历史信息记录是否正常。
操作指导
使用命令smmget-lbladeN-dbmcsel查询BMC日志。
使用该命令查询到的BMC日志是存放在单板BMC模块上的。
参数说明
N:
表示单板所在的槽位号。
使用实例
查询单板的BMC日志。
root@SMM:
/#smmget-lblade1-dbmcsel
PleaseWait...
Thenumberofsel:
116
Thedetailedcontent:
NetWorkFunction:
0a,Cmd:
47,Data:
0100510000ffff
NetWorkFunction:
2c,Cmd:
0a,Data:
00000100bd8944
NetWorkFunction:
2c,Cmd:
0c,Data:
000000a800c83e
ThuJan411:
23:
472007
FRUHotSwap:
FRU0transitionedfromActive(M4)toDeactivationInProgress(M
6)DuetoChangeCommandedbyShelfManagerwithSetFRUActivation.:
Assertion
EventOk
ThuJan411:
23:
472007
FRUHotSwap:
FRU0transitionedfromDeactivationInProgress(M6)toInactive
(M1)DuetoNormalStateChange.:
AssertionEventOk
NetWorkFunction:
2c,Cmd:
0a,Data:
00000101a48944
NetWorkFunction:
2c,Cmd:
0a,Data:
00000100798944
ThuJan411:
24:
022007
FRUHotSwap:
FRU0transitionedfromInactive(M1)toActivationRequest(M2)D
uetoStateChangebecauseofoperatorchangingaHandleSwitch.:
AssertionEven
tOk
NetWorkFunction:
2c,Cmd:
0c,Data:
00000153f13a36
ThuJan411:
24:
042007
FRUHotSwap:
FRU0transitionedfromActivationRequest(M2)toActivationInP
rogress(M3)DuetoChangeCommandedbyShelfManagerwithSetFRUActivation.:
AssertionEventOk
ThuJan411:
24:
062007
FRUHotSwap:
FRU0transitionedfromActivationInProgress(M3)toActive(M4)
DuetoNormalStateChange.:
AssertionEventOk
NetWorkFunction:
2c,Cmd:
0e,Data:
0000001f81003a
NetWorkFunction:
2c,Cmd:
0e,Data:
000000110100c4
……
NetWorkFunction:
2c,Cmd:
0c,Data:
0000018fda9802
ThuJan1111:
19:
082007
FRUHotSwap:
FRU0transitionedfromActivationRequest(M2)toActivationInP
rogress(M3)DuetoChangeCommandedbyShelfManagerwithSetFRUActivation.:
AssertionEventOk
ThuJan1111:
19:
092007
FRUHotSwap:
FRU0transitionedfromActivationInProgress(M3)toActive(M4)
DuetoNormalStateChange.:
AssertionEventOk
ThuJan1111:
19:
162007
IPMBLinkState:
IPMB-Aenabled(LocalControlstate,NoFailure),IPMB-Benabled
(LocalControlstate,NoFailure).Ok
ThuJan1111:
19:
162007
-48VPower1:
Presencedetected.AssertionOk
ThuJan1111:
19:
162007
-48VPower2:
PowerSupplyFailuredetected.AssertionCritical
ThuJan1111:
19:
162007
HAoddverify:
HardwareAddressisright.AssertionOk
ThuJan1111:
19:
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- T8000 Training Docs L21OSTA20 V200R0常维护指导书V100509B V200R0 维护 指导书 V100509B
链接地址:https://www.bdocx.com/doc/24470498.html