BBU故障排查指导手册传输故障逐级排查小结.docx
- 文档编号:27175635
- 上传时间:2023-06-27
- 格式:DOCX
- 页数:22
- 大小:291.41KB
BBU故障排查指导手册传输故障逐级排查小结.docx
《BBU故障排查指导手册传输故障逐级排查小结.docx》由会员分享,可在线阅读,更多相关《BBU故障排查指导手册传输故障逐级排查小结.docx(22页珍藏版)》请在冰豆网上搜索。
BBU故障排查指导手册传输故障逐级排查小结
传输故障排查小结
一传输结构图
先介绍一下传输结构图。
RNC传输机房基站侧
图1传输结构图
由图1可知,RNC的传输接口单元是由IMA板和SDTB板组成的。
一个IMA板有30个IMA组,一个IMA组一般对应一个NODEB。
一个IMA组内,最多可以8条E1。
上图一个IMA组有2条E1,分别为0号链路和1号链路。
SDTB板光纤从RNC机房出去后,接到传输机房的光端机(靠近RNC侧,再到NODEB侧的光端机(该光端机在NODEB机房。
NODEB侧的光端机,把光路分成电路的2ME1线,接到端子盒,通过2M线接到NODEB的ETT板,通过内部连线到IIA板。
值得注意的是,在排查传输故障之前首先要确认所配置的E1中是否存在部分环回部分放通的情况存在。
如果IMA组下E1链路有“部分自环,部分对接”,由于自环ICP信元较对接链路的ICP信元先到达IMA芯片,自环链路先加入IMA组,并使IMA组跃迁到工作状态,导致“对接的E1链路”不能加入到IMA组中,从而使基站不能工作。
实际上站排查故障时,也发现工程队的部分做法有些瑕疵。
在排查部分E1线是否通的时候,将一个IMA组的待排查的E1线向NodeB环回,该IMA组中的另一部分E1线放通至RNC。
这样的排查方法可能会引起误解。
比如,NodeB的IMA已经和放通至RNC的IMA组建立。
则环回的E1的状态可能不会显示为正常。
因为NodeB的一个IMA组已经和RNC的IMA组建立,不会再与环回的IMA组建立。
推荐的做法:
1、一个IMA组中的E1线要么放通,要么环回,不应该即有放通的又有环回的。
但可
以部分环回,部分空置(什么也不接。
2、将待查的E1线从原IMA组1解放出来,配置到另一个IMA组2中。
则IMA组1中
的E1线可以放通,IMA组2中的E1线可以环回。
根据以上原因分析,站点部分传输环回问题可通过以下手段进行规避:
1、基站建设期间,站点传输规定提供几条E1,工程施工时对于暂时没有使用的传输资
源不进行环回,以避免后续传输资源放通时,由于站点硬环回导致站点不能建链。
2、传输中心对于分配的传输资源仔细检查核对,尽量避免出现站点部分站点软环回情
况。
3、在以上2点不能确认时,后台网管可对故障站点的所有传输资源进行闭塞,然后每
次解闭塞一条E1,观察传输链路状态,以及站点建链情况。
以此排查哪几条E1出现环回状态。
4、下站处理,将该站点连接的E1从基站放空不进行连接,RNC机房进行观察IMA链
路状态,如果存在部分IMA链路激活状态,通知传输中心检查是否环回,以及坚持站点ODF架上是否部分传输资源进行环回。
二传输告警介绍
现在把传输故障排查总结一下。
Nodeb侧有传输告警如下4类。
1,E1链路电信号丢失(LOS
2,E1链路帧同步丢失(LOF
3,E1链路信元定界丢失(LCD
4,E1链路IMA帧同步丢失(LIF
为更形象理解这4类告警,可分层理解。
IMA层:
LIF告警
ATM层:
LCD告警
E1层:
LOF告警
物理层:
LOS告警
LOS告警(物理层,即打线没打好,该类告警需重新打线。
LOF告警(E1层,即E1帧同步丢失。
所谓E1,即1秒8000帧,1帧32时隙,1时隙8比特,期中0时隙是同步时隙,16时隙是信令时隙,其余时隙是业务时隙。
E1帧同步丢失,即0时隙没有同步。
可能原因是,1,传输机房没配置传输数据;2,还是打线没打好;3,传输接口板件有故障,如IIA,ETT等。
传输是否做数据,可以通过SDH的诊断测试,这个下面有详细介绍。
LCD告警(ATM层,ATM信元(cell定界丢失。
ATM每信元53个字节,其中前5个字节是ATM信元头。
信元定界丢失即无法定位ATM信元头。
这种告警,一般在重新打线,或基站重启,告警会转换为LOF告警。
这类告警出现的概率不大。
LIF告警(IMA层,IMA帧同步丢失。
如果某正常的IMA组内,把其中两条E1线的打线交叉一下,那么这两条E1链路就会有LIF告警。
其实质是IMA组内的逻辑链路号与物理线序号的映射关系改变了,才有此告警。
可以通过重启IMA组,或基站重启等,消除告警,或LIF告警转变为LOF告警。
在RNC侧也有传输告警。
有IMA板上报的近端接收链路LIF告警;近端接收链路LODS告警。
如基站侧的告警解决了,这两类告警自然消除了。
三传输告警的排查方法
处理传输告警有5个法宝:
诊断测试、做环、交叉、替换、复位。
1,诊断测试
北京Nodeb侧传输告警多达2000多条,RNC侧的传输告警多达4000多条。
其绝大多数都是因为传输机房未配置数据。
有没配置数据可以通过诊断测试的SDH的V5开销查询。
进行开销查询,必须先知道某站的传输时隙所在SDTB板的架/框/槽及其时隙号。
再到诊断测试界面,点击对应SDTB板,弹出如下对话框,如图2。
图2诊断测试—SDH开销查询
如图2所示,测试类型:
SDTB插入告警、误码及环回功能测试。
命令类型:
SDTB单板SDH开销配置查询。
线路类型:
支路。
支路即表示光路中的某一条E1,而非光纤整个光路。
参数操作类型:
对端。
线路号码:
规划表所规划时隙减9。
因为该线路号码是从0开始计数的,而规划表的时隙是从8开始计数的,两者相差9。
这里填入12,即规划表的数据为21
SDH配置类型:
获取低阶通道信号标记(V5字节比特5~7。
低阶通道即代表2M通道,对应的高阶通道代表光路,比如SDH的STM-1,即155M光路。
该测试反馈结果有3种。
第一种:
异步信号。
代表传输机房在该时隙已做传输数据。
至于是否做对,还不一定。
第二种:
未装载配置数据。
代表传输机房在该时隙未做传输数据。
那么该时隙肯定是不通的,肯定是有告警的。
NodeB侧有LOF告警,RNC侧有LIF告警。
第三种:
VC-AIS。
代表该时隙有告警。
可能是RNC侧的传输接口单板故障所导致的。
也可能是传输机房的设备有告警。
如果确认RNC侧单板没问题(通过系统内做环判决,能激活说明RNC侧无故障,一般RNC侧单板出故障的概率小,那么就是传输的问题,需让传输机房消告警。
诊断测试也有其命令终端界面的命令模式,SDH的V5开销查询也可用命令方式查询。
批量查询,命令模式更为快捷。
如下是V5开销查询的命令。
TESTSDTB:
TRNCMEID=23,RNCID=23,RACKNO=2,SHELFNO=3,SLOTNO=3,CPUNO=1,CMDTYPE=5,LINETYPE=2,PARATYPE=1,LINENO=57,ALMERRCODE=7,SDHTYPE=90,AUSPENO=1;
TRNCMEID:
RNC子网号。
RNCID:
RNC子网号。
RACKNO:
机架号。
SHELFNO:
框号。
SLOTNO:
槽位号。
CMDTYPE:
5,即SDH开销查询。
LINETYEP:
2,代表支路。
PARATYPE:
1,代表对端。
LINENO:
时隙号。
与规划表的时隙号相差9。
SDHTYPE:
90,即V5开销查询。
其余参数默认。
扩容,把站点割接到新RNC,查询传输机房做了多少数据,就可用命令批量查询,大大提高查询效率。
制作批量命令可用EXCEL的CONCATENATE(函数快速生成。
此方法以后讲解。
通过诊断测试,如果查询结果是传输机房未做数据,那么跟崔传输机房做数据,如果是VC-AIS告警,那么得先消掉此告警,如果是异步信号,那么继续排查。
2,做环
做环要先理解传输结构图,明确在哪一段做环,往那个方向环。
如果做环部分能正常,最好是长时间观察,都无异常,那么做环部分的传输是正常的。
接下去排查未做环部分。
对于传输告警时有时无,需要长时间做环判断做环部分是否正常。
aIMA组做环
RNC传输机房基站侧
图3IMA组做环
如图3所示,红色圈表示在IMA组做环,即在IMA板上的某一个端口做环,是RNC侧系统环回,是内部环回。
做环后,查询该IMA组的E1链路是否都激活。
如果都激活,说明IMA板正常。
否则,IMA故障,需要重启IMA组、或
IMA板,或更换IMA板。
bSDTB板的E1
链路系统侧环回RNC传输机房基站侧
图4SDTB板的E1链路系统侧环回
如图4所示,红色圈表示E1链路系统侧环回。
所谓系统侧环回即向RNC做环,而非向Nodeb做环。
正常情况下,所环回E1链路是激活的,如此可断定RNC侧是好的。
如果不能激活。
那么可能是SDTB板故障了,需再细排查,这里不做介绍。
cSDTB板的E1链路线路侧环回
RNC传输机房基站侧
图5SDTB板的E1线路侧做环
如图5,线路侧环回,环回之后,传输机房可以看到该时隙的光信号。
如果传输机房到基站侧都是通的,那么在LMT上看到的E1状态则会显示正常。
这种环回的好处是,可以不用查圈图,不用给传输机房打电话,基站侧人员可直接判断出传输机房到NODEB的链路是否正常。
d传输机房在靠近RNC侧的光端机向RNC
侧做环
RNC传输机房基站侧
图6传输机房在靠近RNC侧的光端机向RNC侧做环
如图6所示,红圈代表在靠近RNC侧的光端机向RNC做环。
这种做环比较少。
通过这种环,主要是排查传输数据是否做错。
做环后,如果RNC链路无变化,没有变为激活,则可断定传输机房在靠近RNC侧的光端机的数据是错误的。
e传输机房在靠近NODEB侧的光端机向RNC做内环
RNC传输机房基站侧
图7传输机房在靠近NODEB侧的光端机向RNC做内环
如图7所示,传输机房在靠近NODEB侧的光端机向RNC做内环。
排查传输故障,这类做环很多。
它能判定RNC到基站的光端机是否通,如果通,则传输故障在端子盒打线或更末端的传输单元,如果不通,又非RNC单板故障,则问题出在传输机房,由他们处理。
fNODE侧光端机向NODEB
做外环RNC传输机房基站侧
图8NODEB侧光端机向NODEB做外环
如图8所示,NODEB侧光端机向NODEB做外环。
排查传输故障,这类做环很多。
它能判定基站侧是否通。
如果没有通,基站侧需再逐段定位。
g端子盒端口向RNC做内环(硬环
RNC传输机房基站侧
图9端子盒端口向RNC做内环(硬环
如图9,端子盒端口向RNC做内环。
传输排障中,这种做环很多。
它可判断RNC到端子盒端口是否通。
如果通,说明端子盒到RNC链路正常,那么故障在基站侧,需基站侧逐段定位故障,或再重新打线。
h端子盒端口向NODEB
做环RNC传输机房基站侧
图10端子盒端口向NODEB做环
如图10,端子盒端口向NODEB做环。
传输排障中,这种做环很多。
它可判断基站传输接口是否正常。
如果通,说明端子盒到基站的传输正常。
3,交叉判断
基站只通了部分E1,而另一部分E1不通情况较多。
如果做环,必须所有E1都做环,这样导致基站断链,小区退服。
这时交叉判断就能克服断站,又能定位故障点。
RNC传输机房基站侧
图112号链路故障,0、1
号链路正常
RNC传输机房基站侧
图121、2链路E1线交叉
某站0、1号链路正常,2号链路故障。
把1、2号链路的E1线在端子盒到ETT板之间的E1线做交叉。
在后台动态数据管理的IMA链路界面看。
情况有4种。
a只1号链路故障
故障跟着线走,那原2号链路的E1线或者之后ETT板、IIA板故障。
逐一按序更换E1线或ETT板或IIA板。
b只2号链路故障
故障不变。
端子盒或传输机房或RNC侧故障。
如此,此端口向传输机房做环,让传输机房看看该链路是否有信号收到。
建链站点做环是无效的,那是针对我们RNC或NODEB,不针对传输机房。
传输机房是能看到做环的。
如果传输机房能收到光,说明端子盒到传输机房是通的。
排除了从RNC到光端机的故障,那么故障可能端子盒的收发反了。
收发反接试试。
c1、2号链路都故障
参考a、b分析结果。
d1、2号链路都无故障。
说明原来打线没打好,重新打线即可。
4,替换
当定位出故障点,或大致定位出故障点,就可替换新板件、传输线,看故障是否消失。
5,复位
当经过多次尝试、分析,故障现象很奇怪,甚至自相矛盾。
那么最好掉电复位一下NODEB,有可能就好了。
比如,某站有5条E1,其中1路E1故障,经多次打线等尝试后,动态数据管理发现变成3路不通,而基站侧却显示全为正常,甚至把ETT板上的线拔了也,基站侧也显示正常。
掉电复位后,基站侧显示结果就正常了。
之后,再打线告警全消失。
四鸳鸯站
所谓鸳鸯站就是传输机房数据做错,导致后台看到建链站点非实际物理站点。
ETT板IIA板
RNC传输机房基站侧
A站
B站
靠近NODEB侧
光端机端子盒图13传输数据正确
ETT板IIA板
RNC传输机房基站侧
A站
B站
靠近NODEB侧
光端机端子盒图14鸳鸯站错误传输
图13表示有A、B两站,A站对应IMA组1,B站对应IMA组2。
图14显示IMA组1的0号链路故障,传输机房数据又做错,IMA组1的1号链路连到了B站,而IMA组2的链路连到A站。
后台看到的A站,实际上是物理的B站,后台看到的B站,实际是物理的A站,即鸳鸯站。
鸳鸯站完全是传输机房数据做错所致。
检查鸳鸯站的方法有
a与传输机房核对传输,让传输机房向RNC做环,看链路是否有变化。
否则,修改传
输数据。
b上站查看基站的IP地址,看物理站点对应的是后台的哪个站。
c在基站周围测扰码、频点(这种方法查起来麻烦,准确度也不高。
五传输激活但IPOA不通
现在外场经常存在传输激活,但基站不能建链的问题,遇到这类问题后,应先将RNC侧的PVC改成1/100来触发自动建链过程,因为NodeB在IPOA断后200秒会发起IPOA自动建链过程,自动建链的过程中可能会删除已配置的IPOAPVC(1/45,建立自动建链使用的PVC(1/100。
当自动建链流程检测到1/100的PVC无法和RNC建立连接时,会恢复配置的IPOAPVC(1/45。
如果传输网断后再通恰巧赶到了IPOA自动建链流程,则此时IPOA会不通,请耐心等待,约1-3分钟,IPOA会重新通
如果自动建链过程也无法让NodeB与后台建链,则需要进一步排查。
1、确保配置的正确:
RNC侧:
1保证局向配置中的ATM配置中的OMCB配置表项中的对端VPI、对端VCI、NodeBIP
地址正确。
2保证GIPI板的IP地址、架框槽端口号正确。
3保证全局补充参数中配置的OMCB服务器的IP正确。
4保证静态路由表中的指向该NodeB的IP地址、端口号正确。
静态路由表中的架框
槽应与局向配置ATM配置OMCB配置表项中的架框槽一致。
静态路由表中端口号
应为局向配置中ATM配置OMCB配置表项中端口号减9。
NodeB侧:
1保证NodeB管理网元中配置的IP地址正确
2保证AAL5配置中承载IP的AAL5的VPI、VCI与RNC局向配置中ATM配置中OMCB
配置表项中的对端VPI、对端VCI一致。
2、如果以上配置都检查完整并确认配置正确,则需要使用RDS登陆与IPOA不通NodeB相对应的GIPI及APBI单板使用list命令查看所配置的静态路由在前台是否生效。
1通过RDS登陆到GIPI单板上,用list命令查看是否包含指向该NodeBIP地址的路由。
list
Localroutetable:
idxvpnaddr/pfxlennhPortilbolbfwdType
标红部分即为NodeB的静态路由地址。
2通过RDS登陆到对应的ABPI单板上(架框槽为RNC局向配置中ATM配置中OMCB配置表项中的架框槽,用list命令查看是否包含指向该NodeBIP地址的路由。
命令返回内容应与GIPI上的返回内容一致。
注意:
list命令一次不能全部打印,要多打几次至路由表全部列出来。
3、如果以上检查均正常,则需要下站处理。
1通过logview中的“iubInfo”命令查看IMA组的工作状态
[COMMAND:
2009-02-1708:
40:
20]:
iubInfo
==============================================================
IUBIndex0:
TypeisIUB_NOT_ASSIGNED
------------------------------------------------------------------
===============================================================
IUBIndex1:
TypeisIUB_NOT_ASSIGNED
------------------------------------------------------------------
===============================================================IUBIndex2:
TypeisIUB_NOT_ASSIGNED
------------------------------------------------------------------
===============================================================IUBIndex3:
TypeisIUB_E1_IMA_MODE
IUBPHYTagIDNumis0
LinkTypeisRNC
####groupconfigureforgroup3:
#####
clockMd=2(1:
ITC,2:
CTC
symmetryMd=0(0:
SYM,1:
SYM_CFG_ASYM_OP,2:
ASYM
imaVersion=3(1:
IMA1.0,3:
IMA1.1
txM=2(0:
32,1:
64,2:
128,3:
256
maxDelay=1023
#####groupstatusforgroup3:
#####
valid=0x7341(Valid
neGsmState=OPERATIONAL
feGsmState=OPERATIONAL
gtsmState=1(0:
down,1:
up
inhibitStatus=0(Groupisnotinhibited
rxImaId=5
rxM=2
rxTrlLid=17
numTxLinks=2
numTxLinksActv=2
numRxLinks=2
numRxLinksActv=2
maxDiffDelay=0,maxDcbDepth=13
Note:
txTrllinkis2
#####linkstatusforphyLink0:
#####
linkscrambled:
No
valid=Valid
neTxState=ACTIVE
feRxState=ACTIVE
feRxDefect=NO_DEFECT
neRxState=ACTIVE
feTxState=ACTIVE
rxLid=0x10
Link0,rxLcd:
0,rxLif:
0,rxLodsOvr:
0,rxLodsUdr:
0
Link0,OOCD:
0,LCD:
0,FOVRERR:
0,HCSERR:
0
Link0,IFSM=2:
SYNC,IESM=2:
IMA_WORKING
#####linkstatusforphyLink2:
#####
linkscrambled:
No
valid=Valid
neTxState=ACTIVE
feRxState=ACTIVE
feRxDefect=NO_DEFECT
neRxState=ACTIVE
feTxState=ACTIVE
rxLid=0x11
Link2,rxLcd:
0,rxLif:
0,rxLodsOvr:
0,rxLodsUdr:
0
Link2,OOCD:
0,LCD:
0,FOVRERR:
0,HCSERR:
0
Link2,IFSM=2:
SYNC,IESM=2:
IMA_WORKING
------------------------------------------------------------------
Clockderivedfrom0x3(EPLDclkselectbyteis0x00
value=0=0x0
在上面的显示中:
IMA的4个参数必须显示如下,IMA才是正常状态:
neGsmState=OPERATIONAL//近端IMA状态机处于工作状态
feGsmState=OPERATIONAL//远端IMA状态机处于工作状态
gtsmState=1(0:
down,1:
up//IMA业务状态机处于UP状态
inhibitStatus=0(Groupisnotinhibited//IMA组没有被禁止需要说明的是,在IMA组中配置多条E1链路时,只要还有一条E1链路正常工作,即使其他的链路有故障或告警,IMA组状态也应该是OPERATIONAL,不应影响SCCOP信令通道。
但存在问题的E1链路也应根据前述的方法尽快修复,保证NodeB与RNC之间的Iub接口正常畅通。
3LogView登陆到IIP/BIIP板,使用“pvclist”命令查看是否配置了用于承载IPOA的AAL5的PVC或VPI=1,VCI=100的PVC。
如果不存在,说明承载IPOA的PVC已经配置失败,请复位IIP板。
重启后稍等一会再查看,如果还没有,再重启一次。
IIP->pvclist
VC[0]:
PvcId=1,VPI=1,VCI=225,bandwidth=1598kbps
ATM_IMAMphyAddr:
64AAL2CBR
VC[1]:
PvcId=64501,VPI=1,VCI=221,bandwidth=128kbps
ATM_IMAMphyAddr:
64AAL5CBR
VC[2]:
PvcId=64502,VPI=1,VCI=222,bandwidth=128kbps
ATM_IMAMphyAddr:
64AAL5CBR
VC[3]:
PvcId=64503,VPI=1,VCI=223,bandwidth=128kbps
ATM_IMAMphyAddr:
64AAL5CBR
VC[4]:
PvcId=64500,VPI=1,VCI=45,bandwidth=128kbps
ATM_IMAMphyAddr:
64AAL5CBR
----------------pvclist(:
Sum:
5
value=34=0x22='"'
在命令返回中,一定要有PvcId=64500,VPI=1,VCI=45这一项,或者VCI=100
4查看NODEB上配置的IP地址是否生效:
telnet到BCCS板使用“ifShow”命令查看BCCS的ip地址,看其ip地址是否更新成ipoa中设置的目的ip地址,如果没有说明NodeB的bootp包请求没有成功。
[COMMAND:
2000-04-1323:
34:
17]
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- BBU 故障 排查 指导 手册 传输 逐级 小结