CDMA 1X掉话分析指导书.docx
- 文档编号:6047718
- 上传时间:2023-01-03
- 格式:DOCX
- 页数:33
- 大小:163.37KB
CDMA 1X掉话分析指导书.docx
《CDMA 1X掉话分析指导书.docx》由会员分享,可在线阅读,更多相关《CDMA 1X掉话分析指导书.docx(33页珍藏版)》请在冰豆网上搜索。
CDMA1X掉话分析指导书
资料编码
产品名称
CDMA2000
使用对象
内部工程师
产品版本
编写部门
无线网络规划部
资料版本
V2.0
CDMA20001X掉话分析指导书
(仅供内部使用)
拟制:
斯斌和
日期:
2006-12-13
审核:
CDMA无线网规技术支持部
日期:
2007-01-19
审核:
日期:
批准:
日期:
华为技术有限公司
版权所有XX
修订记录
日期
修订版本
描述
作者
2002/01/20
1.00
初稿完成
骆碧群
2007/01/19
2.00
增加了话统指标原因分析;增加了掉话分析思路;详细介绍了每一个可能掉话原因的解决方法;新增了BSC版本问题引起的掉话,删除了由于接入/切换冲突引起的掉话;添加了典型案例。
斯斌和
目录
CDMA20001X掉话分析指导书1
1概述6
1.1掉话率指标计算公式6
1.2掉话机制分析6
1.3掉话话统指标原因分析8
2掉话分析思路10
2.1掉话范围及原因确认11
2.2查看告警信息11
2.3参数检查11
2.4干扰排查12
2.5路测及信令分析13
3常见掉话原因分析及解决思路15
3.1TooManyErasureFrames&NoReverseFrameReceived15
3.1.1覆盖差引起的掉话15
3.1.2由于前向干扰引起的掉话17
3.1.3由于反向干扰引起的掉话20
3.1.4链路不平衡引起的掉话21
3.1.5导频污染引起的掉话22
3.1.6小区负荷引起的掉话24
3.1.7软切换问题引起的掉话26
3.1.8BTS时钟问题引起的掉话27
3.1.9软切换分支Abis链路引起的掉话28
3.1.10业务信道功率不足引起的掉话28
3.1.11呼叫迁移失败引起的掉话29
3.1.12不合理的PN复用引起的掉话30
3.2A2InterfaceAbnormal31
3.2.1硬切换问题引起的掉话31
3.2.2其他33
3.3AbisInterfaceAbnormal33
3.4OtherCause34
3.5BSC版本问题引起的掉话34
3.5.1原因分析34
3.5.2解决措施35
4总结及典型案例35
4.1总结35
4.2典型案例36
4.2.1TooManyErasureFrames&NoReverseFrameReceived36
4.2.2A2InterfaceAbnormal39
4.2.3版本升级引起的掉话41
关键词:
掉话掉话率掉话分析
摘 要:
本文主要讲解了掉话的原因,以及掉话分析的方法思路和掉话的解决途径,并针对无线系统掉话进行了详细的分析,以期对网络掉话问题分析提供一个比较系统的分析思路。
1概述
在CDMA网络运行中,掉话是用户投诉的热点,也是无线网络质量直接反映。
本文主要分析引起掉话的原因,通过对不同原因的分析及定位找出对应的解决问题的方法,降低掉话率,提升网络质量。
1.1掉话率指标计算公式
呼叫建立就是在MS,BTS,BSC,MSC之间建立一条完整的连接,当这条连接上所有环节都保持正常时,则呼叫正常进行;否则发生中断,即异常呼叫释放,导致掉话。
掉话率就是反映呼叫异常释放的一个重要指标,它直接反映了无线网络环境和无线网络质量的好坏。
由于无线环境的不稳定性和无线电波的随机性,无线网络有一定比例的掉话率是很正常的,但是掉话率过高,会严重影响用户的正常业务,招致用投诉。
掉话的两个重要指标是系统掉话率、无线系统掉话率。
在呼叫连接过程中任一环节出错导致的掉话,都统计入系统掉话率;而无线系统掉话率只统计因无线原因导致的掉话。
在BSC话统中,关于掉话的统计项有:
掉话次数(无线链路原因)、掉话次数(Abis接口原因)、掉话次数(A接口原因)、掉话次数(BSC到PCF传输链路原因)、掉话次数(其它)。
系统掉话率为所有上述掉话次数的总和与呼叫建立成功次数之比;而无线系统掉话率,为掉话次数(无线链路原因)与呼叫建立成功次数之比。
公式如下:
联通公式:
无线系统掉话率=[无线系统掉话总次数/呼叫建立成功次数]*100%
系统掉话率=[系统掉话总次数/呼叫建立成功次数]*100%
华为公式:
无线系统掉话率=[掉话次数(无线链路原因)/(呼叫建立成功次数+BS间硬切换切入成功数)]*100%。
考虑到切入BSC硬切换也相当于增加了本BSC呼叫建立次数,分母加上了入BSC硬切换成功次数。
注:
掉话分为CS掉话和PS掉话,本文只分析CS的掉话。
1.2掉话机制分析
在CDMA系统中,前反向链路都有掉话机制控制,在无线链路不好时控制链路释放。
前向掉话机制由移动台控制,在实际中是不可调整的;反向掉话机制是系统控制,一般情况下是可以调节的。
掉话是前反向掉话控制机制交杂在一起共同作用的结果。
前向掉话机制如下:
A、FadeTimer定时器超时。
移动台连续收到超过N2m(12)个坏帧,就会关闭其发射机。
但此时前向仍在接收,如在FadeTimer计时器(连续5秒)内收到连续N3m
(2)个好帧,移动台会重新开启发射机;否则移动台进入初始化态,导致掉话;
B、重传次数达到最大值。
对于要求应答的消息,如果手机连续N1m次发射后仍然没有收到响应消息,手机重新初始化。
(N1m为手机在反向业务信道上发送要求应答消息的最大重发次数,为协议规定值。
对IS95A为3次,IS95B为9次,IS2000为13次。
)
反向掉话机制可能因为设备的不同而呈现较大的差别,本文以华为的CDMA20001x设备为例,系统侧无线接口掉话机制为:
A、反向连续收到300个idle帧,该门限值可以在AirBridge上进行修改,命令为:
MODSDUFPMDC(DCCHCHKIDLEFRMTHD),修改检查IDLE帧计数器。
查询命令为:
LSTFRMINFO。
对应的释放原因值为C04。
按帧号合并也可能带来另一个问题:
一差一好两分支合并时,如果好分支传输时延大,收到的好分支帧号为上个20ms帧的帧号,则会丢弃该好帧,处理差分支上收到的本20ms内的帧。
导致好分支没产生作用,可能出现TooManyErasureFrame的掉话。
因此,基站间的传输时延问题依然需要关注,如当小基站传输使用UNI方式,而宏基站传输使用IMA方式时,这时发生在两者之间的软切换就可能出现分支间传输时延过大的问题。
B、当系统在分支合并后300个反向帧中有270个以上的erasure时,就会导致原因值为C05的掉话。
该门限值可以在AirBridge上进行修改,命令为:
MODSDUFPMDC(DCCHCHKERASFRMTHD),修改检查ERASURE帧比率、检查ERASURE帧门限。
查询命令为:
LSTFRMINFO。
C、markovFER过高。
markovFER是将收到的帧与本地产生的帧相比,如果不同,就算一个坏帧,计算这种坏帧的比例。
没有收到帧时也会统计为坏帧。
缺省值是500个帧(10秒钟)里有95%的坏帧就会上报TCHERR,该值可以在调试台设置(FMR调试命令中的设置马可夫FER)。
对应的释放原因值为C06。
D、某个分支240ms没有收到反向帧。
多分支时,只拆除该分支;单分支时,会产生掉话。
对应的释放原因值为C02。
该值可以在AirBridge上进行修改,命令为MODSDUFPMDC,修改反向帧接收定时器长度,注意单位为毫秒。
查询命令为:
LSTFRMINFO。
如果由于该原因造成软切换增删分支频繁时,可以考虑将反向帧接收定时器长度改得长一些。
目前默认值为240ms,基本可以排除传输闪断造成的影响。
从上面的分析可以看出:
原因值为C02时,对多分之则只拆除该分支,对单分支则出现掉话;原因值为C04、C05、C06(前向或反向信号差导致误帧高、Abis链路故障,如光纤断等造成)时,都会导致掉话。
特别要注意,在前向链路差、反向链路好的情况下,手机判断前向链路不能维持,则关闭发射机。
对BSC,不知道手机何时关发射机,只是不断检查反向帧。
手机关闭发射机,则BSC也收不到反向帧,统计到坏帧数,最后触发原因值C05的TCH_ERR消息,释放呼叫。
因而从掉话控制机制来说,系统不能区分是前向链路还是反向链路原因导致的掉话。
除上述常见的几种掉话原因外还有C01(SDU失败)、C03(某一个分支没收到第一个反向idle帧败)、C07(DSP创建实例失败)、C09(RLPdormant释放)等。
1.3掉话话统指标原因分析
1、掉话次数(Erasure帧多)。
包括IS95和IS2000Erasure帧多引起的掉话次数,是指呼叫建立成功后,FMR对收到的帧进行选择性合并,统计收到idle帧或erasure帧而造成呼叫掉话的次数,对应CBSSSTAR的原因值为C04和C05。
导致Erasure帧多的主要原因有:
Ø基站资源闭塞(出现这种现象一种是人为,一种是设备故障,可结合告警判断问题)。
此时载频没有功率输出,CMF将向CCM报“BlockResource”,CCM释放资源。
Ø由于覆盖和干扰或者其他原因导致误帧率高,FMR向CCM上报TCHERR,当FMR上报TCHERR原因值为C04、C05、C06时,CCM会释放呼叫。
Ø软切换合并门限值设置不合理;
Ø导频污染、BTS时钟故障等。
2、掉话次数(收不到反向帧):
包括IS95和IS2000收不到反向帧引起的掉话次数,是指呼叫建立成功后,FMR在一定时间内(一般为240ms,可以修改)收不到反向帧而造成掉话的次数,对应CBSSSTAR释放原因为C02。
ØAbis链路传输闪断或者中断,导致FMR上收不到数据帧;
Ø前向或反向信号太差;表现为手机收不到前向帧或者收到太多Erasure帧,关闭发射机,此时基站收不到帧,或者基站因为反向链路太差不能收到手机的帧;
Ø由于前反向链路不平衡,造成反向链路质量差,导致反向帧上报不上来;
ØXIE/BIE到FMR的链路不正常,造成丢包;
ØFMR单板运行不正常;
ØBSC到BTS的业务带宽不足。
3、掉话次数(Abis接口原因):
包括IS95和IS2000由于Abis接口原因引起的掉话次数,是指在呼叫建立成功后,BSC统计的Abis原因产生的掉话。
主要原因包括以下两个方面:
Ø设备故障。
包括BTS资源故障、FMR资源故障、RPS资源故障等,基站自己检测到内部处理有问题时主动上报“AbisBTSreleaserequest”,此时造成的掉话会统计到该值上,告警台也会出设备告警信息。
ØAbis链路资源故障。
包括“E1/T1信号丢失告警”、“E1/T1帧失步告警”等Abis接口链路故障现象。
4、掉话次数(A2接口原因):
包括IS95和IS2000手机因A2接口原因导致的掉话,对应的CBSSSTAR的原因值较多,主要跟MSC、A口链路有关。
总的来说,当MSC发起的异常释放、A2接口电路异常发起释放、CIE资源故障、A3A7接口资源故障、TIE资源故障、LIM资源故障造成的掉话,都会统计到A2接口原因掉话中。
遇到此类问题,首先从告警上排除传输链路等问题,然后再看具体释放原因值,进一步需要从设备内部定位。
A2掉话的主要的可能原因包括以下几个方面:
Ø在通话时,MSC设备自身或人为发出A接口复位命令,对应CBSSSTAR原因值0x061E;
ØA接口暂时故障或链路断。
此时FMR在一定时间内收不到MSC来的EVC帧,向CCM发“TRAUERR”,CCM会释放资源。
结合告警如E1/T1告警解决传输上的问题,如果A接口传输无问题,则可能是设备内部问题,包括MSC、BSC;
ØA3/A7接口突然中断;
Ø设备内部处理出错;这时,FMR收不到EVC帧,但A接口没问题。
Ø注:
我司现在网络中,由于统计原因和N侧的异常释放,导致不同信令点间的硬切换、不同BSC下的硬切换及我司与其他厂商之间的硬切换都会产生A2掉话。
Ø5、掉话次数(其他原因):
统计除了上述原因导致掉话外的掉话次数。
包括IS95和IS2000手机,主要是由于系统内部错误或者OAM干预导致的掉话次数。
Ø6、掉话次数(硬切换失败):
统计IS95和IS2000手机因硬切换失败而导致掉话的次数。
值得注意的是,硬切换失败不一定会导致掉话。
2掉话分析思路
进行掉话分析时,先确定掉话的范围;运用Nastar和CBSSSTAR确定掉话的原因值,如果是A口、Abis口引发的掉话,可以结合告警进行分析;否则查看掉话载频的RSSI值,看其是否是因为干扰引起;如果掉话区域没有干扰,则需通过路测手段,检查覆盖情况等,并结合信令分析或者CSL分析,辅助定位问题。
图1掉话分析总体思路
注:
以上仅从系统的角度进行分析,在实际中,也有个别终端质量问题引起掉话现象,因而在接到掉话投诉后,需确认是否为终端原因。
2.1掉话范围及原因确认
在接到掉话投诉后,首先要确定掉话发生的范围及时间,主要关注是否是全网,是否位于BSC交界处,是否为突然掉话等。
如果发现全网普遍存在掉话现象,检查是否做了何种操作(如升级、全网进行网优参数调整等),看这些操作和掉话在时间上有没有关联性,如果两者有时间上的关联性,则很可能是这些操作导致,需对比操作前后,那些参数做了修改,尽可能的将这些修改了的参数改回到先前值;否则,很有可能是BSC设备、A口或者MSC出了问题,建议结合CBSSSTAR、告警信息和话统掉话原因值进行排查。
如果是部分载频存在掉话现象,先确定这些站点是不是新建站点或周围是否增加了新的站点,是否属于同一个传输链,是否对这些载频参数或者天馈做了调整。
如果是参数调整导致的掉话率升高,建议将参数改回,并观测网络指标,是否恢复到修改前的水平;如果是新建站点,检查BTS硬件、邻区配置和一些重要的功率参数等。
如果是部分载频引发的掉话,且通过地理显示主要位于BSC交界处,则有可能是功率同步开关引起的,需检查BSC和BTS的功率同步开关。
注:
BSC版本均为V200R002C04B014(RAC版本为V200R001C04B014)及以后的版本,不会出现这个问题。
且边界的两边都是我司的设备,如果是其他友商的设备,则需考虑是否配置了硬切换、硬切换的相关参数配置情况等。
如果通过上述手段不能定位问题,则需对话统或者Runlog数据分析,确定掉话的原因,如TooManyErasureFrames、NoReverseFramesReceived、AbisInterfaceAbnormal、A2InterfaceAbnormal和OtherCause等。
2.2查看告警信息
如果掉话中有大量的A口或者Abis口引发的掉话,则需查看告警信息。
告警信息能实时反映全网设备运行状态,一般来说,Abis、A2掉话都有相应的告警信息,结合这些告警信息,利用CBSSSTAR工具的分析结果,就可以帮助我们定位出由硬件或传输导致的掉话问题。
注:
通过告警分析,基本上可以排除由于硬件故障和传输中断引起的掉话,排除AbisInterfaceabnormal、A2InterfaceAbnormal和部分Othercause引起的掉话。
2.3参数检查
就现网的统计分析来看,参数设置问题是导致网络掉话率指标异常的重要原因,常见的影响网络掉话率指标的参数有:
1、邻区
检查是否有漏配或错配邻区,邻区优先级是否合理等。
2、切换参数
检查切换相关的参数如T_ADD、T_DROP、T_TDROP、T_COMP、SRCH_WIN_A、SRCH_WIN_N、SRCH_WIN_R、SOFT_SLOPE、NGHBR_MAX_AGE及其他硬切换参数的设置,如果不合理可根据实际情况进行修改。
3、定时器
检查反向帧接收定时器,当该定时器设置过短时(小于150ms),会增加C02掉话概率;检查反向帧合并定时器,当各个分支时延较大时,可以适当修改该值,以减少分支间时延过大导致的掉话。
4、掉话门限
DCCHCHKIDLEFRMTHD(检查DCCH空闲帧门限):
如果CFMR板连续收到超过门限规定的反向IDLE帧,CFMR板就向CCM上报SDU_CCM_TCH_ERROR_IND消息,请求拆除呼叫,单位为帧(帧周期为20ms)。
FCHCHKERASFRMTHD(FCHERASURE帧门限):
CFMR板设定的FCH信道ERASURE帧检查门限,即每隔多少帧统计一次反向ERASURE帧比率,单位为帧(帧周期为20ms)。
FCHCHKIDLEFRMTHD(FCHIDLE帧门限):
如果CFMR板连续收到超过门限规定的反向IDLE帧,那么CFMR板CFMR板就向CCM上报SDU_CCM_TCH_ERROR_IND消息,请求拆除呼叫,单位为帧(帧周期为20ms)。
其他参数及修改方法请参见1.2。
注:
3和4中的命令是对FMR单板操作,请勿随意修改,否则会影响系统的正常运行。
2.4干扰排查
如果掉话没有告警,可查看这些载频的RSSI值及主分集差值,看其是否在合理范围(RSSI值在-95dB到-110dB之间,差值小于6dB)。
如果RSSI异常,可以采取以下方式进行处理:
1、RSSI值小于-110dBm。
这类问题一般是由硬件问题导致的,主要包括:
天馈各接头没有连好、TRX和CDDU故障等,需检查天馈及各个接头的连线,检查这些硬件的运行情况,必要时可以复位或者重新插拔单板。
2、RSSI值过高,主(分)集长时间RSSI在非忙时高于-95dBm或在一定时间内高于-95dBm等;这类问题原因较多,主要有:
天馈驻波、硬件故障、参数设置问题(登记及接入消息设置不合理)、杂散和互调、外部干扰等,需结合话务情况、ACH占用情况及周围其他系统的分布情况进行判断和处理。
3、主分集差值过大,主(分)集两者间RSSI长时间相差10dB以上或出现RSSI主分集对比告警、TRM主(分)集接收告警,主要原因是天线安装问题、硬件故障、分集旁路开关设置错误、外部干扰等。
对以上问题,需结合实际情况进行检查,详细排查过程请参见《反向干扰分析及典型案例汇编》。
2.5路测及信令分析
如果通过以上手段,还是无法定位出问题,则需要通过路测来帮助定位问题。
路测是了解网络质量、发现网络问题较为直接、准确的方法,在掌握无线网络覆盖框架方面,具有话统等其它方法不可替代的特点。
路测时,主要关注掉话区域的覆盖、FER、切换是否正常、是否有导频污染、掉话前的手机发射功率等,综合这些信息,初步定位问题。
图2路测关注点
图2给出了路测中需关注的一些关键点,并根据不同的问题提出了调整意见。
此外,对信令(路测到的消息或者维护台跟踪的信令等)的分析也可帮助我们定位掉话问题,分析流程见下图:
图3信令分析思路
对跟踪到的掉话前后的信令流程进行分析,检查掉话前后移动台驻留的PN是否相同。
如果相同,则可能是覆盖(弱覆盖、覆盖空洞、业务信道功率不足等)或干扰所致;否则就需检查掉话后驻留的扇区PN是否出现在掉话前的PSMM消息中。
如果信令显示,掉话前手机上报的PSMM消息中有当前所驻留的PN,则检查掉话前FER、Rx,Tx等,确定该PN是否在相邻集中,是否为弱覆盖或者快衰落,相关切换参数设置是否合理等。
如果掉话前手机上报的PSMM消息中没有当前所驻留的PN,则可能是没有配置邻区或者相邻集搜索窗设置过小所致,并结合具体情况判定是否为“孤岛效应”。
注:
对原因值为Noreverseframesreceived的,可以将反向帧接收定时器适当改长。
3常见掉话原因分析及解决思路
3.1TooManyErasureFrames&NoReverseFrameReceived
一般来说,在网络正常工作的前提下,TooManyErasureFrames和NoReverseFrameReceived(对应CBSSSTAR的C05和C02),是引起掉话的主要原因,常见的引起这两种原因掉话的主要有以下几个方面:
3.1.1覆盖差引起的掉话
覆盖包括前向覆盖和反向覆盖,这两种覆盖差都可能导致掉话。
但在现网中,由于前向覆盖差导致掉话的问题很多,故本文只分析由于前向覆盖原因导致的掉话。
一般来说,覆盖差引发的掉话原因值为TooManyErasureFrames和NoReverseFrameReceived,对应CBSSSTAR的C05和C02。
3.1.1.1原因分析
1、不连续覆盖(盲区)
主要表现在下列场景下:
由于孤站引起的掉话。
在孤站边缘,信号强度很弱,手机接收到的信号质量差,无法及时切换到其它小区而掉话。
由于基站所覆盖的区域地形复杂(如山区公路)、地势起伏,无线传播环境复杂,信号受阻挡,导致覆盖不连续造成掉话。
其他如信号飘忽、快衰落等也会导致覆盖不连续造成掉话。
2、室内覆盖差
因为一些建筑物密集,信号传输衰耗大,加上建筑物墙体厚,穿透损耗大,室内电平低,使得在通话过程中掉话。
3、越区覆盖(孤岛)
服务小区由于各种原因(如功率过大)造成越区覆盖,以至于移动台超出了它所定义的邻小区B的覆盖范围之外到达了小区C后还占用着原服务小区A的信号,而小区A又未定义邻小区C,此时移动台再根据原服务小区A提供的邻小区B进行切换时,就会因找不到合适的小区而导致掉话,如图所示。
4、其他
如某个小区的硬件设备出了问题,如天线受到阻挡或携带BCCH的载频发生了故障(功放部分),造成小区覆盖变小;或者由于规划不合理,小区负荷过高而相邻基站无法来分担话务,导致覆盖收缩,最终导致掉话。
由于上述原因导致前向覆盖差,前向链路不能被正确解调。
当移动台连续收到12个Erasure帧或者过多的idle帧,将关掉发射机,如果在fadetimer内不能收到连续的两个好帧,移动台将重新进行初始化,手机掉话,且引起的掉话原因值通常为TooManyErasureFrames或者NoReverseFrameReceived。
3.1.1.2处理思路
遇到这类问题,先依据用户投诉,对用户投诉的准确性和范围进行判定;再结合话统分析,重点观察掉话率指标,如果投诉区域站点的掉话率较高,且原因值主要是Toomanyerasureframes和NoReverseFrameReceived等,则需要结合路测进行判断;路测时,注意观察信号电平大小、切换是否正常和是否存在掉话等,来验证是否为覆盖差所致。
如果路测结果:
Ec/Io、接收电平Rx都较差,这表明前向覆盖差。
可能原因有:
该地点距离基站较远,传播路径上有较大障碍(信号经过阴影衰落后质量变得很差),或与天馈系统的设计、安装有关(如:
天线安装位置不当、天线增益不足、倾角设置不当、天线前方有阻挡物)、馈线接头损耗过大、馈线进水损伤造成的驻波比偏高等问题。
具体何种原因,需结合各种分析结果来判定。
3.1.1.3解决措施
1、查找覆盖不足的地方
通过路测试来确认覆盖不足的区域。
对于孤站、山区基站等未形成连续覆盖的地方,如果潜在用户较多,可用增加基站来形成连续覆盖,或是通过别的手段来提高基站的覆盖,如提高基站的最大发射
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- CDMA 1X掉话分析指导书 分析 指导书