分享

LTE核心网常见故障和投诉案例分析

 asaser 2022-04-17

案例一:临时方案用户预换卡不能使用2、3G业务


【故障现象】

临时方案的用户,在更换USIM卡但未开通4G业务的情况下,在4G网络的覆盖下,用4G手机终端可能无法正常使用2,3G业务。只能在4G手机上设置“2,3G only”,才能恢复正常使用。

【故障分析】

临时方案的用户,在更换USIM卡但未开通4G业务的情况下,当前BOSS系统只是将用户的IMSI鉴权信息通过BOSS指令存储到HSS,并未建立IMSI和MSISDN的关联,即未放号为签约用户的任何2、3G的分组域、电路域和4G业务的签约信息。这种场景下HSS给MME返回DIAMETER_ERROR_USER_UNKNOWN的错误码,MME收到HSS的DIAMETER_ERROR_USER_UNKNOWN码后,给终端返回#8 “EPS services and non-EPS services not allowed”的NAS原因值。终端收到“EPS services and non-EPS services not allowed”的NAS值后,不再尝试重新选网。

【故障解决】

针对这种临时方案的用户,如果只更换USIM卡不签约4G业务,根据测试,MME给终端返回#7 “EPS services not allowed”的NAS值能够使终端较快地重选到2、3G网络。根据协议中定义的映射规则,HSS需要给MME返回DIAMETER_ERROR_UNKNOWN_EPS_SUBSCRIPTION (5420) with Error Diagnostic of NO_GPRS_DATA_SUBSCRIBED的错误原因值,对应到HSS上,需要BOSS在用户进行更换USIM卡时,不管用户签不签约4G业务时,都要向HSS发送放号的BOSS指令,如果用户不签约4G业务,则通过设置4G-APN模板为0来关闭用户的4G功能。

启示:网络侧把问题归类后,通过NAS值反馈给终端,终端针对不同的NAS值会有不同的响应行为,在定位此类问题的时候,需要抓取信令,观察S1-MME接口上附着失败或者TAU失败的原因值。

案例二:国际漫游用户漫入到国内MME下无法使用

【故障现象】

韩国、香港等国际漫游用户在国内某市中兴MME下无法附着使用4G业务,而国内用户在同一地点正常使用4G业务。

【故障分析】

进行信令跟踪,发现国际漫游用户附着时,MME回了PDN connectivity reject,原因值为网络失败:

图片

MME失败观察报TAC的DNS解析失败:

图片

MME上检查对TAC的域名解析缓存,发现只有x-s5-gtp服务,而国际漫游用户需要使用x-s8-gtp服务:

图片

【故障解决】

在DNS上修改TAC域名解析数据,增加对X-S8-GTP的解析结果。增加完毕后,再次检查MME上收到的DNS返回结果,发现支持X-X8-GTP,再次测试,国际漫游用户使用4G业务正常。

图片


案例三:过渡方案4G用户终端有4G信号但附着失败,驻留2,3G

【故障现象】

过渡方案4G用户终端有4G信号,但是附着失败,只能驻留在2、3G网络,更换位置后重新有4G标志,尝试附着仍然失败。

【故障分析】

进行信令跟踪,发现用户在2、3G下无附着4G的请求上来,要求4G用户更换位置,能触发附着请求,查看信令发现拒绝原因值是#15 No Suitable Cells In tracking area,同时在中兴MME上抓包发现HSS返回的鉴权有错误,错误码是DIAMETER_AUTHORIZATION_REJECTED,检查HLR该用户签约数据,发现有2,3G签约,但4G被关闭(OBEPC-1),因此爱立信HSS返回DIAMETER_AUTHORIZATION_REJECTED,根据规范,MME会回复#15:No Suitable Cells In tracking area,导致终端不断重复4G附着,最后因失败该TA被终端记录下来作为不被允许的TA,不再尝试附着,但是更换了位置后,不同的TA下可以重新附着4G网络,但是因为HLR中停止了4G功能,附着4G网络仍然失败。

【故障解决】

查看NAS值规范,针对4G被停机的情况,建议爱立信HSS返回UNKNOWN_EPS_SUBSCRIPTION,这样MME回复#7 EPS not allowed,只影响4G业务,不影响2,3G。

案例四:爱立信MME到中兴MME切换出现4G业务断流

【故障现象】

在测试4G用户从中兴MME覆盖下切换到爱立信MME覆盖范围,发现4G用户切换失败,出现4G业务中断的情况。

【故障分析】

经过在MME侧抓包分析,从爱立信MME覆盖范围移动到中兴MME覆盖范围内,会由原MME发起Forward Relocation Request,并NAS层加密算法选定EEA2。

.... 0010 = Used NAS Cipher: 128-EEA2 (0x02)

但是在其后对中兴MME发起的TAU中,中兴MME发起了到HSS的鉴权请求,并选定

000 .... = Type of ciphering algorithm: EPS encryption algorithm 128-EEA0 (ciphering not used) (0x00)

EEA0作为加密算法,并向基站发起UE CONTEXT MODIFICATION REQEUST,要求基站修改NAS层加密算法,但是被基站拒绝。究其原因,是因为爱立信基站不支持TAU过程中的UE上下文修改。

【故障解决】

通过爱立信MME的加密算法优先级,选定EEA0作为最高优先级,使得切换过程无需修改UE上下文,规避此问题,但是最终需要爱立信基站增强该部分功能。

案例五:某市CSFB呼叫失败原因

【故障现象】

某市5s用户可以上4G进行数据业务,但是进行CSFB呼叫失败。

【故障分析】

经过MME以及MSC的联合调测发现,该用户在联合附着中,PS域附着成功,但CS域附着失败,初步怀疑是TA-LA映射表的MSC指向错误,核查该MSC pool中开了SGS口的MSC正确。最后在SGS口抓取信令,发现原因是MME通过SGS口发向MSC的Location update的过程中,MSC拒绝了,因为MME上配置的mme id和MSC上配置的mme id不一样 ,因此MSC拒绝了CS域的附着请求。

【故障解决】

究其原因,是因为爱立信设备的一个限制,在MME上未能按照mmegi的规划,因此造成这个差别。在MSC上将mme id改为与MME上配置一致后,用户拨测CSFB呼叫正常,短信发送接收正常,问题解决。

案例六:某市公司5s用户开启无法附着到4G

【故障现象】

某市用IPHONE 5S在关闭4G功能的情况下附着在3G网络,正常发起业务,但是打开4G开关,出现20多秒无服务,最后附着在3G,只能通过重启终端附着上4G。

【故障分析】

5s关闭4G网络,PDP激活到GGSN(5s关闭4G网络后,终端不上报4G能力,SGSN的UE能力识别为非4G终端,引导选用到GGSN。当5s开启4G网络,会发起combined TAU到MME,此时返回TAU reject,原因值为CC=17 (network failure);原因是MME上有PGW 选择的校验,发现SGSN回复的SGS CONTEXT RESPONSE消息中携带了GGSN的地址,包含在Private Extension部分。终端收到#17的网络故障原因值后,会重复以上TAU过程5次,都被拒绝,所以就出现了 十几秒后重选回3G网络的现象。只有重启手机,才能正常返回4G。

究其原因,苹果5s的关闭4G功能,不上报终端4G能力,导致网络侧没有正常引导业务到PGW上,导致互操作失败。

【故障解决】

通过关闭SGSN的Private Extension消息体的回复,规避MME的PGW校验,使得TAU流程能在MME继续进行,最后因为创建承载失败而TAU拒绝,此时返回的NAS原因值不再是#17,因此苹果5s可以重新发起一次附着,从而返回4G网络。

案例七:排除用户原因的附着成功率低

【故障现象】

某天某省的排除用户原因的附着成功率从90%以上,下降到60%左右。

【故障分析】

从该指标的算法看,排除用户原因的附着成功率= EPS附着成功次数 / (EPS附着请求次数 -非法用户的EPS附着失败次数 -非法ME的EPS附着失败次数 -EPS服务不允许的EPS附着失败次数 -EPS和非EPS服务不允许的EPS附着失败次数),也就是附着请求次数 - #3 - #6 - #7 - #8的错误请求(减去属于用户原因部分),但是通过厂家网管查看15分钟颗粒度性能指标发现,在某个时刻开始,#15的错误请求次数增加明显,询问发现市场部推行用户开户模板默认关闭4G功能,导致全省大量用户出现4G停机现象, 2、3G正常的情况下,HSS返回DIAMETER_AUTHORIZATION_REJECTED (5003),MME将其映射的NAS原因值为#15:No Suitable Cells In tracking area;从而影响了排除用户原因的附着成功率。

【故障解决】

可知,上述原因是用户停机原因导致,因此对于NAS值#15的返回值,实际上包含部分用户原因的问题在里面,目前的确存在这样的情况。只能通过厂家MME上的NAS值映射功能,把这种HSS错误映射到其他原因值,从而在不影响用户感知的情况下,保证指标的客观准确性。

案例八:无4G信号投诉的解决

目前最常见的投诉是用户反馈4G无信号或不能使用4G业务。

首先确认故障的范围,是个别用户问题、还是号段用户都有问题、还是一大片区域都存着此故障。

个别用户问题的尝试解决办法:

1)可以先在HSS上查询该用户的签约数据是否正常。

2)通过MME/SGW/PGW/HSS信令跟踪来确定具体原因。如果MME上跟踪不到任何S1口信令,一般是由于终端或USIM卡原因造出。如果MME上跟踪到了用户信令,需要查看各接口的信令来确定具体原因,比如有可能是用户鉴权流程中失败、用户使用了非法的APN等。TIPS:信令跟踪时建议通过IMSI来跟踪用户以便跟踪较全的信令。

3)如果不方便进行用户信令跟踪,可在HSS/MME上查看用户信息来进行简单判断。

如果能查到MME信息,说明至少用户曾经在4G网络成功附着过,现在不能使用的原因有待进一步分析,如果没有MME位置信息,说明用户可能从未在4G网络附着过。

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多