配色: 字号:
5G-问题定位指导书-切换专题
2022-09-02 | 阅:  转:  |  分享 
  
5G问题定位指导书-切换篇目录1免责说明62概述63切换原理63.1原理概述63.2切换类型详述83.2.1NR站内变更93.2.2NR站
间变更103.2.3LTE站内切换113.2.4LTE站间切换113.2.5上下行解耦123.3切换相关参数143.3.1切换触发
事件143.3.2门限值应用143.3.3信令切换参数查看164切换相关KPI指标175NSA切换问题数据采集175.1终端侧Lo
g采集185.1.1Probe185.1.2OMT185.2基站侧log采集185.2.1信令跟踪185.2.25GCellDT
跟踪195.2.35G一键式日志205.3核心网log采集226信令分析指导226.1网络侧分析工具226.1.1L3信令226.
1.2Debug日志246.2终端侧分析工具256.2.1OMT256.2.2Probe266.2.3Assistant266.3
关键信令及参数266.3.1NR测量控制277切换问题定位指导307.1切换问题快速排查307.1.1NR-NR邻区配置样例327
.1.2LTE-NR邻区配置样例327.1.3LTE-LTE邻区配置样例327.1.4X2配置样例327.2切换失败问题定位367
.2.1切换问题定位导图367.2.2UU接口信令异常367.2.3X2接口信令异常427.2.4S1接口信令异常437.3流程交
叉场景问题分析447.3.1流程交叉场景识别447.3.2流程交叉场景确认457.3.3流程交叉场景解决方案457.4L2定位分析
指导(随机接入)467.4.1L2的内部交互流程467.4.2常见的跟踪介绍497.5建议的解决措施538切换优化指导548.1R
F优化548.2参数优化549案例559.1LTE站内切换和NR变更流程交叉,内部消息发送错误导致LTE切换失败559.1.1问题
描述559.1.2处理过程569.1.3根因589.1.4解决方案589.1.5建议与总结589.2LTE切换和NR变更流程交叉,
流程卡死导致掉话589.2.1问题描述589.2.2处理过程599.2.3根因619.2.4解决方案619.2.5建议与总结62
免责说明该指导书在提供服务或维护过程中,可能涉及个人数据的使用。概述无线通讯的最大特点在于其移动性控制,对于终端在不同小区间的移动
,网络侧需要实时监测UE并控制在适当时刻命令UE做跨小区的切换,以保持其业务连续性。在切换的过程中,终端与网络侧相互配合完成切换信
令交互,尽快恢复业务,在5G系统中,此切换过程是硬切换,业务在切换过程中是中断的,为了不影响用户业务,切换过程需要保证切换成功率、
切换中断时延、切换吞吐率三个重要指标,其中最重要的是切换成功率,如果切换出现失败,将严重影响用户感受,切换中断时延和切换吞吐率也会
不同程度地影响用户感受。最后对于网络中可能出现的切换问题,本文根据当前积累的5G系统内切换问题定位经验,给出相应的问题隔离定位指导
,以优化相应的网络指标。切换原理Pcell:MeNB的主小区,是NSADC终端驻留的小区。PSCell,SgNB的主小区,是Me
NB通过RRC连接信令配置给NSADC终端在SgNB上的一个主小区,PSCell一旦配置成功即保持激活态。MeNB:主基站,是N
SADC终端驻留小区所属的LTE基站,本版本仅支持将LTE基站设置为MeNB。SgNB:辅基站,是MeNB通过RRC连接信令配置
给NSADC终端的NR基站,本版本仅支持将NR基站设置为SgNB。原理概述切换的过程就是终端在移动过程中与网络连接交互发生变化的
过程,简单的图示如下图:切换前UE跟左边的基站联系切换后UE跟右边的基站联系5G系统当前采用NSA架构,切换过程涉及gNB和eN
B交互,且切换过程涉及LTE小区的切换,和5G小区的变更,示意图如下。由于gNB/eNB并不知道UE所处的位置和无线质量情况,需要
控制UE上报相关的无线质量信息来判断,UE上报无线质量信息的方式有周期上报和事件上报两种方式,当前我司gNB/eNB是采用事件测量
报告的方式来监控UE所处的无线质量变化临界点,当eNB收到测量或切换的事件上报时,会下发切换命令给UE,UE收到切换命令后,中断与
源小区的交互,按切换命令要求切换到新的目标小区,并通过信令交互通知目标小区,以完成整个切换过程。5G基本组网方式分为NSA和SA两
种,基于当前版本(18B),本文仅讨论NSA组网下的NR同频变更问题以及与之相关的LTE切换。NSA组网下UE同时连接LTE基站与
NR基站,NSA的移动性就涉及到LTE的切换和NR变更两部分,其中LTE小区切换是指Pcell切换,NR变更则是Pscell变更。
LTE切换遵循LTE单制式下的流程控制,这里不再赘述:站间切换站内切换NR小区切换根据目标小区与源小区是否同站,分为:站内PSCe
ll变更站间PSCell变更当前版本仅支持NSA组网时EN-DC场景下的NR同频小区间移动性管理。NSA组网时EN-DC场景是指:
主站为LTE基站(eNodeB),辅站为5G基站(gNodeB),NR的所有信令通过eNodeB下发。此时,gNodeB的测量控制
模块产生的测量控制消息通过X2口传递给eNodeB,由eNodeB下发给UE。UE将测量结果上报给eNodeB,eNodeB通过X
2口将测量报告传递给gNodeB进行PSCell变更流程。切换类型详述要完成切换过程,UE与gNB/eNB需要配合,此配合是通过信
令来交互信息的。NSA场景下NR侧的所有RRC消息都通过LTE空口转发。UE在LTE接入并添加NR辅小区后,网络侧会下发NR的测量
控制,当UE测量到满足切换条件的NR小区并满足A3上报条件后,上报NR的MR,通过LTE空口上报,LTE通过X2口转发给SgNB。
测量控制的过程在UE接入过程即会配置A3事件,即使此UE不在切换区或一直不切换。我们关注的切换问题通常处于触发切换(测量报告)后的
过程,所以在进行切换问题定位时通常只关注从触发测量报告开始,即从测量报告消息这条信令开始。NR站内变更UE把测量报告发给源eNB
=-=-=>在UU接口体现为RRCMEASUREMENTREPORT信令源eNB收到测量报告后,进行相关条件判断,如果决定切
换,网络侧将准备的相关切换资源(这个过程对UE侧不可见)eNB将测量报告发给gNB=-=-=>在X2接口体现为RRCTran
sfer信令源gNB收到测量报告后,进行相关条件判断,如果决定切换,网络侧将准备的相关切换资源(这个过程对UE侧不可见)gNB准备
切换相关资源发给eNB,X2口体现为SgNBModificationRequired信令源eNB下发切换命令=-=-=>在U
U接口体现为RRCCONNECTRECONFIG信令,包括NRRRC配置消息(NR切换命令)。UE接收到RRC重配置消息后完
成重配置,并向MeNB反馈RRCConnectionReconfigurationComplete消息,包括NRRRC响应消息
。若UE未能完成包括在RRCConnectionReconfiguration消息中的配置,则启动重配置失败流程。UE成功完成重
配后,MeNB向SgNB发送SgNBModificationConfirm消息UE收到切换命令后,中断与源gNB(小区)的
交互,并尝试接入目标gNB(小区),这个过程称为随机接入过程。NR站间变更UE把测量报告发给源eNB=-=-=>在UU接口体现
为RRCMEASUREMENTREPORT信令eNB将测量报告发给gNB=-=-=>在X2接口体现为RRCTransfe
r信令源eNB收到测量报告后,进行相关条件判断,如果决定切换,网络侧将准备的相关切换资源(这个过程对UE侧不可见)源gNB判断是站
间切换,SgNB收到MR后进行切换目标小区选择、准入和资源准备后如果允许切换,会给LTE发送SgNBChangeRequire
d消息,包含目标SgNBID信息,SCG配置信息(支持增量配置)和目标SN的测量结果。MN通过SgNB添加流程请求目标SN为UE
分配资源,包括与从源SN接收到的目标SN相关的测量结果。如果需要转发,则目标SN向MN提供转发地址。MN触发UE应用新的配置。MN
向UE发送重配置消息RRCConnectionReconfiguration,包含目标SN生成的RRC配置信息。UE跟新配置后向M
N回复消息RRCConnectionReconfigurationComplete,包括对目标SN的RRC响应消息。若UE未能完成
包括在RRCConnectionReconfiguration消息中的配置,则启动重配置失败流程。如果目标SN资源的分配成功,则
MN释放源SN资源。如果需要数据转发,则MN向源SN提供数据转发地址。源SN接收到SgNBChangeConfirm消息后停止
向UE发送数据,并向目标SN开始转发数据。如果UE回复重配置完成,则MN通过SgNBReconfigurationComple
te消息通知目的SNUE重配完成,包括NRRRC响应消息。UE在目的SN随机接入。数据转发开始。数据转发最早可以在SN收到Sg
NBChangeConfirm消息的时候。MN发起承载修改流程。源SN在收到UEContextRelease消息后可以释放
空口资源及控制面相关资源,数据转发不收影响。LTE站内切换NSA场景下的4G小区的切换完全遵循4Gonly的处理,NSA下的4G
小区切换前,下发切换命令前需要先进行SgNBMod流程。LTE站间切换NSA场景下的4G小区的切换完全遵循4Gonly的处理,
可以看到4G小区切换会先删除5G小区,等4G小区切换成功后在通过5G小区添加过程添加小区,因此该场景下的问题,等同于NR小区删除
+NR小区添加过程。LTE切换的问题可以参考LTE的切换X板斧排查,目前遇到的主要问题是空口信号差导致TUE解调失败,无法收到切换
命令或者切换完成发送失败,TUE重建。建议优先进行RF优化。本文不在详述。上下行解耦上下行解耦严格意义上不是切换,只是UL的发送从
TDD<-->SUL的转发过程,本文只简单介绍上下行解耦的过程,上下行解耦的问题请找解耦专题定位。网络侧需要为UE选择NR上行或S
UL作为上行链路,并在RRC重配消息中指示UE要接入的上行链路。UE根据RRC重配消息中指示的上行链路,在对应的上行发起随机接入。
初始过程(B1测量):NR小区RSRP高于门限NRCellSul.RsrpThld,则表示UE处于NR上行覆盖良好区域,网络侧指
示UE在NR上行链路发起随机接入。同时会下发A2测量,A2的RSRP门限通过参数NRCellSul.RsrpThld配置;否则,
在SUL发起随机接入,同时下发A1测量。移动过程(A1、A2测量):1、当UE上行链路在NR上行时,如果NR小区RSRP低于N
RCellSul.RsrpThld-Hyst(迟滞)(A2测量事件),则网络侧指示UE变更至NR辅助上行链路。2、当UE上行链
路在NR辅助上行时,如果NR小区RSRP高于NRCellSul.RsrpThld+Hyst(迟滞)(A1测量事件),则网络侧指
示UE变更至NR上行链路。从信令上判断,如果有CC2配置,那么就是解耦状态,如下解耦是包含CC2的配置。切换相关参数切换触发事件为
了控制切换信令流程的准确和及时,网络侧通过一些参数来控制切换的触发条件,根据我司的切换算法实现,当前版本同频切换采用A3事件来触发
切换,当前我司同频切换算法通过事件A3触发,且事件上报方式采用事件转周期的上报方式。当前最常用的参数有3个:切换门限、延迟触发时间
、小区偏置CIO。当UE收到测量控制消息后,会启动服务小区和邻区的信号质量测量,并对测量值根据“RSRP滤波系数”进行滤波,然后再
进行A3事件判决:当信号质量在NRCellMeasParamGroup.HandoverA3TimeToTrig时间内持续满足如下
表所示的条件时,UE执行相应的动作。触发A3事件后,如果未满足取消A3事件的条件,则该邻区的A3事件会每隔240ms持续上报。类别
需满足的条件执行动作触发A3事件Mn+Ofn+Ocn-Hys>Ms+Ofs+Ocs+Off触发该邻区的A3事件报告。取消A3事件M
n+Ofn+Ocn+Hys变量的值均在测量控制消息中下发公式中变量参数名称参数ID参数说明Ms服务小区测量结果-服务小区的RSRP测量值。Mn邻区测量结果-
邻区的RSRP测量值。Ofs服务小区的频率偏置-当A3事件用于同频邻区测量时,两个参数均为0。Ofn邻区的频率偏置-Ocs服务小区
偏移量-参数固定为0。Ocn小区偏移量NRCellRelation.CellIndividualOffset当该参数不为0时,该参
数在测量控制消息中下发。当该参数为0时,不下发,计算时默认取值为0。Hys同频切换幅度迟滞NRCellMeasParamGrou
p.HandoverA3Hyst针对小区级配置。Off同频A3偏置NRCellMeasParamGroup.IntraFreqA3
Offset针对小区级配置。门限值应用下面以最常用的同频切换为例,说明各个参数的用途:用于事件A3评估判决的为RSRP,事件A3触
发机制原理如下图所示,当事件A3在延迟触发时间TimeToTrig内都满足触发条件,则UE对事件A3进行事件转周期的上报;A3触
发机制图示对于同频切换,服务小区和邻区使用相同的频点,则Ofn和Ofs均为0,服务小区的特定小区偏置CellIndividualO
ffset,一般情况下都为0(MODNRCELLRELATION),所以A3事件的触发条件可以简化为:Mn-Hys>Ms+O
ff即Mn>Ms+Off+Hys其中Off即为MML配置命令中的IntraFreqA3Offset参数(单位0.5d
B),Hys即为MML配置命令中的HandoverA3Hyst(单位0.5dB)按当前配置:NRCELLMEASPARAMGROU
P:NrCellId=12,MeasParamGrpId=0,IntraFreqA3Offset=2,HandoverA3
Hyst=2,HandoverA3TimeToTrig=160;Mn>Ms+Off+Hys=Ms+20.5
+20.5=Ms+2dB即邻区比当前服务小区的RSRP高2dB则满足测量质量条件。延迟触发时间上图中的“Time
ToTrigger”即是延迟触发时间,当满足事件触发条件时,为了防止不必要切换的发生,UE不要立即上报满足事件的小区信息,在延
迟触发时间内持续满足相应的事件触发条件,才将满足该事件的小区测量信息向eNodeB上报。根据当前配置:NRCELLMEASPARA
MGROUP:NrCellId=12,MeasParamGrpId=0,IntraFreqA3Offset=2,Hando
verA3Hyst=2,HandoverA3TimeToTrig=160;即延迟触发时间为160毫秒,表示在160毫秒内一直满足
触发条件才上报A3事件报告。小区偏置CIO小区特定偏置CIO(CellIndividualOffset),每个服务小区和目标小
区可分别独立配置。当信号波动较大,需要对某个特定小区调节切出或切入的容易程度,根据协议中的对A3触发事件的条件:Mn+Ofn+Oc
n-Hys>Ms+Ofs+Ocs+Off根据当前我司的实现,去掉式中固定为0的项,为:Mn+Ocn-Hys>Ms+Off其中O
cn即为小区偏置CIO,CIO在切换中起到移动小区边界的作用。目标小区的CIO越大,切换越容易,反之亦然。事件转周期上报间隔切换事
件上报后转周期上报的周期配置当前版本为240毫秒,不可修改,表示UE在上报A3事件测量报告后,如果满足上报A3事件条件,会每隔24
0毫秒后上报A3事件测量报告,直到收到切换命令或不满足A3事件条件。此参数配置越小,A3测量报告在空口的发送越快,通常情况下并不会
发生L3丢弃A3测量报告的情况,所以此参数对切换的KPI指标影响很小。信令切换参数查看若是TUE测试,切换参数可以从5G的OMT或
Probe上查看。在接入过程和切换命令中的重配消息都会携带。参数名称参数IDA3切换幅度迟滞NRCellMeasParamGrou
p.HandoverA3HystA3切换时间迟滞NRCellMeasParamGroup.HandoverA3TimeToTrig
同频A3偏置NRCellMeasParamGroup.IntraFreqA3Offset小区偏移量NRCellRelation.C
ellIndividualOffset注:当前终端侧测试NSA时,需要开启4G的OMT和5G的OMT,4G的OMT不会解析5G信令
中的信元。切换相关KPI指标当前还没有商用终端,并且一定时期内5G的用户也很少,因此切换的KPI指标相比LTE较少,这里仅做介绍,
不做详细分析。Counter含义时N.NsaDc.InterSgNB.PSCell.Change.AttLTE-NRNSAD
C场景下SgNB站间PSCell变更尝试的次数N.NsaDc.InterSgNB.PSCell.Change.SuccLTE-N
RNSADC场景下SgNB站间PSCell变更成功的次数N.NsaDc.IntraSgNB.PSCell.Change.Att
LTE-NRNSADC场景下SgNB站内PSCell变更尝试的次数N.NsaDc.IntraSgNB.PSCell.Chan
ge.SuccLTE-NRNSADC场景下SgNB站内PSCell变更成功的次数关键的KPI如下:名称计算公式PSCell站间
变更成功率N.NsaDc.InterSgNB.PSCell.Change.Succ/N.NsaDc.InterSgNB.PSCel
l.Change.Attx100%PSCell站内变更成功率N.NsaDc.IntraSgNB.PSCell.Change.S
ucc/N.NsaDc.IntraSgNB.PSCell.Change.Attx100%NSA切换问题数据采集考虑到初期NSA
用户较少,这里主要讨论路测用户的切换问题分析所需要的数据采集方法。切换问题需要LOG如下:网元日志类型备注TUE/CPEProbe
:.gen文件OMT:4G&5G录屏文件,5GL2TTI;5GL2TTI定位5G空口随机接入不了问题才需要eNodeB虚用
户跟踪(优先);UU/S1/X2跟踪(备选);主控板/基带板一键式日志。虚用户跟踪需要核心网配合gNodeBX2跟踪;L2CEL
LDT:1/602/455/323/403;主控板/基带板一键式日志。L2CELLDT5GL2TTI定位5G空口随机接入
不了问题才需要核心网核心网日志当隔离到核心网问题时需要核心网配合。终端侧Log采集终端侧log采集主要是Probe和OMT。Pro
be一般情况下可以使用Probe同时采集LTE和NR的log,直接生成一个gen格式log。优点是使用方便,可以匹配Assista
nt进行批量解析。缺点是当前无法采集TTI级的数据。使用方法参考工具使用帮助。例如下面就是一次跟踪的LOG,Probe只需要记录一
个文件。OMTOMT配套TUE使用,可以采集TTI级数据,缺点是操作复杂,LTE和NR需要分别记录,生成两份log,并且只能使用O
MT软件回放,效率低。使用方法参考工具使用帮助。5.1.1上面的图中可以看到OMT需要记录两个文件。基站侧log采集信令跟踪LTE
基站侧信令跟踪包括标口(UU/S1/X2)跟踪和LTE虚用户跟踪,LTE虚用户跟踪可以进行全网跟踪,因此适用于移动测试。5G基站侧
信令跟踪只有X2。5G的跟踪界面如下,5G小区的跟踪界面:登陆WebLMT,选择NR业务,X2口跟踪;5GCellDT跟踪由于
切换涉及到随机接入过程,因此如果是网络侧下发切换命令后出现异常,可能需要进行TTI跟踪分析是否存在接入问题,具体可以参考接入指导书
。5G需要跟踪的CELLDT如下:L2CELLDT:1/602/455/323/403;在U2000菜单选择“U2000->
Monitor->SignalingTrace->SignalingTraceManagement”在U2000的跟踪导航树
中,选择NR->InformationCollection->CellDTTrace,在下面输入跟踪项:跟踪完成后,单击右键
“Stop”手动停止跟踪任务,若任务状态Status字段为“Finished”,点击“Export”将跟踪结果保存到计算机,文件
格式为tmf格式。5G一键式日志当定位到内部流程异常时,就需要分析Debug日志,分析是否存在有些异常打点。单板一键式日志分为主控
板一键式日志、基带板一键式日志、RRU一键式日志,需要使用MML命令分别获取不同单板日志U2000采集进入日志采集界面:在U200
0的菜单选择Software->SoftwareBrowser进入,选择NE页签,找到需要采集日志的基站。在右侧选择Othe
r页签,然后在日志类型中选择“BRDLOG”.日志导出在日志类型项上右键,选择“Transfer->FromNEtoOSS
Client”,进入日志导出界面。在左侧网元导航树区域选择需要导出的基站在右上方SelectFiles区域选择ALL在右下方设
置相关参数:SourceFileType选择“BRDLOG(ComposiveLog)”。如需要导出其他类型的文件,则选择
对应的文件类型。根据实际采集主控一键式、基带一键式、RRU一键式的需要,填写柜框槽号。设置采集日志的存储名称及压缩模式等信息点击“
OK”开始进行日志采集WebLMT采集如果计算机能够通过ETH端口或GE口直接与基站通信,可以登陆WebLMT进行采集。启动FTP
Server使用WebLMT采集一健式日志时,基站通过FTP协议直接将日志上传到计算机,所以需要首先确定FTP状态可用。上传执行
执行MML命令ULDFILE上传一健式日志:FunctionType:GNODEBSourceFileType:BRDLO
G-GNODEB(GNODEBCompositiveLog)根据单板实际情况填写柜框槽号,可以通过MMLDSPBRD查询。
DestinationFileName:文件保存名称设置FTP服务器的IP、用户名和密码信息,需与FTPServer中设置的
一致。CompressionFlag:设置是否将源文件压缩后上传。非压缩方式文件上传会耗用较长时间,压缩方式文件上传会使CPU占
有率有较大提升(10%~50%),CPU过载会影响用户接入。建议采用非压缩方式上传,并选择进行流控。查看结果在FTPServer
设置的路径下找到日志文件,使用压缩格式上传的文件后缀名为.gz,为保证压缩文件格式正确完整,建议点击文件看是否能正常解压。核心网l
og采集当定位到基站与核心网交互异常时,需要核心网同时进行跟踪。具体操作联系核心网支持。信令分析指导切换问题分析主要是针对L3信令
进行分析,主要是分析按照协议流程分析是否存在异常。另外,如果由于内部异常处理导致问题而无法通过标口信令确认时,还需要分析内部Deb
ug日志。5G的信令及日志分析工具都是在LTE原有工具的基础上的演进,使用方法都是类似的,因此这里重点描述与4G的不同之处以及需要
注意的地方,不再详细描述使用方法。网络侧分析工具网络侧分析工具汇总如下:工具解析日志5G离线FMA虚用户跟踪标口信令跟踪(UU
/S1/X2)Debug日志业务回顾工具虚用户跟踪标口信令跟踪(UU/S1/X2)L3信令NSA场景下NR的所有控制面消息都通过L
TE转发,所以L3信令分析与LTE的信令分析工具相同,唯一的要求是能解析转发的NR消息。目前可用的L3信令分析工具:5G离线FM
A工具获取地址:http://3ms.huawei.com/hi/group/3402967/threads.htmlhttp:/
/3ms.huawei.com/hi/group/3402967/threads.html#category=1506611注意:
请使用最新版本,否则某些NR消息无法解析。虚用户跟踪解析:标口跟踪解析:业务回顾工具业务回顾工具可以在support网站对应的网元
版本目录下获取。注意:请使用最新版本,否则某些NR消息无法正常解析消息类型,而是现实一些数字代码,只有逐条打开后才能看到具体内容。
虚用户跟踪解析:标口跟踪解析:Debug日志Debug日志主要分析内部运行的异常打点,依赖于异常时刻的打点及日志字典,可以使用最新
版5GFMA打开一键式日志中的dbglog.DBG文件。终端侧分析工具终端侧分析工具汇总如下:工具解析日志OMTTUE的trf
log,分为4G和5G版本Probegenlog。每次只能回放一个logAssistantgenlog。可以同时查看多个log
OMTTUE的OMT分为LTE和5G两个独立版本,log单独记录,L3信令分析需要使用5G的OMT打开5G的log,不可以混用。5
GOMT信令如下:ProbeProbeV5R1版本开始支持5GTUE测试,版本正式发布后可以从Support网站获取,当前可
以联系PA接口人获取和申请license(log回放不需要license)。Probe除支持信令显示外,还支持事件分析,可以将直接
分析切换、A3等关键事件。界面如下:AssistantAssistant从V5R1版本开始支持5GProbelog。版本正式发
布后可以从Support网站获取,当前可以联系PA接口人获取和申请license。Assistant也可以同时分析信令和估关键事件
,并且同时可以分析多个Log合并分析。界面如下:关键信令及参数由于切换分析的都是标准信令,因此以下不再区分工具,统一以终端侧log
和网络侧虚用户跟踪来说明切换相关的关键信令及参数。NR测量控制一般在UE接入并添加NR辅小区后,或者NR辅小区切换后会下发测量控制
。NR的测量控制信源结构与LTE类似,分为测量对象、上报配置以及测量ID配置。NR测量控制通过LTE空口的重配置消息带给UE,基本
机制与LTE相同。注意:5G网络侧发送给UE的NRRRC消息,需要通过4G基站侧转发,而在4G基站侧跟踪到的信令,不会解析5G的
信令具体信元,仅仅是一串码流,但是可以通过终端侧的log/或者需要跟踪5G侧X2口进行查看。如下一个SCG的消息在网络侧信令解析工
具中就没有解析。测量对象NR测量对象的关键字是measObjectNR,另外也可以通过频点来确认是否是NR相关的测量。关键信息如下
:信元含义measObjectId测量对象IDcarrierFreq测量频点dl-BandWidth1测量带宽测量报告上报配置可以
通过频点来判断哪个是NR的测量报告上报的配置,关键信息如下:信元含义reportConfigId测量报告上报IDa3-Offset
A3门限,单位0.5dBhysteresis幅度迟滞,单位0.5dBtimeToTrigger时间迟滞maxReportCells
最大小区数reportInterval上报间隔reportAmount上报次数测量ID配置测量ID,关联测量对象和测量报告上报ID
。可以跟测量报告里的测量ID对应。滤波系数当前滤波系数固定为fc6。NR测量报告NR的测量报告在Probe及Assistant中显
示如下,每个NR的MR有两条,一条显示Direction为Ms->gNodeB,一条显示Direction为Ms->eNodeB。
NSA场景下UE不会直接与gNodeB进行RRC连接,第一条MR(Direction为Ms->gNodeB)实际是PA工具自己解析
的结果,实际表示的是UE内部的消息传递(5GUE将MR发送给4GUE),第二条MR(Direction为Ms->eNodeB)
才是LTE空口实际发送的MR,可以跟网络侧进行比对。两条MR的内容是完全一样的,如下所示,关键信息如下:信元含义measId测量I
D,可以关联测量控制确认MR上报的内容是否是A3measResultPCell服务小区测量结果,包含RSRPmeasResultN
eighCells邻区测量结果,包含PCI和RSRPNR切换命令当基站侧判决满足切换条件后会下发切换命令,通过LTE空口发给UE,
空口就是一条RRC重配消息。如下,scg释放18号小区,增加17号小区。注意:网络侧信令解析工具中没有将词条消息完全解析,只是一串
码流(此时可以通过终端侧的log/或者需要跟踪5G侧X2口进行查看)。切换问题定位指导切换问题快速排查备注L1L2判断方法解决方案
接入LTE后不下发NR的A3测量控制LTEUu口查看是否有携带NRA3测量的测量控制下发NR侧未配置NR邻区或邻区关
系配置错误一、通过配置文件查看:对于站内邻区,只需要增加邻区关系,MML命令为ADDNRCELLRELATION对于站间邻区,
需要增加外部邻区,并增加邻区关系,MML命令为ADDNREXTERNALNCELL。二、通过MML执行命令:LSTNRCELL
RELATION;LSTNREXTERNALNCELL对于站内邻区,只需要增加邻区关系,MML命令为ADDNRCELLREL
ATION对于站间邻区,需要增加外部邻区,并增加邻区关系,MML命令为ADDNREXTERNALNCELL。UE不上报A3事件
Uu口查看是否有上报A3事件(MeasurementReport通过MeasID与测量控制相同的MeasID进行关联。
检查周边邻区的NR小区状态是否正常DSPNRCell,DSPNRLocell显示小区异常小区状态异常,排查小区问题邻区
AAU发功异常检查AAU通道发功监测,方法:小区性能监控->AAU通道功率监控AAU不发功则排查发功问题A3的门限配置过高LS
TNRCELLMEASPARAMGROUP:未按推荐配置推荐设置:同频A3偏置(0.5分贝)=2A3切换幅度迟滞(0.
5分贝)=2A3切换时间迟滞(毫秒)=160周边邻区NR侧告警日志中有小区相关告警NR侧告警信息:A.小区不
可用告警:ALM-29841清除告警LTE收到测量报告没有转发到NRX2接口是否有RRCTransfer消息X2链路
异常(LTE,NR的源站和目标站都要排查)DSPX2INTERFACEX2异常则排查X2链路LTE未配置NR的切换目标小区邻
区关系或邻区参数配置错误配置文件排查NREXTERNALNCELL,NRNRELATIONSHIP是否配置;或者LSTNREX
TERNALNCELL,NRNRELATIONSHIP是否配置确保NR外部邻区等配置与5G一致NR未发起切换请求X2接口是否有
SgNBModRequired或者SgNBChangeRequiredNR侧未配置NR邻区或配置错误一、通过配置文件
查看:对于站内邻区,只需要增加邻区关系,MML命令为ADDNRCELLRELATION对于站间邻区,需要增加外部邻区,并增加邻
区关系,MML命令为ADDNREXTERNALNCELL。二、通过MML执行命令:LSTNRCELLRELATION;LST
NREXTERNALNCELL对于站内邻区,只需要增加邻区关系,MML命令为ADDNRCELLRELATION对于站间邻区,需
要增加外部邻区,并增加邻区关系,MML命令为ADDNREXTERNALNCELL。X2链路异常(LTE,NR的源站和目标站都
要排查)DSPX2INTERFACEX2异常则排查X2链路此部分需要参考接入专题SgNBAdd被NR邻区拒绝(NR站间切换)
X2接口NR邻区给LTE发送SgNBAddReject此部分需要参考接入专题gNBIntegrityCapb,任意一个优先
级的算法要改成null算法,否则SgNBAdd会被NR拒绝LSTGNBINTEGRITYCAPBMODGNBINTEGRIT
YCAPB:IntegrityAlgoPriority=THIRD,IntegrityAlgo=Null;UE收到NR切换命
令后未发起切换TUEOMT关键事件没有发送Preamble的记录;UU口上报RRC重建,原因是重配Failure。NR
侧小区搜索失败5GOMT上报关键事件cellsearch失败优化覆盖,降低干扰。此部分需要参考接入专题UE发送Preamble
但基站收不到TUEOMT关键事件有发送Preamble的记录,但是基站侧210跟踪显示没有收到Preamble此部分需要参考
接入专题TUE设置初始TA值导致Preamble或Msg3发出但基站检测不到TUEOMT查看5GTUE初始TA配置初始TA设
置为0此部分需要参考接入专题上下行解耦场景不打开上下行解耦开关导致TUE接入失败TUEOMT查看5GTUE上下行解耦开关是否
打开上下行解耦场景需要打开上下行解耦开关此部分需要参考接入专题TUE远点接入PRACH初始功率过低导致基站收不到基站侧210跟踪
查看是否收到了Preamble远点接入时建议直接打桩TUEPRACH功率为20dBm此部分需要参考接入专题设置PUSCH占用P
RACH资源导致PRACH无法检测PreambleNRLOCELLRSVDPARAM:RsvdSwParam1=RsvdSwPar
am4_bit5MODNRLOCELLRSVDPARAM:RsvdSwParam1=RsvdSwParam4_bit5-0;此部
分需要参考接入专题TUE中远点接入小区半径配置过小导致基站收不到用户发送的Preamble查看NRLoCell:CellRad
ius设置小区半径为10000mNRLoCell:CellRadius此部分需要参考接入专题基站发送RAR但是TUE收不到TU
EOMT关键事件显示有发送Preamble,但是没有收到RAR的记录此部分需要参考接入专题基站与TUE距离很近时,下行功率过
饱和导致DCI检不到通过UE到基站的距离以及AAU功率判断在TUE增加衰减防止上下行功率过饱和导致接入失败此部分需要参考接入专题U
E发送Msg3但是基站解不对基站侧323跟踪显示UE的第一条上行消息CRC结果为错误此部分需要参考接入专题TUE设置初始TA
值导致Preamble或Msg3发出但基站检测不到TUEOMT查看5GTUE初始TA配置初始TA设置为0NR-NR邻区配置样例
//添加NR外部邻区,NR站站间邻区才需要ADDNREXTERNALNCELL:Mcc="460",Mnc="08",gN
BId=790039,CellId=66,PhysicalCellId=1,DlNarfcn=636666;//添加NR邻区
关系ADDNRCELLRELATION:NrCellId=65,Mcc="460",Mnc="08",gNBId=790
039,CellId=66,NCellType=INTRA_FREQ;LTE-NR邻区配置样例//添加NR外部邻区ADDNR
EXTERNALCELL:Mcc="460",Mnc="08",GnodebId=790028,CellId=65,Dl
Arfcn=636666,UlArfcnConfigInd=NOT_CFG,PhyCellId=26,Tac=22303;/
/添加NR邻区关系ADDNRNRELATIONSHIP:LocalCellId=1,Mcc="460",Mnc="08",
GnodebId=790028,CellId=65;LTE-LTE邻区配置样例//添加外部邻区,站间邻区才需要MODEUT
RANEXTERNALCELL:Mcc=460,Mnc=00,eNodeBId=111484,CellId=31,DlE
arfcn=38400,UlEarfcnCfgInd=NOT_CFG,PhyCellId=268,Tac=6227//添加同
频邻区关系MODEUTRANINTRAFREQNCELL:LocalCellId=32,Mcc=460,Mnc=00,eN
odeBId=111484,CellId=31;//MOCN邻区配置了MOCN的小区,要配置站间的MOCN邻区关系,则需要使用A
DDEUTRANEXTERNALCELLPLMN进行添加。由于LTE是商用网络,外部小区和邻区关系已经很成熟,因此只需要从已有外
部邻区中,查找配置了MOCN的外部邻区,再添加MOCN的外部邻区即可。步骤一:从配置文件中查找MO为EUTRANEXTERNAL
CELL的记录中,查找配置了MOCN的外部小区;步骤二:使用MML命令ADDEUTRANEXTERNALCELLPLMN添加查找
上述命令的MOCN外部小区即可。MML示例:添加eNodBID=394327,CELLID=1的MOCN外部邻区:ADDEUTR
ANEXTERNALCELLPLMN:Mcc="460",Mnc="00",eNodeBId=394327,CellId=
1,ShareMcc="460",ShareMnc="08"。X2配置样例添加LTE->NR的X2关系UPHOSTID和SCT
PHOSTID在LTE站点建立的时候就有,因此不需要配置该MML。////////////////////////////手动配置
X2对端////////////////////////////(1)新增EPGROUP组:ADDEPGROUP:EPGROUP
ID=17,USERLABEL="for-NSA";(2)增加用户面本端到EPGROUPADDUPHOST2EPGRP:EPGR
OUPID=17,UPHOSTID=0;ADDUPHOST2EPGRP:EPGROUPID=17,UPHOSTID=1;(3)增
加用户面对端到EPGROUP//NR物资大厦ADDUSERPLANEPEER:UPPEERID=401,IPVERSION=
IPv4,PEERIPV4="110.108.249.41",IPSECSWITCH=DISABLE;ADDUPPEER2E
PGRP:EPGROUPID=17,UPPEERID=401;(4)增加控制面本端到EPGROUPADDSCTPHOST2EPG
RP:EPGROUPID=17,SCTPHOSTID=0;(5)增加控制面对端到EPGROUP//NR物资大厦ADDSCTPPE
ER:SCTPPEERID=401,IPVERSION=IPv4,SIGIP1V4="110.108.249.41",SI
GIP1SECSWITCH=DISABLE,SIGIP2V4="0.0.0.0",SIGIP2SECSWITCH=DISABL
E,PN=36422,SIMPLEMODESWITCH=SIMPLE_MODE_OFF;ADDSCTPPEER2EPGRP:
EPGROUPID=17,SCTPPEERID=401;(6)增加X2,关联新的运营商ADDX2:X2ID=1,CNOPERAT
ORID=1,EPGROUPCFGFLAG=CP_UP_CFG,CPEPGROUPID=17,UPEPGROUPID=17,USE
RLABEL="for-NSA";/////////////////////回退脚本/////////////////////RM
VX2:X2Id=1;RMVSCTPPEER2EPGRP:EPGROUPID=17,SCTPPEERID=401;RMV
SCTPPEER:SCTPPEERID=401;RMVUPPEER2EPGRP:EPGROUPID=17,UPPEERI
D=401;RMVUSERPLANEPEER:UPPEERID=401;RMVSCTPHOST2EPGRP:EPGROUP
ID=17,SCTPHOSTID=0;RMVUPHOST2EPGRP:EPGROUPID=17,UPHOSTID=0;RM
VUPHOST2EPGRP:EPGROUPID=17,UPHOSTID=1;RMVEPGROUP:EPGROUPID=1
7;////////////////////////////自建立X2对端////////////////////////////
注:手动配置X2对端和自建立X2对端的脚本只能使用一种(1)自建立需要打开LNRX2自建立开关:MODGLOBALPROCSW
ITCH:InterfaceSetupPolicySw=LTE_NR_X2_SON_SETUP_SW-1;(2)新增EPGROU
P组:ADDEPGROUP:EPGROUPID=17,USERLABEL="for-NSA";(3)增加用户面本端到EPGROU
PADDUPHOST2EPGRP:EPGROUPID=17,UPHOSTID=0;ADDUPHOST2EPGRP:EPGROU
PID=17,UPHOSTID=1;(4)增加控制面本端到EPGROUPADDSCTPHOST2EPGRP:EPGROUPID=
17,SCTPHOSTID=0;(5)增加X2,关联新的运营商ADDX2:X2ID=1,CNOPERATORID=1,EPGRO
UPCFGFLAG=CP_UP_CFG,CPEPGROUPID=17,UPEPGROUPID=17,USERLABEL="for-
NSA";/////////////////////回退脚本/////////////////////RMVX2:X2Id=1
;RMVSCTPHOST2EPGRP:EPGROUPID=17,SCTPHOSTID=0;RMVUPHOST2EPGRP:
EPGROUPID=17,UPHOSTID=0;RMVUPHOST2EPGRP:EPGROUPID=17,UPHOSTI
D=1;RMVEPGROUP:EPGROUPID=17;添加NR->LTE的X2关系配置用户面本端对象//这条命令在配置S1-
U的时候就要用到,因此可以重用S1-U的信令,写在这里就是为了核查而用ADDUSERPLANEHOST:UPHOSTID=0
,IPVERSION=IPv4,LOCIPV4="110.108.249.1",IPSECSWITCH=DISABLE配置5
GNR的X2-C配置EPGROUPADDEPGROUP:EPGROUPID=1,IPPMSWITCH=DISABLE;配置
SCTPHOSTADDSCTPHOST:SCTPHOSTID=0,IPVERSION=IPv4,SIGIP1V4="110
.108.249.1",SIGIP1SECSWITCH=DISABLE,SIGIP2V4="0.0.0.0",SIGIP2S
ECSWITCH=DISABLE,PN=36412,SIMPLEMODESWITCH=SIMPLE_MODE_OFF,SCT
PTEMPLATEID=0;配置SCTPPEERADDSCTPPEER:SCTPPEERID=0,IPVERSION=IPv
4,SIGIP1V4="110.108.249.5",SIGIP1SECSWITCH=DISABLE,SIGIP2V4="0
.0.0.0",SIGIP2SECSWITCH=DISABLE,PN=36412,SIMPLEMODESWITCH=SIMP
LE_MODE_OFF;将SCTP本端加入到端节点组ADDSCTPHOST2EPGRP:EPGROUPID=1,SCTPHO
STID=0;将SCTP对端加入到端节点组ADDSCTPPEER2EPGRP:EPGROUPID=1,SCTPPEERID=
0;配置5GNR的X2-U配置用户面对端ADDUSERPLANEPEER:UPPEERID=1,IPVERSION=IPv
4,PEERIPV4="110.108.249.5",IPSECSWITCH=DISABLE;用户面本端加入到端节点组ADD
UPHOST2EPGRP:EPGROUPID=1,UPHOSTID=0;用户面对端加入到端节点组ADDUPPEER2EPGR
P:EPGROUPID=1,UPPEERID=1;配置X2逻辑接口ADDGNBCUX2:gNBCuX2Id=0,CpEp
GroupId=1,UpEpGroupId=1;//打开GTPU检测开关MODGTPU:STATICCHK=ENABLE;如
果是自建立,需要配置5GNR的X2自建立开关MODGNBX2SONCONFIG:X2SonConfigSwitch=X2SO
N_SETUP_SWITCH-1;4G/5G两边X2配好后如果X2不通执行删除命令触发一次建链
RMVGNBCUX2:gNBCuX2Id=0;切换失败问题定位切换问题定位导图切换失败通常是指切换的信令流程交互失败,关注
点在信令的交互,只有在信令交互出现丢失或信令处理结果失败才会失败。其中信令丢失是指信令在传输过程中出错或不能到达对端,信令处理结果
失败是指终端或网络侧在处理信令时出现异常导致流程不能正常进行(例如切换时资源不足)。信令传输失败又可根据信令传输媒介的不同可分为无
线传输失败和有线传输失败,其中X2、S1接口的传输通常为有线传输,UU口为无线传输。其中有线传输失败的概率较小,无线传输失败的概率
较大,特别是信号质量较差的切换区。对于切换流程之前的问题(如UE没有发测量报告给Enb/gNB,则根本没有启动切换流程),则可能要
先排查配置。如:切换开关是否开启;基站时钟模式是否一致(一般配为GPS);A3切换事件是否配置正确;切换参数是否设置合理,满足切换
上报条件终端是否支持UU接口信令异常对于切换流程,在UU接口只有三条信令:测量报告(MEASUREMENTREPORT)、切换命
令(RRCCONNRECFG)、切换完成(RRCRECFGCMP),全部都是在LTE侧完成的。UU接口信令异常的常见原因有
:UE未上报测量报告在配置正确,小区状态正常的基础上,UE会持续进行信号测量,当满足A3上报条件时UE会上报测量报告,当前NR仅支
持同频切换,因此只会上报A3MR。如果NRA3一直未上报,可以通过路测软件查看实时的RSRP测量结果是否满足了A3上报条件。注
意:软件显示的结果是基于UE上报的数据,经过了平滑,同时UE在上报测量报告时也有平滑,同时有时间迟滞,所以路测软件显示的瞬时结果不
一定说明一定要上报A3,尤其是在信号比较复杂的区域,界面上可能看到有多个小区的RSRP满足A3,但是一闪就消失了,此时可能是一些不
稳定的信号,理论上也应该被UE平滑掉,避免乒乓切换。只有界面上持续满足A3门限时,才能确定一定是要报A3的。NSA组网下NR的测量
报告通过LTE空口上报,因此通过LTE的跟踪进行查看,目前发现网络侧的解析工具存在一些问题,解析的结果可能不准,因此建议通过终端侧
的工具查看NR的测量报告。如下是终端侧跟踪及工具解析结果,注意:NR的所有RRC消息都通过LTE转发,信令跟踪也都是在LTE侧进行
,但是在信令解析时由于工具原因存在一些误差,如上是同一个NR的MR消息,基站侧跟踪解析出来的结果是错误的,而终端侧解析出来的结果是
正确的。因此在分析切换时MR的具体内容需要通过PA工具来查看。网络侧工具需要改进。网络侧跟踪解析如下:(解析工具问题,某些消息没有
显示出具体的消息名称,可以双击打开后查看详细内容)通过网络侧告警或者MML查询的方式确认LTE和NR小区的状态是否正常,是否存在告
警,如果有异常,建议按照告警的处理建议进行排查。另外也要通过告警状态查看LTE之间、LTE和NR之间的X2状态是否正常,如果有异常
,建议按照告警处理建议进行排查。如下,NR小区未建立。DSPNRCELL:NrCellId=7;返回结果如下:+++0
2018-04-0416:14:46O&M#2685403149%%DSPNRCELL:NrCell
Id=7;%%RETCODE=0执行成功查询NR小区动态参数------------------NR小区标识=7
NR本地小区标识=7小区可用状态=不可用NR小区状态说明=未建立NR本地小区状态说明=未建
立最近一次小区状态变化的原因=小区去激活最近一次引起小区可用的操作时间=2018-04-0415:08:09
最近一次引起小区可用的操作类型=激活小区最近一次引起小区不可用的操作时间=2018-04-0416:13:41
最近一次引起小区不可用的操作类型=去激活小区小区控制节点信息=0-0-7(结果个数=1)---END
测量报告丢失,可能的原因主要有UE上发测量报告的ULGRANT没有收到,下行PDCCH受限UE上发的测量报告,eNB没有收到(或
收到但CRC错),上行PUSCH受限UE内部层间丢失,例如L3把测量报告给L2发送时,L2处理失败切换命令丢失,可能的原因主要有e
NB在切换内部流程处理(如邻区漏配、资源不够等)出错,没有发送切换请求命令给gNBgNB在切换内部流程处理(如邻区漏配、资源不够等
)出错,没有发送切换请求应答给eNBUE下行PDCCH解析失败,下行PDCCH受限UE下行PDSCH解析失败,下行PDSCH受限N
R的切换命令通过LTE的RRC重配置消息发给UE,包含NR的PCI及频点、承载配置信息等。UE收到后会回复一个重配完成。注意:包含
切换命令的重配消息需要在PA工具上查看具体内容,在网络侧解析工具中暂时没有将内部所有信源详细解析出来。目前测试遇到的问题:UE未收
到RRC重配置消息,或者RRC重配完成基站收不到TUE的解调要求比较高,实测发现当UE测量的SINR在0dB左右时会概率性收不到网
络侧消息,或者发送的消息网络侧收不到,因此如果出现空口消息丢失的情况(不管上行还是下行)首先排查问题点的LTE空口情况,如果出现R
SRP低于-110dBm或者SINR低于0dB的情况,说明这个点的覆盖很差,建议优先进行LTE的RF优化。通常出现信令丢失时会伴随
RRC重建,可以通过TUE的OMTlog进一步确认重建的原因是否是信号太差导致解调失败。UE收到RRC重配置后没有反馈RRC重配
置完成出现这种场景时首先获取一次正常切换的RRC重配置消息,对比每一个信元是否有明显差异。另外这类问题也可能是UE内部处理异常,需
要获取OMTlog以便进行深入分析。在gNB随机接入失败,可能的原因主要有UE在目标小区的PREAMBLE,gNB没有收到,上行
PRACH受限UE下行接收RAR失败,下行PDSCH受限UE上发MSG3小区,gNB没有收到,上行PUSCH受限UU口的传输为无线
传输,其信道质量可以分为上、下行来分析。如果终端侧能够捕获RSRP、SINR、IBLER、DL/UL_Grant等信息,并配合网络
侧的信令跟踪,大多情况都可以判断上、下行的问题。信道质量的观察量通常有下面几个:SSBRSRP:RSRP为下行SSB接收功率。尽
管导频与数据域的信道质量有一定差异,通过导频RSRP、SINR可以大致了解数据信道状况。一般RSRP>-85dBm,用户位于近点;
RSRP=-95dBm,用户位于中点;RSRP<-105dBm,用户位于远点。判断用户近、中、远点并不能完全判断用户的信道质量,尤
其在加载场景下,有可能中点、近点用户的信道质量仍然不理想(当邻区RSRP与服务小区RSRP较接近时,干扰较大),需要依据其它指标来
判断信道质量。SSBSINR:通过导频SINR可以大致了解数据信道状况。如果SINR<0dB说明下行信道质量较差,当SINR<-
3dB说明下行信道质量恶劣,处于解调门限附近,容易造成切换信令丢失,导致切换失败,由于5G引入了波束的概念,广播波束和数据信道波束
并不完全一样,因此这里只是给出SSB的SINR判断,实际用什么指标评估干扰的信道还未有定论。上行SINR可以通过CELLDT跟踪
获得。IBLER:正常情况下,IBLER应该收敛到目标值(目标值为10%,当信道质量很好时IBLER接近或等于0%);如果IBLE
R偏高说明信道质量较差,数据误码较多,很容易造成掉话、切换失败、或者切换大时延。IBLER可以从probe/OMT中获得。PDCC
HDL:从DL_Grant可以得知UE正确解调PDCCH的个数。当上/下行数据源足够(如上/下行UDP最大能力灌包)时,gNB每
个TTI均调度用户,PDCCH个数为1600(SA4:1下)。若DL_Grant=1600,说明PDCCH解调正常,信道质量正常
;若DL_Grant偏低,说明PDCCH解调有错,信道质量可能比较差。在判断上、下行信道质量时,有时不能完成任L3上下行信令是否
丢失来判断。例如,下行信道质量差不仅会影响下行信令的解调,下行PDCCH解调错误也会影响上行调度,造成上行信令丢失。信道质量问题通
常是因为弱覆盖或干扰引起。对于空口问题定位,需要把问题定位到覆盖(弱覆盖、越区覆盖等)、干扰、邻区漏配、切换不及时等几类,再采用相
应的解决措施解决问题。X2接口信令异常当前5G小区的切换流程,都涉及到X2口的交互,即gNB与eNB直接的交互,涉及SgNBIn
formationTransfer,SgNBModificationRequired等信令。X2接口信令异常的常见原因有:e
NB到gNB切换请求丢失,可能的原因主要有eNB内部处理测量报告异常,如邻区漏配、内部模块处理失败X2口传输异常,如传输丢包gNB
到eNB切换响应丢失,可能的原因主要有源小区内部异常,源小区在目标小区回切换响应之前,向目标小区发送了切换取消消息。如果NR侧未发
起SgNBModificationRequired,首先检查NR邻区配置是否正确,主要是NRCellRelation配置(同站
不用配置NREXTERNALNCELL)。如果确认满足A3门限且邻区配置正确的情况下,NR侧未发起SgNBModificatio
nRequired,那么NR内部可能存在处理异常,需要采集NR的一键式日志进行深入分析。还有一类问题在初期较常见,流程交叉,需要
通过网络侧跟踪查看在NR切换准备时是否存在其他的流程(如LTE切换、重建),可以采集NR的一键式日志进行深入分析。目标小区切换准备
异常X2口传输异常,如传输丢包对于X2口消息交互出现异常,通常是传输失败或基站内部处理出错,而基站内部处理出错的概率较小,传输失败
的可能性较大,但比较难以定位,需要在传输的两端抓包确认。另外,LTE站间切换还涉及NR小区删除及添加过程,主要排查方面:NR侧无响
应问题主要排查NR内部异常或者流程冲突问题,需要获取SgNB的一键式日志进行分析。NR侧拒绝删除或添加请求可能是由于NR侧资源分配
失败,需要获取SgNB的一键式日志进行分析。NR小区故障或者X2链路故障排查小区状态,告警,如果有异常,参考告警帮助进行排查。S1
接口信令异常对于切换流程,S1接口仅有两条信令:S1APPATHSWITCHREQ、S1APPATHSWITCHRE
QACK,E-RABModifyRequest,E-RABModifyResponse均在4G侧完成;S1接口信令异
常的常见原因有:S1APPATHSWITCHREQ丢失,可能的原因主要有目标eNB内部处理切换完成信令失败S1口传输异常,如
传输丢包S1APPATHSWITCHREQACK丢失,可能的原因主要有核心网收到S1APPATHSWITCHREQ消
息后,内部处理失败对于S1口消息交互出现异常,通常是传输失败或网络设备内部处理出错,设备内部处理出错的概率较小,传输失败的可能性较
大,但比较难以定位,需要在传输的两端抓包确认。另外,由于涉及到与核心网的交互,如果出现修改拒绝或者无响应问题,需要核心网同时抓取单
用户跟踪进行分析。流程交叉场景问题分析NSA场景一般都是LTE与NR共站部署,方位角等也可能一致或接近,因此LTE和NR的切换区重
叠的概率可能比较高,如下是杭州外场测试LTE和NR切换点分布,仅50%基本重叠,因此出现LTE与NR切换流程交叉的场景会比较多。重
叠区域,可以通过工参,一般共站址,通方向角的LTE和NR小区可以认为是覆盖区域重叠。流程交叉场景识别出现流程交叉场景的两大明显现象
:由于无法进行切换,UE会不断上报MR,但是无法进行切换。由于信号变差,TUE容易发起RRC重建。LTE切换过程中NR删除时与NR
的切换请求交叉,NR不回复删除的请求,那么LTE会一直等待,导致UE一直上报A3MR。由于LTE一直无法切换,随着UE的移动,邻
区信号越来越强,干扰越来越大,SINR降到0dB以下,对于TUE来说很容易出现因为无法解调而导致的重建。流程交叉场景确认如果出
现以上现象,进一步确认需要根据L3信令及标准切换流程,进行深入分析,确认是否存在LTE切换过程中夹杂NR切换,或者NR切换过程中夹
杂LTE切换里程的场景,如果存在,说明存在切换的流程交叉。流程交叉场景解决方案如果出现切换失败,建议按照前文所述进行分析,确认是否
是交叉场景,如果是,建议采集终端,基站及核心网侧log进行分析。流程交叉可能存在的场景,问题分析时可以参考。LTE流程NR流程重建
添加站内切换站间切换释放站内切换添加站内切换站间切换释放站间切换添加站内切换站间切换释放释放添加站内切换站间切换释放L2定位分析指
导(随机接入)L2的内部交互流程该部分为gNodeB侧L2内部的消息交互流程,L2内部模块主要涉及CCHP、SUSR、DMAC、U
LSCH、DLSCH、PDCCH等。序号流程描述消息ID归属流程定界点流程维测定时器时长1参见系统消息章节L2无2L2接收L
3上报Modify消息L3_SUSR_MODIFY_REQL3L3发送消息位置后续补充CHR无上行:TAG_L3CFG_SUSR
_ULBWP_STRU下行:TAG_L3CFG_SUSR_DLBWP_STRUL2SUSR消息接收位置上行BWP跟踪号463;下行
BWP跟踪号缺少3CCHP接收UE发送的专用PreambleL2_L1_PACKET_FOR_UL_MEASCCHPCCHP接收消
息1号跟踪(210子跟踪)无4DLSCH从CCHP获取RARNTI链不涉及DLSCH/CCHPDLSCH获取链位置1号跟踪(528
子跟踪)5ULSCH从CCHP获取Preamble链不涉及ULSCH/CCHPULSCH获取链位置1号跟踪(401子跟踪)无6D
LSCH从PDCCH获取CCE资源不涉及DLSCH/PDCCHDLSCH处理位置523号跟踪无7DLSCH给CCHP发送RAR调度
完成消息CCHP_JOBID_PDSCHSCH_CCHP_RARSCH_RESULTDLSCH/CCHPCCHP消息接收位置1号跟
踪(201子跟踪)无8ULSCH给CCHP发送MSG3调度完成消息CCHP_JOBID_PUSCHSCH_CCHP_MSG3_RE
S_ALLOC_RESULT_INDDLSCH/CCHPCCHP消息接收位置1号跟踪(201子跟踪)无9CCHP组包RAR下发给基
站L1DSP不涉及CCHPCCHP包发送位置1号跟踪(205子跟踪)无10CCHP下发DCI给基站L1DSP不涉及CCHPCC
HP包发送位置602号跟踪无11DMAC接收msg3DMAC_LOOPBACK_TEST_JOBDMACDMAC消息接收位置323
号跟踪无12SUSR接收DMAC解复用的msg3数据SUSR_JOBID_DMAC_DEMULTINFO_MSGSUSRSUSR消
息接收位置743号跟踪13SUSR激活BWP1不涉及SUSRSUSR消息发送位置此处缺少跟踪,提单susr添加维测无14ULSCH
BWP1激活处理USR_TAG_USRSCH_UL_BWP_INFOULSCHULSCH消息处理位置缺少跟踪无15DLSCHB
WP1激活处理USR_TAG_USRSCH_DL_BWP_INFODLSCHDLSCH消息处理位置缺少跟踪无16SUSR用户添加同
步链不涉及SUSRSUSR消息处理位置此处缺少跟踪,提单susr添加维测无17SUSR给L3发送释放专用Preamble消息SU
SR_L3_D_PREAMBLE_RELSUSRSUSR消息发送位置773号跟踪18PDCCH下发DCI给基站L1DSP(此处
为数传的DCI)PDCCH_JOB_PACK_PDCCH_CTRL_FRMPDCCHPDCC包发送位置602号跟踪从第13步开始计
时,基站L2模块TDD是40个TTI后BWP1生效;FDD是20个TTI后生效常见的跟踪介绍当前CELLDT会打印空口的帧号子帧
号,也会打印处理的帧号子帧号,两者的子帧号关系需要换算:1)处理时刻:子帧号是0-19;2)空口的子帧号是0-9,时隙号是0-1,
空口的真正Slot是(子帧号2+时隙号)相关跟踪号介绍:其中1号跟踪是随机接入全流程跟踪,包含212,210,201,205,跟
踪号作用201L2收到MSG1消息的内部处理流程,L1上报Preamble到L2RAR组包下发的过程212L3分配的Preamb
le210收到的专用Preamble的消息205RAR的消息602PDCCHDCI跟踪603PDCCHCCE分配跟踪,明确是R
AR调度失败再跟踪609PDCCHDLDCI填写,明确是RAR调度失败再跟踪323/324MSG3消息455管理帧跟踪517下行
PDSCH的调度,明确是RAR调度失败再跟踪403上行PUSCH的调度407上行调度全流程跟踪,明确是MSG3调度失败再跟踪408
上行调度失败原因跟踪,明确是MSG3调度失败再跟踪105(VPORT收发包跟踪)RAR是否发送给L1。212跟踪(L3分配的Pre
ambleID)字段名字段解释ucL3IndToSusrFlag1表示L3分配的;5表示收到L1上报无效的MSG1,也就是虚检。
ucPreambleIdPreambleID,取值0~63usCRntiL3分布的CRNTI210跟踪(MSG1)字段名字段解释
bit10FrmNo帧号bit06SubfrmNo子帧号bit08SlotNo时隙号bit08PreambleIndexPream
bleID,取值0~63bit04RachFreqSpreadRACH频偏,为13个固定值,本字段代表这13个值的索引,由RAC
H反馈帧发送给L2。、bit16RachUlTimingOffsetTs该参数为负,L1如果计算得到为负,则给L2上报0,为正,单
位为16k(2^(-u))Tsbit08RachOptBeamIdx[i]RACH上报的波束信息,2个极化方向各选4个最优波
束,总共8个最优的宽波束。bit16RachOptRelativeValue[i]8个PRACH宽波中每个波束的归一化之前的相关峰
值。201跟踪(MSG1消息处理和RAR消息处理)字段名字段解释ulSysFrm处理的帧号ulSysSubFrm处理的子帧号ulR
achFrmulRachSubFrmulTmpCrntiL3分配的RNTI,可以判断是否属于同一用户ulPreambleId收到的
MSG1prambleIDusSusrId用户的ID,和CRNTI是对应的,可以判断是否属于同一用户正常情况下PRACH处理应
该是这样子的:下行调度RAR成功;上行调度Msg3成功;CCHP进行RAR组包下发。205&602跟踪(MSG2&DCI)205跟
踪:字段名字段解释bit10FrmNo空口帧号子帧号还有Slot号,实际Slot=子帧号2+Slot号bit06SubfrmNo
bit08SlotNoulRaRntiRA-RNTIbit04BeamType只在静态波束加权下有效;0,cell-spec波束,
用于cell-spec的PDSCH/CommoonPDCCH的单Port发射的波束权值选取1.基于RACH测量的User-Spe
c静态波束,当前为宽波束,在没有SRS上报和窄波束测量之前,使用该波束。2.基于SRS/CSI-RS测量的user-spec静态波
束bit08BeamVecIDA[i]Porti对应的左极化波束bit08BeamVecIDB[i]Porti对应的右极化波束
bit05MCS实际调度的MCS323/324跟踪(MSG3)323是MAC解复用前的跟踪,324是MAC解复用后的跟踪,复用解复
用是MAC层功能,是指逻辑信道到物理信道的映射。第一条消息就是MSG3消息。字段名字段解释ulDmacId用户的ID,可以判断是否
属于同一用户ucCrc0代表ack,1代表nack正常的MSG3消息如下(324跟踪)建议的解决措施通过前面的定位方法,基本可以把
切换问题定位到:传输、设备内部处理、覆盖(弱覆盖、越区覆盖等)、干扰、邻区漏配等几类,再采用相应的解决措施解决问题。分析方法对应表
,通过上述分解,问题可以归结:切换失败分类定位方法信道质量1通过Probe观察RSRP、SINR、IBLER、DL/UL_Gra
nt等;LMT用户性能跟踪,分析上/下行信道质量网优问题2结合网络规划,分析是否有越区覆盖情况,调整电倾角;cluster边界邻
区关系配置。配置问题3MML查看是否有邻区漏配;X2相关配置;随机接入相关配置(Ncs_Index);鉴权开关传输问题4查看告
警,是否有链路闪断;传输是否稳定。该问题概率性出现,很难抓取log定位产品问题5无线侧、核心网侧产品Bug可能造成切换概率性失败
;功能不完善也可能造成切换性能降低。需要开发协助定位。传输问题涉及面较大,特别是跨城市的传输,出问题的概率更大,需要在最靠近无线网
络设备的收发端抓取数据进行确认;设备内部处理出错的问题则需要各网络设备的日志来定位;弱覆盖、越区覆盖、干扰、邻区漏配、切换不及时通
常体现在信令丢失导致切换失败,为空口信道质量问题,有相应的解决措施:对于弱覆盖需要通过调整天线、调整功率或增加站点覆盖来解决越区覆
盖区域较小时,也容易导致切换失败或掉话,需要通过天线调整控制越区覆盖干扰问题在排除外界干扰的情况下,通常是多用户场景或加载场景下出
现,根据不同的场景,可以选择打开频选调度等干扰控制算法开关,进行干扰协调邻区漏配问题可通过操作维护台增加邻区配置来解决切换不及时可
通过调整切换的相关参数:切换门限、迟滞、切换延迟触发时间、CIO等,以控制切换时机切换优化指导由于切换会重新添加NR小区,对速率影
响较大,因此,从速率或者用户感受的角度,尽量减少切换,尤其是乒乓切换,主要依赖以下手段:RF优化减少LTE切换和NR切换,避免乒乓
切换。具体参考覆盖优化指导书。参数优化主要是切换参数优化,LTE的切换参数比较复杂,可以针对各种情况进行精细调整,具体参考LTE切
换X板斧。当前的NR切换参数比较简单,可以设置的参数如下,其中切换门限可以根据实际情况进行调整。参数MO参数ID参数名称推荐值备注
NRCELLUETIMERCONSTT307T307MS1000200ms的MSG1只能发3~4次,出现T307超时掉话。18B
很多功能没做,比如重同步,需要做参数优化,确保不掉话。1000ms减去搜网时间可以发30~40次;NRLOCELLCellRadi
us该参数表示小区半径,满足一定性能条件下小区所能覆盖的最远距离。10000NRLoCellRsvdParamRsvdSwPar
am4_bit11DLAMC可变步长1NRCELLMEASPARAMGROUPIntraFreqA3OffsetA3切换门限4
,参考备注根据摸测是否存在乒乓切换建议修改NRCELLMEASPARAMGROUPHandoverA3HystA3切换门限迟滞4,
参考备注根据摸测是否存在乒乓切换建议修改NRCELLMEASPARAMGROUPHandoverA3TimeToTrig切换时间迟
滞320,参考备注根据摸测是否存在乒乓切换建议修改;案例LTE站内切换和NR变更流程交叉,内部消息发送错误导致LTE切换失败问题描
述TUE在从东往西移动过程中,在松木场站下同时满足了LTE和NR的A3切换门限,在切换过程中,NR回复sgNBModificati
onRequestReject,原因是no-radio-resources-available,导致切换失败,UE被释放。事件打点
,NR异常释放。处理过程1)从UE侧信令看来看,UE上报了A3的测量报告,但未收到基站下发的切换命令,因此,先进行基本配置排查:邻
区,X2口信息都正常。2)另从网络侧跟踪进一步分析,发现是LTE和NR之间存在信令较差。分析如下:(红色框标识LTE切换相关信令,
蓝色框标识NR切换相关信令)TUE上报了NRPCI7小区的A3MR,满足切换条件(消息1),LTE转发MR给SgNB(消息2)。TUE上报LTEPCI48小区的A3MR,满足切换条件(消息3)。TUE重复上报NR的A3MR(消息4)。LTE判决要进行LTE站内切换,按照流程发起sgNBModificationRequired(消息5),但是对端SgNB回复sgNBModificationRequestReject,原因是no-radio-resources-available,导致切换失败,UE被释放。LTE站内切换的正常流程:经过开发分析,确认问题的原因是LTE和NR切换流程交叉时,内部处理异常,消息发送错误,导致NR回复sgNBModificationRequestReject。详细分析如下:(1)如上,TUE先上报了NR的A3MR,5G站内切换时,CU_UEM给DU_UEM发送目标小区PCI7的F1建立请求消息之后,此时还没有收到F1建立响应消息。(2)在5G站内切换过程中,同时又收到了LTE站内切换请求(sgNBModificationRequired),由于优先级更高,将5G站内切换终止,走SGNBMOD流程,CU_UEM给DU_UEM发送源小区PCI8的F1建立请求消息。(2)此时DU_UEM给CU_UEM回复了目标小区PCI7的F1建立响应消息,该消息回复给了SGNBMOD流程中,由于SGNBMOD流程使用的是源小区PCI8的数据,通过目标小区PCI7找不到源小区的数据,导致SGNBMOD流程异常终止,给LTE回复SGNBREJ消息。UE被LTE释放。根因5G内部消息处理异常,不同进程的消息混淆,给LTE错误回复了sgNBModificationRequestReject导致LTE站内切换失败。解决方案F1建立消息增加ID字段,区分不同的建立请求。5G收到LTE切换时,马上终止5G变更。建议与总结系统梳理所有的UE、LTE、NR所有的流程交叉场景,排查流程交叉场景的异常保护是否完备。LTE切换和NR变更流程交叉,流程卡死导致掉话问题描述TUE从北往南移动过程中,TUE收到昌化新村的LTE越区信号,满足A3门限,上报测量报告,但是基站一直没有下发切换命令,最终TUE发生重建。从LTE信号看,TUE已经收到昌化新村PCI337小区的信号,满足切换条件,但是基站没有下发切换命令,一直没有切换,由于邻区信号干扰变大,SINR变差(低于-5dB),导致TUE解调失败,发生重建。从TUE侧事件分析,同时满足了LTE的A3和NR的A3,但是都没有切换,怀疑是流程交叉,下一步从网络侧跟踪确认。处理过程1)从UE侧信令看来看,UE发送了A3测量报告但未下发切换命令,先需要进行基本配置排查:邻区,X2口信息都正常。2)分析网络侧信令,确认是存在LTE切换与NR变更流程交叉,导致基站不处理LTE切换,信号逐渐变差,导致UE重建。详细信令流程分析如下:(红色框标识LTE切换相关信令,蓝色框标识NR切换相关信令)从网络侧信令分析,前后2ms内基站收到LTE切换的A3MR(上图消息1)和NR切换的A3MR(消息2),根据流程,LTE基站将NR的A3MR转发给SgNB(消息3)。LTE发起同频切换准备,发送HandoverRequest到目标基站(消息4),如下图。对于LTE来说,在LTE切换过程中SgNB的消息不会处理,优先处理LTE切换。源侧LTE基站收到目标LTE基站回复handoverRequestAcknowledge消息之前,源SgNB判决需要进行站内切换,向LTE基站发送了sgNBModificationRequired消息(消息5),请求进行NR站内切换。对于SgNB来说,发送了sgNBModificationRequired之后会启动定时器等待响应,不会处理其他消息。标准流程如下:由于源LTE侧已经开始同频切换流程,因此不会处理SgNB的任何消息,SgNB发起的sgNBModificationRequired不会有响应。LTE收到目标LTE基站的handoverRequestAcknowledge消息后,开始同频切换,按照流程,先释放SgNB,发送sgNBReleaseRequest(消息6),等待SgNB响应SNTRANSFER。但是由于SgNB侧已经发起了sgNBModificationRequired,所以不会响应sgNBReleaseRequest消息。因此,LTE切换流程与NR站内切换流程交叉,LTE不响应NR的sgNBModificationRequired消息,NR不响应LTE发送的sgNBReleaseRequest消息,导致流程卡死,随着UE的移动,LTE邻区信号越来越强,SINR变差,最终重建。根因LTE与NR的切换流程交叉处理异常,优先级考虑不周,导致流程卡死,既无法处理LTE切换也无法处理NR切换,最终导致UE重建。解决方案增加流畅交叉场景的保护,涉及LTE切换的场景,优先处理LTE切换。建议与总结系统梳理所有的UE、LTE、NR所有的流程交叉场景,排查流程交叉场景的异常保护是否完备。第1页,共60页
献花(0)
+1
(本文系通信农民工原创)