1、影响接入问题常见因素

2、整体分析思路

 

动作

分析目的

1:接入失败范围、KPI趋势分析、话统原因分解

1、识别Top小区

2、分析接入失败的主要原因,推理出优先执行动作。

2:操作日志+设备故障+告警排查+外部事件

1、检查操作日志,确认是否有可疑参数修改和可疑操作,确认操作原因并尝试恢复。

2、分析是否存在影响接入的设备故障或告警

3、是否存在核心网升级、割接、传输组网变动等网络动作。

3:参数检查

1、接入专题,分析基站、核心网的接入核心参数合理性/一致性。

 

4:版本差异和已知问题排查

1、TOP站点是否版本差异

2、是否存在已知问题

5:网络规划优化

1、分析是否TAC/TAL、子帧配比(TDD)等组网参数错误导致接入问题。

2、分析资源拥塞导致的接入失败,是参数配置原因还是真正网络拥塞。

3、分析是否因为弱覆盖导致接入失败。

6:射频通道检查

1、排查射频通道是否存在异常
2、分析是否存在上行干扰

7:Top用户排查+Top终端类型排查

1、排查是否某个/几个特殊用户导致接入KPI恶化;

2、排查接入问题是否由某款特殊类型终端导致。

8:核心网异常排查

1、排查是否核心网的问题导致接入问题;

2、排查是否核心网的操作(升级/配置修改)导致接入问题。

9:传输排查

排查是否存在传输异常导致的接入失败。

10:投诉及问题复现

1、给出投诉问题的一般分析方法;

2、通过问题复现采集相关的LOG。

 

接入失败差小区处理动作

3、接入问题初步分析

3.1 KPI趋势分析

KPI趋势分析方法:

1、接入问题“日期”趋势分析:

对最近半个月或更长时间段的接入成功率(对恶化场景,需要至少涵盖恶化前后三天或一周)进行基于日期的趋势分析。在分析成功率的同时结合接入次数进行相关分析,确认接入问题在时间上的趋势。

2、接入问题“时段”趋势分析:

对问题时间段进行全天24小区的接入成功率分析,并结合接入次数进行相关分析,确认是否有Top恶化时段;

3、关联指标分析:

关联干扰IN、CPU占用率分析、用户数、切换成功率。

失败原因统计:RRC的失败原因细分,如NoReply、Rej等;ERAB的失败原因细分,如NoReply、MME、TNL等;关联指标及话统counter,掉话率、切换成功率、上行干扰(IN)平均值、单板CPU最大/平均占用率等。

3.2 睡眠小区分析

睡眠小区定义:执行MML命令DSPCELL,显示小区正常;历史KPI现实此小区用户数较多;无异常操作记录;无异常告警;RRU发功正常。从某一时刻开始,小区无用户,话统中随机接入前导个数剧增,无接入信息,空口显示只有paging,用户投诉无法接入。

结合案例,总结睡眠小区主要存在以下三种现象:

(1)历史话统显示小区一直存在用户接入,从某一时刻开始,无用户接入请求msg3,竞争随机接入preamble个数剧增,随机接入响应RAR个数统计一直为0,

 (2)历史话统显示小区用户数比较多,从某一时刻开始,无用户接入请求,竞争随机接入前导个数增加,随机接入响应RAR回复正常。

 (3)KPI话统显示,从某一时刻开始,无用户接入请求,竞争随机接入前导preamble个数减少为0,专有接入前导preamble个数剧增,专有随机接入前导响应RAR统计一直为0,与前导个数不匹配,历史话统显示切换很少。

4、故障、告警、操作日志核查

4.1 操作日志排查

排查是否存在影响接入KPI的相关操作;对于指标突然恶化场景一定要重点执行,主要是从时间点确定是否存在对应关系。

与参数核查的关系:操作日志排查可以直接、快速的发现参数修改原因导致的趋势恶化问题,减少全参数核查的操作,提升问题定位效率。

分析方法:

1、对于指标突然恶化场景,查找恶化点前一周的异常操作。

2、对于指标逐渐恶化场景,查找最近一周的异常操作。

3、异常操作包括但不限于添加,删除,闭塞,激活以及去激活操作。

4.2 告警故障排查

检查是否存在影响接入KPI的相关故障和告警;对于与接入不相关或影响不大的告警,可以暂缓处理;但对于影响接入性能的告警,需要首先闭环。

注意:恶化点前被手动恢复的告警同样需要分析关注。因为部分被手动恢复的告警不会再显示到告警台上,但系统内部依然存在。

4.3 外部事件排查

根据KPI恶化趋势图中的恶化点,咨询了解KPI恶化前是否存在重要影响KPI的事件,对事件与KPI恶化进行关联分析。此列表之外的外部事件,如时间点上能够对应,也需要重点关注。

KPI恶化前是否存在如下情况(包括但不限于):

1、核心网是否有修改参数操作?

2、核心网是否有升级操作?

3、传输是否整改?

4、是否存在某款终端发布?

5、是否存在类似资费/天气/集会/学生离校返校/节日情况?

6、问题站点周围存在新建站点?

7、其他重要因素?

如果恶化前存在某些明确或了解到的关键事件,则将关键事件时间点与KPI恶化趋势关联分析。

5、参数、版本核查

5.1 参数核查

对于网络结构/话务没有变化,只是执行日常的接入优化时,为提升参数核查效率,优先进行核心参数分析,如仍达不到效果,则考虑进行其他参数分析。

Top小区问题,重点针对Top站点和正常站点的参数进行对比,找出差异点;升级导致的问题,要对升级前后的全参数进行对比分析。

省公司对于现网关类、省电类、功率类、系统内移动性管理类、系统间移动性管理类、基本类等49个重要参数及定时器设置制定了“LTE无线参数设置规范”,并下发各地市要求严格按照规范执行。

根据现网已知问题,整理参数20个,区分为:平衡参数、外部查询参数和关联关系参数三类,详见下表。

No

参数名称

来源

参数字段名

参数影响

1

PDCCH初始OFDM符号数

MML

InitPdcchSymNum

开关关闭且设置为1对单用户下行峰值吞吐率有好处,但是在小区带宽20M以下时会导致用户接不入小区。 

2

PDCCH占用OFDM符号数动态调整开关

MML

PdcchSymNumSwitch

开关关闭,且PDCCH初始OFDM符号数=1导致小区带宽<20M的小区用户无法接入。

3

SRS子帧配置

MML

SrsSubframeCfg

SC5或SC9会导致SRS不扩张减少接入用户数 

4

最低接收电平

MML

QRxLevMin

该值越大,要求终端的信号质量更好才能接入小区。

5

最低接入信号质量

MML

QQualMin

该值越大,要求终端的信号质量更好才能接入小区。

6

加密算法

MML

ENODEBCIPHERCAP

“eNodeB加密算法优先级配置”中“PrimaryCipherAlgo”、“SecondCipherAlgo”、“ThirdCipherAlgo”对应的加密算法各不相同。

7

完整性保护算法

MML

ENODEBINTEGRITYCAP

“eNodeB完整性保护算法优先级”中“PrimaryIntegrityAlgo”、“SecondIntegrityAlgo”、“ThirdIntegrityAlgo”对应的完整性保护算法各不相同。

8

S1接口是否处于闭塞状态

MML

S1InterfaceIsBlock

闭塞S1接口后将造成新用户不能接入

 

No

参数名称

来源

参数字段名

备注

1

AMBR

S1信令(MME)

AMBR

AMBR>0。AMBR=0导致无法接入 

2

ARP

S1信令(MME)

ARP

ARP不等于0。ARP等级=0导致无法接入 

3

传输层IP地址 

S1信令(MME)

transportLayerAddress

与基站配置的IPPATH对端地址相同。不相同则导致无法接入 

4

APN设置 

终端侧配置 

APN

动态APN

5

终端入网制式 

终端侧配置 

入网制式 

自动(非WCMDA Only 或GSM Only,开通异系统互操作网络非LTE Only)

当自动情况下终端一直接入到3G或2G网络时,尝试设置为LTE Only模式。 

6

终端接入模式 

终端侧配置 

接入模式 

开通异系统互操作的网络设置为PS CS模式,未开通则设置为PS Only

 

No

参数名称

来源

参数字段名

关联及注意事项

1

基站共享模式

MML

ENodeBSharingMode

当基站共享模式不等于“独立运营商模式”时即代表当前基站为MOCN站点

License共享策略

MML

LICENSESHARINGPOLICY

2

小区半径 

MML

CellRadius

1、每个小区具体配置的逻辑根序列索引由网络规划配置。

2、小区半径小于等于1400米时,对于TDD,建议前导格式取值为0~4;

3、高速铁路场景下配置为超高速小区,高速公路以及高速干道附近配置为高速小区,其他场景下配置为低速小区。

根序列索引 

MML

RootSequenceIdx

前导格式 

MML

PreambleFmt

高速小区指示 

MML

HighSpeedFlag

 

 

5.2 UE配置问题

1. 频点配置

检查频点配置是否与eNB一致,如果频点不正确,UE表现为小区搜索失败。

2. 类型设置

LTE核心网通常没有配置CS域的通道,只有PS域。当某些终端类型为CS&PScombinedattach时,就会导致只Attach了PS域,CS域一直附着失败,UE最终被释放掉。将异常终端的Attach方式修改为PS_ONLY可以解决此问题。

3. 终端规格问题

终端通常只支持band1,band3,band7和band20,如果小区设置为其他频带,终端将无法接入;部分三星终端不支持Snow3G无线层加密算法,如果小区配置中使用此算法进行加密和完整性保护,终端可能会出现接入失败。

测试局点接入问题一般与小区配置,终端规格和SIM卡开户有关。

6、网络规划优化

6.1 弱覆盖排查

分析对象为指标异常小区,把真实存在弱覆盖导致接入失败排查出来,如果是TOP用户弱覆盖通过下面的闭环动作解决。

6.2 拥塞排查

最差小区,接入失败话统原因为L.RRC.SetupFail.ResFail或者(L.RRC.SetupFail.NoReply且基带板CPU使用率很高)时,通过排查确认小区是否真的已经处于容量拥塞状态。

出现RRCSetupFailResFail时刻,伴随着主控板CPU最大使用超标情况。

6.3 网规排查

话统RRC&ERAB成功率正常,但RRC请求次数突增、ERAB请求次不变,分析话统确定什么消息导致RRC次数突增,如TAU消息次数突增,在地图上查看TAC/TAL规划是否按照地理区域划分;

7、射频和干扰排查

确认射频告警情况,排查是否存在通道故障、驻波等问题,查看是否存在射频通道相关告警。

怀疑接入问题与干扰强相关时,分析确认接入失败存在强干扰现象后,再具体排查通道干扰等问题。

查询小区闲时上行干扰话统,如果L.UL.Interference.Avg>=-115dbm,则很有可能存在上行干扰。

8、TOP终端排查

使用 “Top用户终端能力统计”功能,检查Top终端类型占总体异常比例,Top1终端类型异常比超过正常终端异常比1倍时界定为Top终端类型问题。

 

9、核心网异常排查

针对话统原因及问题现象对问题进行界定。如果界定为核心网问题需要咨询核心网维护工程师在接入指标恶化前是否进行过核心网操作或核心网存在问题,了解操作内容或问题后,评估是否对接入KPI带来影响。也可以观察核心网的对应指标,确认是否有特定的MME存在类似的指标变化。

核心网排查包含两部分:ERAB建立失败及NAS过程异常。

ERAB建立失败:通过UU/S1标口信令来分析如下3类问题

1、基站回复上下文建立失败:需要信令中检查核心网的参数传输层IP地址、AMBR、ARP等是否正确。这类问题排除原因后,则需要与核心网人员一起定位解决。

2、MME主动释放之异常释放:根据UU/S1跟踪信令流程或标口信令以及MME释放原因值,找核心网人员一起定位。

3、MME主动释放之UE未响应空口消息导致核心网先超时释放:转动作5进行上行覆盖排查,以确认是信道质量原因,还是终端问题。

4、鉴权失败:可以通过跟踪信令分析是否是鉴权失败。

信令记录的上下文释放命令中的内容:鉴权失败

5、核心网未发上下文建立导致基站主动发释放请求:通过跟踪信令检查是核心网未回复导致基站超时,还是UE未响应NAS消息导致核心网未下发消息。核心网未回复消息排除传输丢包原因后直接找核心网人员一起定位。UE未响应NAS消息导致核心网未下发消息问题需要根据信令流程先排查空口弱覆盖、干扰或终端问题。

释放原因值:等待上下文请求超时

(UEM_UECNT_REL_DT_WAIT_UECNT_SETUP_REQ_TIMEOUT)

10、传输排查

通过话统原因L.E-RAB.FailEst.TNL或其他动作转入。传输异常告警在任何场景下都首先要无条件执行并闭环,对于与接入成功率不相关或影响不大的告警,可以暂缓处理。

数据源

分析方法

闭环动作

话统

接入失败统计原因指向传输原因,“L.E-RAB.FailEst.TNL”

尝试传输问题复现

排查传输问题

告警

出现“SCTP链路故障告警”、“IPPath故障告警”、“小区不可用告警

告警解决

配置参数

检查VLAN,DSCP,IPRT,IPPATH,SCTP等传输参数配置与规划是否一致

与规划不一致则修改传输参数配置

S1标口信令

通过S1标口信令,检查上下文建立错误用户的INITIAL_CONTEXT_SETUP_REQ中transportLayerAddress是否与基站配置IPPATH对端地址的一致,如地址在基站侧不存在,则添加。

若地址与规划的不一致,则及时联系核心网人员得到原因。

1、传输层IP在基站侧未配置:基站添加对应的IPPATH。

2、传输层IP在基站侧配置错误:基站修改IPPATH配置。

3、核心网带的传输层IP与规划不一致:联系核心网人员处理。