KPI体现的是一个宏观的现象,因此KPI类语音质量问题的分析思路是选取TOP小区或典型小区,对语音业务关键指标、影响语音指标的关联KPI进行分析,确认是否是由于小区负荷、容量、干扰或RBLER等因素导致语音质量问题。

一、语音关键KPI分析

 

1、语音业务的上下行丢包率

影响语音质量最直接因素是丢包,如果丢包率超过一定值或者存在连续丢包就会影响语音质量,对于语音质量问题可以根据如下话统日志进行确认:

指标名称

指标描述

L.Traffic.UL.PktLoss.Loss.QCI.1

小区QCI为1的DRB业务PDCP SDU上行丢弃的总包数

L.Traffic.UL.PktLoss.Tot.QCI.1

小区QCI为1的DRB业务上行期望收到的总包数

L.Traffic.DL.PktUuLoss.Loss.QCI.1

小区QCI为1的DRB业务PDCP SDU下行空口丢弃的总包数

L.Traffic.DL.PktUuLoss.Tot.QCI.1

小区QCI为1的DRB业务PDCP SDU下行空口发送的总包数

L.PDCP.Tx.Disc.Trf.SDU.QCI.1

小区QCI为1的业务PDCP层下行丢弃的业务SDU数

 

QCI1业务上行空口丢包率 = [小区QCI为1的DRB业务PDCP SDU上行丢弃的总包数]/[小区QCI为1的DRB业务PDCP SDU上行期望收到的总包数]

QCI1业务下行空口丢包率 = [小区QCI为1的DRB业务PDCP SDU下行空口丢弃的总包数]/([小区QCI为1的DRB业务PDCP SDU下行空口发送的总包数]-[QCI为1的业务PDCP层下行丢弃的业务SDU数])

上行丢包在eNodeB PDCP层根据语音包的PDCP SN号统计。举例:基站收到第一包数据的SN号是1,下一包数据期望收到的SN号是2,但实际收到的数据的SN号是3,此时认为数据包SN号为2的丢弃。因为上行是对最终接收到的结果进行统计,所以各种原因(PDCP超时丢弃类、重传达最大次数类)导致的丢包都包含在里面。

下行由于在终端侧进行接收,eNodeB无法统计到最终的丢包结果,只能根据处理过程进行统计。下行丢包分两部分统计,两部分是独立的,第一部分是空口丢包,如果HARQ超过最大重传次数仍然发送失败,则统计为空口丢包;第二部分是eNodeB的PDCP缓存超时丢包,即在空口下发之前,由于PDCP丢弃定时器超时等原因导致的eNodeB内部丢包。

2、语音业务建立成功率

通过如下性能指标可以监控VoLTE业务的承载建立成功率:

指标名称

指标描述

L.E-RAB.AttEst.QCI.1

小区发起建立QCI为1的E-RAB的尝试次数

L.E-RAB.AttEst.QCI.5

小区发起建立QCI为5的E-RAB的尝试次数

L.E-RAB.SuccEst.QCI.1

小区发起建立QCI为1的E-RAB的成功次数

L.E-RAB.SuccEst.QCI.5

小区发起建立QCI为5的E-RAB的成功次数

 

QCI1承载建立成功率 = L.E-RAB.SuccEst.QCI.1 / L.E-RAB.AttEst.QCI.1

QCI5承载建立成功率 = L.E-RAB.SuccEst.QCI.5 / L.E-RAB.AttEst.QCI.5

3、语音业务掉话率

通过如下性能指标可以监控VoLTE业务的掉话率:

指标名称

指标描述

L.E-RAB.Rel.S1Reset.eNodeB.QCI.1

eNodeB发起的S1 RESET导致的QCI为1的E-RAB异常释放次数

L.E-RAB.AbnormRel.eNBTot.QCI.1

eNodeB触发的QCI为1的业务E-RAB异常释放次数

L.E-RAB.AbnormRel.HOOut.QCI.1

切换出QCI为1的E-RAB异常释放次数

L.E-RAB.SuccEst.QCI.1

QCI为1的业务E-RAB建立成功次数

L.E-RAB.Left.QCI.1

QCI为1的遗留E-RAB个数

L.E-RAB.SuccEst.HOIn.QCI.1

QCI为1的切换入E-RAB成功建立次数

 

("L.E-RAB.Rel.S1Reset.eNodeB.QCI.1"+"L.E-RAB.AbnormRel.eNBTot.QCI.1"+"L.E-RAB.AbnormRel.HOOut.QCI.1")/("L.E-RAB.SuccEst.QCI.1"+"L.E-RAB.Left.QCI.1"+"L.E-RAB.SuccEst.HOIn.QCI.1")*100

4、呼叫平均保持时长

通过该指标可以显示小区的VoLTE话务模型

指标名称

指标描述

L.E-RAB.SessionTime.QCI1

小区QCI为1的业务有数据传输总时长

L.Traffic.DRB.QCI.1

小区QCI为1的DRB的个数

 

小区内的平均通话时长时间=L.E-RAB.SessionTime.QCI1/L.Traffic.DRB.QCI.1

5、下行语音包处理时延

通过如下性能指标可以监控VoIP业务下行包处理平均时延,时延指标是影响语音质量的重要因素,时延指标是影响语音质量的重要因素,时延越大包延时大影响感知:

指标名称

指标描述

L.Traffic.DL.PktDelay.Time.QCI.1

小区QCI为1的业务下行数据包处理总时延

L.Traffic.DL.PktDelay.Num.QCI.1

小区QCI为1的业务下行成功发送的PDCP SDU的包数

 

QCI1业务下行包处理平均时延 = L.Traffic.DL.PktDelay.Time.QCI.1 / L.Traffic.DL.PktDelay.Num.QCI.1,当语音业务打开DRX时下行平均时延会增加。上行由于是终端发送所以无法统计。

6、 VoLTE用户数监控

可以用L.Traffic.DRB.QCI.1这个指标观测:

指标名称

指标描述

L.Traffic.User.VoIP.Avg

小区内的平均VOIP用户数

L.Traffic.User.VoIP.Max

小区内的最大VOIP用户数

 

7、切换成功率监控

换失败是影响VoLTE业务感知的重要因素:

指标名称

指标描述

L.HHO.IntraeNB.IntraFreq.PrepAttOut.VoIP   

小区eNodeB内语音业务同频切换出尝试次数           

L.HHO.IntraeNB.InterFreq.PrepAttOut.VoIP   

小区eNodeB内语音业务异频切换出尝试次数           

L.HHO.IntraeNB.InterFddTdd.PrepAttOut.VoIP

小区eNodeB内语音业务FDD/TDD模式间切换出尝试次数  

L.HHO.IntraeNB.IntraFreq.ExecAttOut.VoIP   

小区eNodeB内语音业务同频切换出执行次数           

L.HHO.IntraeNB.InterFreq.ExecAttOut.VoIP   

小区eNodeB内语音业务异频切换出执行次数           

L.HHO.IntraeNB.InterFddTdd.ExecAttOut.VoIP

小区eNodeB内语音业务FDD/TDD模式间切换出执行次数  

L.HHO.IntraeNB.IntraFreq.ExecSuccOut.VoIP  

小区eNodeB内语音业务同频切换出成功次数           

L.HHO.IntraeNB.InterFreq.ExecSuccOut.VoIP  

小区eNodeB内语音业务异频切换出成功次数           

L.HHO.IntraeNB.InterFddTdd.ExecSuccOut.VoIP

小区eNodeB内语音业务FDD/TDD模式间切换出成功次数  

L.HHO.IntereNB.IntraFreq.PrepAttOut.VoIP   

小区eNodeB间语音业务同频切换出尝试次数           

L.HHO.IntereNB.InterFreq.PrepAttOut.VoIP   

小区eNodeB间语音业务异频切换出尝试次数           

L.HHO.IntereNB.InterFddTdd.PrepAttOut.VoIP

小区eNodeB间语音业务FDD/TDD模式间切换出尝试次数  

L.HHO.IntereNB.IntraFreq.ExecAttOut.VoIP   

小区eNodeB间语音业务同频切换出执行次数           

L.HHO.IntereNB.InterFreq.ExecAttOut.VoIP   

小区eNodeB间语音业务异频切换出执行次数           

L.HHO.IntereNB.InterFddTdd.ExecAttOut.VoIP

小区eNodeB间语音业务FDD/TDD模式间切换出执行次数  

L.HHO.IntereNB.IntraFreq.ExecSuccOut.VoIP  

小区eNodeB间语音业务同频切换出成功次数           

L.HHO.IntereNB.InterFreq.ExecSuccOut.VoIP  

小区eNodeB间语音业务异频切换出成功次数           

L.HHO.IntereNB.InterFddTdd.ExecSuccOut.VoIP

小区eNodeB间语音业务FDD/TDD模式间切换出成功次数  

 

8、语音质量监控

通过如下性能指标可以监控VoLTE业务上下行QoS的分布情况:

指标名称

指标描述

L.Voice.VQI.UL.Excellent.Times

上行语音质量为Excellent所发生的次数

L.Voice.VQI.UL.Good.Times

上行语音质量为Good所发生的次数

L.Voice.VQI.UL.Accept.Times

上行语音质量为Accept所发生的次数

L.Voice.VQI.UL.Poor.Times

上行语音质量为Poor所发生的次数

L.Voice.VQI.UL.Bad.Times

上行语音质量为Bad所发生的次数

L.Voice.VQI.DL.Excellent.Times

下行语音质量为Excellent所发生的次数

L.Voice.VQI.DL.Good.Times

下行语音质量为Good所发生的次数

L.Voice.VQI.DL.Accept.Times

下行语音质量为Accept所发生的次数

L.Voice.VQI.DL.Poor.Times

下行语音质量为Poor所发生的次数

L.Voice.VQI.DL.Bad.Times

下行语音质量为Bad所发生的次数

L.Voice.E2EVQI.Excellent.Times

VQI评估语音质量为Excellent的次数

L.Voice.E2EVQI.Good.Times

VQI评估语音质量为Good的次数

L.Voice.E2EVQI.Accept.Times

VQI评估语音质量为Accept的次数

L.Voice.E2EVQI.Poor.Times

VQI评估语音质量为Poor的次数

L.Voice.E2EVQI.Bad.Times

VQI评估语音质量为Bad的次数

L.Voice.E2EVQI.AMRWB.Excellent.Times

VQI评估AMR-WB业务语音质量为Excellent的次数

L.Voice.E2EVQI.AMRWB.Good.Times

VQI评估AMR-WB业务语音质量为Good的次数

L.Voice.E2EVQI.AMRWB.Accept.Times

VQI评估AMR-WB业务语音质量为Accept的次数

L.Voice.E2EVQI.AMRWB.Poor.Times

VQI评估AMR-WB业务语音质量为Poor的次数

L.Voice.E2EVQI.AMRWB.Bad.Times

VQI评估AMR-WB业务语音质量为Bad的次数

 

9、重建比例

发生重建时,重建时延会导致VoLTE业务包超时而丢包,所以小区的重建比例高会影响VoLTE的业务体验:

指标名称

指标描述

L.RRC.ReEst.Att

RRC重建请求次数

L.RRC.ConnReq.Att

RRC连接请求次数(不包括重发)

 

RRC连接重建比率 = "L.RRC.ReEst.Att"/("L.RRC.ConnReq.Att"+"L.RRC.ReEst.Att")*100

10、语音单通和质量差挂机

 

指标名称

指标描述

L.Voice.NormRel.UL.LowQuality

小区中语音呼叫正常释放的次数(上行语音质量差)

L.Voice.NormRel.DL.LowQuality

小区中语音呼叫正常释放的次数(下行语音质量差)

L.Voice.UL.Silent.Num

小区中语音呼叫上行发生静音的次数

L.Voice.DL.Silent.Num

小区中语音呼叫下行发生静音的次数

 

二、关联话统分析

除了上述语音业务关键指标外,影响语音指标的因素还有小区负荷/容量、干扰、RBLER等,通过对这些影响因素的话统指标进行分析,可以确认是否是这些因素导致了语音丢包、SIP流程失败等。下面列出了语音业务相关的话统列表:

KPI名称

KPI字段

KPI公式

分析方法

用户数

L.Traffic.User.VoIP.Avg/L.Traffic.User.VoIP.Max/L.Traffic.User.Avg/L.Traffic.User.Max

做一个关于用户数和语音丢包率的散点图,看丢包率是否在用户数增加的时候出现抬升。

也可以用曲线图,看用户数的变化趋势是否与语音丢包率变化趋势一致。

PUSCH Mcs0阶占比

ratio of PUSCH MCS0

L.ChMeas.PUSCH.MCS.0/SUM(L.ChMeas.PUSCH.MCS.0~ L.ChMeas.PUSCH.MCS.31)

上行语音丢包率恶化需要分析该KPI指标。如果该指标抬升,说明存在弱覆盖或者通过PUSCH干扰折算值确认干扰情况

PDSCH Mcs0阶占比

ratio of PDSCH MCS0

L.ChMeas.PDSCH.MCS.0/SUM(L.ChMeas.PDSCH.MCS.0~ L.ChMeas.PDSCH.MCS.31)

下行语音丢包率恶化需要分析该KPI指标。如果该指标抬升,说明存在弱覆盖或者通过PDSCH干扰折算值确认干扰情况

UL RBLER

PUSCH RBLER

(L.Traffic.UL.SCH.16QAM.ErrTB.Rbler + L.Traffic.UL.SCH.QPSK.ErrTB.Rbler) / (L.Traffic.UL.SCH.16QAM.TB + L.Traffic.UL.SCH.QPSK.TB)

由于QCI1在RLC层是UM模式,因此当出现空口误码,那么语音包就会被丢弃。该KPI反应上行空口误码情况,但是不区分QCI1业务和其他业务。观察该KPI的曲线图,如果该KPI的变化趋势与上行语音丢包率的变化趋势一致,可进一步分析上行空口干扰、覆盖等情况。

DL RBLER

PDSCH RBLER

(L.Traffic.DL.SCH.QPSK.ErrTB.Rbler + L.Traffic.DL.SCH.16QAM.ErrTB.Rbler + L.Traffic.DL.SCH.64QAM.ErrTB.Rbler) / (L.Traffic.DL.SCH.QPSK.TB + L.Traffic.DL.SCH.16QAM.TB + L.Traffic.DL.SCH.64QAM.TB)

该KPI反应下行空口误码情况,但是不区分QCI1业务和其他业务。观察该KPI的曲线图,如果该KPI的变化趋势与下行语音丢包率的变化趋势一致,可进一步分析下行空口干扰、覆盖等情况。

上行PRB利用率

UL PRB Usage Rate

L.ChMeas.PRB.UL.Used.Avg/总RB数

该KPI反应资源利用情况,如果该KPI的变化趋势与下行语音丢包率的变化趋势一致,即资源利用率抬升时,丢包率也抬升了,那么需要分析用户数情况,是否是用户数增强导致;或者是修改某参数,使得某些特性生效,导致PRB利用率抬升。

下行PRB利用率

DL PRB Usage Rate

L.ChMeas.PRB.DL.Used.Avg/总RB数

CCE利用率

PDCCH CCE Usage Rate

("L.ChMeas.CCE.CommUsed" + "L.ChMeas.CCE.ULUsed" + "L.ChMeas.CCE.DLUsed") / "L.ChMeas.CCE.Avail"

PDCCH DTX率

PDCCH DTX Ratio

SUM(L.ChMeas.PDCCH.DL.DTXNum.AggLvl1~ L.ChMeas.PDCCH.DL.DTXNum.AggLvl8)/SUM(L.ChMeas.PDCCH.AggLvl1Num~ L.ChMeas.PDCCH.AggLvl8Num)

该KPI偏高时,可关联分析上行和下行的干扰情况。

PUCCH干扰折算值

Avg PUCCH Inteference

SUM(-121*L.UL.Interference.PUCCH.Index0- 120*L.UL.Interference.PUCCH.Index1-119* L.UL.Interference.PUCCH.Index2-…-92* L.UL.Interference.PUCCH.Index15)/SUM(L.UL.Interference.PUCCH.Index0~ L.UL.Interference.PUCCH.Index15)

分析干扰是否高,排查是否由于高干扰导致的语音质量变差。

PUSCH干扰折算值

Avg PUSCH Inteference

SUM(-121*L.UL.Interference.PUSCH.Index0- 120*L.UL.Interference.PUSCH.Index1-119* L.UL.Interference.PUSCH.Index2-…-92* L.UL.Interference.PUSCH.Index15)/SUM(L.UL.Interference.PUSCH.Index0~ L.UL.Interference.PUCCH.Index15)

平均CQI

CQI Avg

(0* L.ChMeas.CQI.DL.0+1* L.ChMeas.CQI.DL.1+…+15* L.ChMeas.CQI.DL.15)/SUM(L.ChMeas.CQI.DL.0+ L.ChMeas.CQI.DL.1+…+ L.ChMeas.CQI.DL.15)

反应下行信道质量

 

三、KPI指标异常的判断方法

 

分析要素

判断准则

涉及指标定义

根因

资源与容量

用户数出现抬升5%以上

L.Traffic.User.Avg

L.Traffic.User.Max

L.Traffic.User.VoIP.Avg

L.Traffic.User.VoIP.Max

1)客户放号,转网,重大集会等外部事件影响。

2)异频,异系统切换,负载均衡或重选门限,优先级相关参数发生变更。

3)现网策略导致某频点用户数增加。

CCE利用率抬升至70%

PDCCH CCE Usage Rate抬升至70%以上

1)客户放号,转网,重大集会等外部事件影响;导致突发大话务。

2)PDCCH DTX和上行RBLER上升,导致调度增加,信令资源开销增加,结合用户数分析,并确认是否是干扰抬升所致。

上/下行PRB利用率抬升超过60%

UL/DL PRB Usage Rate抬升超过60%

1)用户数抬升。

2)弱覆盖用户数增加。

VoLTE业务平均PRB下降

L.ChMeas.PRB.UL.DrbUsed.Avg.VoIP/L.ChMeas.PRB.DL.DrbUsed.Avg.VoIP

1)现网切换等参数变更,导致VoLTE用户下降;2)其他业务带来的影响

调度能力

[话统]CCE利用率低于60%,但PDCP时延出现明显恶化。或者CCE资源优先受限导致PRB利用率不满

PDCCH CCE Usage Rate

Packet Delay in the DL

或PDCCH CCE Usage Rate高于90%,但PRB利用率低于80%

1)DRX开启后导致调度拥塞

VoIP业务使用的CCE个数下降

L.ChMeas.CCE.ULUsed.VoIP/L.ChMeas.CCE.DLUsed.VoIP

1)其他业务的业务量变化占用CCE资源

2)客户放号,转网,重大集会等外部事件影响;导致突发大话务。

3)PDCCH DTX和上行RBLER上升,导致调度增加,信令资源开销增加,结合用户数分析,并确认是否是干扰抬升所致。

覆盖

平均CQI出现下降0.5以上

CQI Avg/各CQI比例分布统计

功率/切换参数变化/特性参数修改

编码效率

上行或下行MCS出现明显恶化/低阶MCS占比抬升

PUSCH MCS Avg(eRAN 3.0)
PDSCH MCS Avg(eRAN 3.0)

MCS各阶比例分布统计

1)、覆盖与干扰恶化

2)、特殊调度比例增加

3)、打开降阶扩RB优化等方案

4)、用户分布发生变化

小区PDCCH DTX概率出现明显恶化

PDCCH DTX Ratio抬升

1)打开PUSCH DTX检测开关

2)功控参数调整

3)外部干扰

4)SR虚警

小区上/下行IBLER和RBLER出现明显恶化

PUSCH RBLER/PDSCH RBLER明显抬升

1)打开PUSCH DTX检测开关

2)功控参数调整

3)外部干扰

4)(DRX状态下)SR虚警

干扰

小区干扰底噪出现抬升3dB以上/PUCCH平均干扰出现恶化/PUSCH平均干扰出现恶化

L.UL.Interference.Avg

Avg PUCCH Inteference

Avg PUSCH Inteference

1)内部、外部干扰

2)现网策略与参数配置不合理,导致某小区或频点用户数增加,造成干扰抬升

3)功控参数修改

传输

下行语音包发包总数下降

L.Traffic.DL.PktUuLoss.Tot.QCI.1

若S1接口激活了IPPM,查看指标:VS.IPPM.Forword.DropMeans、VS.IPPM.Forword.Peak.DropRates,如果峰值丢包大于0.5%,则认为可能跟传输链路异常相关;
 若S1接口未激活IPPM,需查看指标:VS.IPPath.TxDropPkts、 VS.IPPath.RxDropPkts,如果存在连续丢包,则认为跟IPPATH链路异常相关。

同时,相关指标出现异常的时间点应与下行语音包发包总数下降的时间点一致。

语音增强特性

RoHC解压缩失败率恶化

L.PDCP.UL.RoHC.FailDecompRatio出现明显抬升

1)ROHC异常;2)终端兼容性问题

TTIB进/出消息个数增加

L.Signal.Num.TtiBundling.Enter/L.Signal.Num.TtiBundling.Exit

1)TTIB配置不合理;2)信道质量波动;3)终端兼容性问题

SPS调度传输失败次数

L.Sps.UL.ErrNum/L.Sps.DL.ErrNum/L.Sps.UL.TB.Intvl40ms.Err

1)与其他特性配合问题;2)信道质量突变;3)终端兼容性问题。