指标分解

某一类KQI指标异常时,该类指标可能由很多不同业务组成,因此分析某一KQI指标时需将不同业务的该项指标一一分解,分析各类业务的该项KQI指标变化趋势,从而定界问题。

以业务下载速率为例,业务下载速率是指所有基于HTTP协议的业务,DO平台具体包括18大类业务,每一大类又分若干小类业务,每一小类业务都有相对应的业务下载速率。因此,可先通过上章节的对比分析定位是否为某大类业务的下载速率出现异常,然后再对比该大类业务下的小类业务,从而可定界是否为某一类业务低速率导致整体的速率降低。

DO平台业务分类截图:

 

即时通讯下小类业务对比分析图;

关联指标分析

某一类KQI指标异常时,同时需要关注该类指标的其它强相关性指标,比如网页成功率强相关指标包含:TCP建立成功率、DNS查询成功率、首GET响应成功率;速率方面强相关指标包含:用户数、小区流量、无线时延、上行丢包率与下行丢包率等;

以业务下载速率为例,分析与速率强相关的指标。

用户数分析:

低流量高用户小区分析,从下图的TOP小区可分析,EE兴隆庄D频ZL-132小区一天接入了约2.6万个用户,即使这些用户并非全部在该小区下做HTTP相关业务,单独其随机接入或者切换的信令就对该小区的速率造成严重影响(SRB业务的优先级比DRB业务的优先级高)。因此可通过此项分析定界低速率是否为高用户数导致;

低流量高用户小区DO平台截图:

 

小区流量分析:

高流量小区分析,从下图的TOP小区可分析,CC中国信息大学ZLM-2小区一天产生流量高达165818M流量,此类高流量的TOP小区平均业务下载速率必然会受到影响,因此,此类的TOP小区即可定界为单小区高流量导致。

高流量TOP小区DO平台截图:

 

无线时延分析:

业务下载速率与TCP时延成反比关系,即TCP时延越短,业务下载速率越高,可通过DO平台对各类业务的高时延区域或者小区进行分析,最终可定界是否由于无线时延过长导致低速率;

从下图可分析可知TCP无线时延对速率的影响较大,具体见下图:

TCP无线时延与业务下载速率关系图(统计样本4月15日至5月30日共计3484181个采样点):

 

TCP核心时延与业务下载速率关系图(统计样本4月15日至5月30日共计3484181个采样点):

 

高TCP无线时延低速率DO平台统计截图:

 

丢包率分析

丢包任何业务的影响巨大,DO平台可对每个小区的丢包率进行统计,通过对高丢包率的TOP小区进行针对性的S1抓包,即可定界是否为S1以上丢包或者S1以下丢包。

由于北京移动并未购买DO平台的此项license,因此未对此项功能进行深入分析(SQE平台可通过上行重传率、下行重传率代替,VMAX直接可统计上行丢包率和下行丢包率)。

丢包率统计截图,DO平台-扁平化查询-业务性能: