查看原文
其他

基于自智网络的5G业务质量端到端分析方案研究与实践

徐仕成 中移智库
2024-09-17
摘要开展5G业务质量端到端分析是运营商提升5G用户感知的重要抓手。针对传统业务质量端到端分析高度依赖固化专家规则的不足,采用规则引擎、AI中台、智能化调度等技术方案,构建5G业务质差识别、质差定界定位、闭环管理、效果分析、模型迭代的“五阶闭环自智流程”,对自智网络的5G业务质量端到端分析方案进行研究与实践,实现高效的自智化协同,保障5G业务用户感知。
5G网络面临组网结构复杂、网络建设和运维困难、业务质量分析优化难以把握等问题,需要建立一套以 5G 客户感知为中心的业务质量端到端分析体系,实现业务质量自动化分析和优化,提高5G网络的服务质量和用户体验。同时,随着人工智能领域研究的深入和企业数字化转型浪潮的袭来,运营商对网络的自动化和智能化重视程度越来越高,因此在构建业务质量端到端分析的同时,也需要考虑如何通过自智网络赋能,在两者结合方面做更深入的研究和实践。
01
现状及面临的挑战
自智网络发展现状
自智网络是通过广泛使用人工智能(artificial intelligence,AI)技术,将AI技术深度嵌入网络的各层面,使网络具备自配置、自优化、自愈合和自演进等能力,提供端到端质量保障和用户满意度管理。面向用户主要实现“Zero-X”和“Self-X”目标,使用户获得“零等待、零接触、零故障”的服务体验,使网络具备“自服务、自发放、自保障”的能力【1,2,3】
目前,产业界已经形成了关于自智网络的共识和标准,自智网络能力分级标准已经基本统一,包括L1辅助运维网络、L2部分自智网络、L3有条件自智网络、L4高度自智网络以及L5完全自智网络。目前全球主流运营商,基本已经达成了到2025年实现L4高度自智网络的发展目标与规划【4,5,6】
业务质量端到端分析对自智网络的需求
AI作为一种新兴技术,在图像处理、自然语言识别、电子游戏等领域已经有广泛的应用划【7,8】,而在运营商5G领域,AI技术正在成为行业的核心驱动力。为了保证业务质量,需要对5G承载的视频、游戏、即时通信等业务进行业务质量分析,同时由于用户的业务质量涉及的环节较多、链路较长,以视频业务体验为例,相关链路贯穿无线信号质量、基站设备、核心网网元、服务提供商(service provider,SP)等多个环节,需要构建端到端的业务质量分析能力,才能对视频业务质量进行监测、评估和优化。
面临的挑战
传统的业务质量端到端分析方案,以人工或固化专家经验为主,不具备与自智网络相关的能力。近几年,运营商已开始逐步引入自智网络理念并进行端到端分析能力提升划【9,10】。在 5G 业务质量端到端分析的自智网络能力中,一般视频业务质差识别等子场景可看作一个点,视频业务的质差识别、质差定界定位、闭环管理等子场景构成一条线,涵盖视频、游戏、浏览等多个业务类别的质差识别、质差定界定位、闭环管理自智能力形成一个面。但当前更多关注各个点的自智能力提升达到单个点注智的目的,但离散的点状升级缺乏各场景间的相互影响和协同,并不能从根本上提升整个业务质量端到端的自智网络能力,对实际生产的支撑能力有限。如何在实践中将自智网络能力从单点注智提升扩展到业务线甚至业务面,并在实际生产中取得更好的效果存在不少挑战。

02
方案体系建设
方案目标

基于自智网络的业务质量端到端方案,实现面向用户、面向网络、面向业务的业务质量端到端分析,同时从自智网络的视角贯穿业务质量端到端各场景,实现整条生产流的自智能力打通,在提升各环节自智网络能力的同时,更好地提升业务质量端到端的管理能力,将自智能力从业务点扩展到业务线、业务面,确保快速发现问题、准确分析问题、及时验证问题、不断迭代,真正展现动态联动、相互影响、高效协同的特点。

方案建设内容

在数据驱动和AI赋能下,设计业务质量端到端方面的自智网络实现方式及模型,搭建各业务感知指标体系,设计功能框架,提炼业务质量端到端生产流的关键场景。

基于实践构建贯穿整条流程的自智网络方案体系,通过规则引擎、AI中台、智能化调度等关键技术,实现规则与功能解耦、业务能力的快速定制,打造各环节的自智化联动,实现可配置、可优化、可愈合和可演进的自智网络能力,确保快速发现问题、准确分析问题、及时验证问题、效果总结、不断迭代,持续优化自智网络水平。

业务自智流程

5G业务质量端到端的分析过程,同大多数问题分析的过程类似,一般都涉及问题发现、问题分析、问题解决3个环节,5G业务质量端到端分析也包括这3个环节或场景。以5G视频业务质量分析为例,在实践中因为业务质量问题发现和分析的复杂性,质差识别和质差定界定位结果不一定很准确,业务闭环率低,闭环效果不理想划【11】。因此仅针对以上子场景自智能力进行提升,只是增加了单个子场景的规则解耦能力或引入 AI 能力,并不能实现视频业务端到端分析效果的提升。

仅针对子场景自智能力进行提升,不能达到理想的效果,主要由两个原因造成:一是同一种业务的不同子场景间没有横向拉通形成闭环反馈机制,处理结果不能对问题识别和问题定位形成修正,没有形成由点到线的环状拉通;二是纵向没有形成单个业务线到业务面的扩展覆盖,涵盖视频、游戏、浏览、云游戏、高清视频等业务。

为了形成点-线-面全面覆盖的业务质量端到端分析的关键场景,业务质量端到端分析的关键场景如图1所示,需要在上述3个关键场景的基础上,引入效果分析和模型迭代,对记录问题的解决过程和结果形成反馈机制,为各环节规则、模型持续改进提供数据支持,构建可以涵盖多类业务的质差识别、质差定界定位、闭环管理、效果分析、模型迭代的“五阶闭环自智流程”,如图2所示,在整个流程面中构建可配置、可迭代的自智网络能力,使业务质量端到端分析的过程滚动起来,实现各环节的自智化联动,在普遍实现可配置的基础上,为自智网络能力向可优化、可愈合和可演进提供可能,确保快速发现问题、准确分析问题、及时验证问题、效果总结、不断迭代,优化自智网络能力。

功能架构

基于自智网络理念,构建基于自智网络的业务端到端系统,系统功能架构如图3 所示,形成面向5G网络的“用户、网络、业务”三位一体的上层应用,实现客户感知问题发现、处理、闭环管理的自动化、智能化,基于自智网络能力,横向拉通同一业务的不同场景,形成由点到线的环状拉通,纵向管理不同业务,形成由业务线扩展到业务面的广覆盖。

关键技术

规则引擎实现灵活配置

在系统开发时,业务逻辑和数据处理逻辑通常融合在一起,如果通过程序开发实现业务逻辑,每一次业务需求细节变化,如指标项、阈值门限、权重值、业务判断规则等调整时都需要程序改造,人工消耗大、周期长划【12】。本文构建如图4所示的规则引擎实现规则与功能分离,支撑各个场景功能的规则与程序解耦,基于可视化低代码的配置化方式进行规则制定和流程编排,实现规则解耦、流程挖掘、流程迭代,为复杂的自智网络决策和场景提供支持。

AI中台赋能场景调用

构建AI中台,内嵌多种AI技术(如机器学习、自然语言处理、计算机视觉等),集成和封装为自化组件,提供模型预测、语音赋能、解析能力等核心功能,支持业务质量端到端各场景的AI能力调用划【13,14】。AI中台功能介绍如图5所示,这些功能不仅可以提高业务效率和质量,降低人力成本和风险,还可以通过对外接口调用的能力,为自智网络场景赋能,实现跨节点、跨场景、跨业务的AI能力服务协同和创新。

智能化调度达成任务自智管理

智能化调度融合了与自智网络相关的自动化任务的调度能力,对组件、包、执行节点资源进行有序管理,提供任务状态、任务执行结果等信息的统一管理、图表展示。主要包括以下3个方面功能。

(1)任务管理:针对目标任务,智能化管家会根据用户的需求和资源情况,自动分配和调度执行节点,实现高效和稳定的任务执行,同时还会实时监控和管理任务状态,收集执行结果,并以图表形式展示,方便查看和分析。

(2)组件管理:可以对封装一套操作的组件进行管理,用户可以查看组件的版本、属性描述等信息,并可以根据需要更新或删除组件。

(3)自智任务管理:每个任务是由多个组件组成的一个完整的自动化流程,可以实现复杂的功能或目标,用户可对各自智任务进行灵活管理。

03
应用实践
基于自智网络的游戏业务质量端到端分析
移动互联网游戏是利用手机、平板计算机等移动终端作为载体,通过移动网络和宽带等高速传输链路,为用户提供丰富多样的游戏体验。随着终端性能的提升,移动游戏分类从早期的棋牌、益智类游戏发展到今天百花齐放的态势,为了保证移动互联网游戏的业务质量,需要对游戏业务进行质量分析,同时由于游戏等数据业务涉及的环节较多、链路较长,贯穿无线信号质量、传输设备、核心网网元、SP服务器等多个环节,需要构建覆盖多个环节的游戏业务端到端质量分析能力,才能对移动互联网游戏业务质量进行更好的监测、评估和优化。
搭建游戏指标体系
移动互联网游戏相对计算机游戏最大的挑战在于移动网络的不稳定性,且具有突发性和小流量等特点,为了增强用户在游戏中的体验,需要构建针对移动互联网游戏的关键质量指标(key quality indicator,KQI)体系的建立。
游戏业务模型特征如图6 所示,一般来说,游戏可以分为登录阶段、加载阶段、游戏阶段、游戏社交阶段,主要关注时延和抖动类指标。登录阶段一般通过超文本传输协议(hyper text transfer protocol,HTTP)从服务器下载游戏所需资源。游戏过程的交互是影响游戏用户体验的关键阶段,交互阶段协议以传输控制协议(transmission control protocol,TCP)为主,也有少量游戏使用用户数据报协议(user datagram protocol,UDP)交互,需要保证TCP或UDP交互包快速有效传输,游戏交互内容一般包括游戏过程中产生的位置移动、技能使用等。游戏的社交行为,主要是玩家相互发送信息。
构建游戏业务自智流程
在5G游戏业务质量分析过程中,梳理了游戏业务的质差识别、质差定界定位、闭环管理、效果分析、模型迭代的“五阶闭环自智流程”,通过效果分析和模型迭代的引入,业务质量端到端分析的过程滚动起来,并实现各环节的自智化联动,实现关键场景自智网络能力的横向拉通;同时对游戏业务进一步细化区分,如细分出王者荣耀、原神等热门游戏,采用规则引擎、AI 中台、智能化调度等技术方案,对不同游戏实现自智网络能力的纵向管理。为游戏业务质量端到端分析的自智网络能力向可优化、可愈合和可演进提供可能,确保快速发现问题、准确分析问题、及时验证问题、效果总结、迭代优化自智网络水平。

(1)质差识别

在深度包检测(deep packet inspection,DPI)数据中识别的游戏业务,包括王者荣耀、原神等游戏小类,并基于构建好的游戏业务质量评估体系识别游戏业务的质差问题,如王者荣耀游戏交互时延高等问题。质差识别阶段通过规则引擎实现灵活的规则配置,游戏业务质差识别规则如图7所示,主要分为基础规则层、规则合成层和判决层 3 个部分,通过指标劣化条件、各指标权重、阈值等实现L3级自智网络能力的质差识别,通过AI中台调用实现L4级自智网络能力的质差识别。

(2)质差定界定位

针对发现的游戏业务质量问题,如王者荣耀游戏交互时延高,开展端到端定位,支持定位条件、定位顺序等内容的灵活配置,最终输出终端、无线、核心网、业务侧等劣化根因。定位过程通过定位条件、定位顺序等内容的灵活配置,实现自智网络 L3 级质差定界定位,同时也可以基于AI 中台调度 AI 模型,直接输出定位结果,实现自智网络L4级质差定界定位。

(3)闭环管理

对派发问题进行管理,随时查看问题处理状态。支持派单规则及效果验证规则的可配置,包含业务指标门限、观测时长、观测频次等,实现L3级自智网络能力的闭环管理。

(4)效果分析

评估工单处理效果,检验其是否达到预期效果,针对效果不理想的工单进行深入分析,收集一线处理人员反馈,挖掘原因,找出质差识别规则及模型的短板,以及质差定界定位规则及模型的不足,为后续的问题发现和分析提供参考。

(5)模型迭代

基于效果分析的结论,评估问题识别是否精准、问题定位是否准确、闭环规则是否合理、效果评估是否客观,不断对各阶段进行修正和改进,对质差识别、质差定界定位的规则或模型进行迭代。

游戏业务应用效果

通过基于自智网络的移动网游戏业务质量端到端分析能力构建,搭建游戏业务问题质差识别、质差定界定位、闭环管理、效果分析、模型迭代的“五阶闭环自智流程”,使游戏业务分析效能有了较大提升,取得了以下应用效果。

(1)网络问题处理效率提升

建立游戏业务特有的指标分析体系,将海量游戏业务记录转换为用户游戏业务感知数据,融入自智网络的AI能力,对海量数据进行训练,实现游戏业务质差识别、质差定界能力的大幅提升,游戏业务质差识别的精准度提升41.82%,质差定位的准确性提升30.26%,同时在闭环管理环节对各类网络质差分类专项推进,累积处理感知质差小区893个、质差网元4个,问题闭环管理的效率提升38.76%。

(2)潜在不满意用户比例减小

依据网络处理效果,不断迭代、优化质差识别模型,将识别出的游戏业务感知数据,汇聚到个体用户,挖掘出大量游戏业务潜在不满意用户,进行及时的回访及关怀,累计点对点回访游戏潜在不满意客户17 932人,针对游戏业务的调研满意度提升了18.32%。

(3)投诉明显下降

对于投诉用户,因为质差识别快速回溯用户感知、质差定界快速诊断问题原因,投诉问题流转进入闭环管理流程,聚集类、高发类等问题作为重点事项推进,大大降低了问题处理的时间,提升了投诉用户感知。自应用以来,公司2023年5G 网络类游戏业务投诉万投比降幅为 26.72%,重复投诉率下降34.29%。

04
结束语
践行“自智网络”理念,聚焦业务质量端到端关键环节,采用规则引擎、AI中台、智能化调度等技术方案,在对业务质差识别、业务质差定界定位、问题闭环管理实现自智网络等级提升的同时,构建了贯穿业务质量端到端关键场景的自智网络方案体系,通过“五阶闭环自智流程”实现各环节的自智化协同,实现业务质量端到端整条生产流的自智能力提升,提升了用户业务感知。

当前人工智能还处于高速发展阶段,自智网络的实现程度与理想中的演进目标还有较大差距,距离全面实现L4甚至L5还有非常多的细分场景、非常多的困难需要攻克。基于自智网络业务质量端到端分析将是 5G 时代提升用户业务感知的一个关键点,后续还需要不断探索、实践。

【参考文献】
[1] TMF. TMF autonomous networks white paper[R]. 2022.
[2] 欧阳晔, 王立磊, 杨爱东, 等. 通信人工智能的下一个十年[J].电信科学, 2021, 37(3): 1-36.OUYANG Y, WANG L L, YANG A D, et al. Next decade of telecommunications artificial intelligence[J]. Telecommunications Science, 2021, 37(3): 1-36.
[3] 李涛, 王春佳, 李姗姗. 电信网络智能化方案研究[J]. 电信科学, 2023, 39(3): 162-172.LI T, WANG C J, LI S S. Research on intelligent scheme of telecommunication network[J]. Telecommunications Science, 2023, 39(3): 162-172.
[4] 中国移动通信集团有限公司中国移动自智网络白皮书[R].2022.China Mobile Communications Corporation Co., Ltd. ChinaMobile autonomous networks white paper[R]. 2022.
[5] 中国电信集团有限公司中国电信云网运营自智白皮书[R].2022.China Telecom Corp Ltd. China Telecom's autonomous cloud network white paper[R]. 2022.
[6] 中国联合网络通信集团有限公司. 中国联通自智网络白皮书3.0[R]. 2022.China United Network Communication Group Co., Ltd.. China Unicom's autonomous network white paper[R]. 2022.
[7] LUO G Y, YUAN Q, LI J L ,et al. Artificial intelligence powered mobile networks: from cognition to decision[J]. IEEE Network, 2021, 36(3): 136-144.
[8] LIN C Z, LU J W, WANG G, et al. Graininess-aware deep feature learning for robust pedestrian detection[J]. IEEE Transactions on Image Processing, 2020(29): 3820-3834.
[9] 任飞, 马又良, 李宏平, 等. 中国联通自智网络的理念和实践[J]. 通信世界, 2023(16): 15-17.REN F, MA Y L, LI H P, et al. The theories and practice of China Unicom on autonomous network[J]. Communications World, 2023(16): 15-17.
[10] 王禹蓉. 中国电信的云网运营自智之路[J]. 通信世界,Version:0.9 StartHTML:0000000105 EndHTML:0000007689 StartFragment:0000000141 EndFragment:00000076492023(16): 9-10.WANG Y R. The autonomous journey of cloud network operations for China Telecom[J]. Communications World, 2023(16):9-10.
[11] 罗锐, 黄鹂声, 张振宇, 等. 5G 网络环境下的网络视频质量分析[J]. 兰州交通大学学报, 2022, 41(6): 54-61.LUO R, HUANG L S, ZHANG Z Y, et al. The analysis of video quality in the 5G network environment[J]. Journal of Lanzhou Jiaotong University, 2022, 41(6): 54-61.
[12] 产院东, 郭乔进, 梁中岩, 等. 规则引擎发展综述[J]. 信息化研究, 2021, 47(2): 1-6. CHAN Y D, GUO Q J, LIANG Z Y, et al. A survey of rule engine[J]. Informatization Research, 2021, 47(2): 1-6.
[13] 朱明伟. 网络智能化中的 AI 工程化技术方案[J]. 电信科学, 2022, 38(2): 157-165.ZHU M W. AI engineering technology solutions in network intelligence[J]. Telecommunications Science, 2022, 38(2):157-165.
[14] 顾欣, 倪晓熔, 刘昭, 等. 电信运营商中台能力运营中心建设思路[J]. 电信科学, 2021, 37(6): 174-182.GU X, NI X R, LIU Z, et al. Construction ideas of middle platform operation center for telecom operators[J]. Telecommunications Science, 2021, 37(6): 174-182.

作者:徐仕成 中国移动通信集团湖南有限公司
来源:本文转自《电信科学》,2024,40(1): 162-170. Shicheng XU. A study and practice of end-to-end quality of service analysis scheme for 5G services based on autonomous network[J]. Telecommunications Science, 2024, 40(1): 162-170.




往期精彩


关于我们:中移智库以中国移动研究院为主体建设,广泛汇聚数字经济研究力量,着力提升政策性课题研究的专业性和权威性,并扩大研究成果的影响力、公信力、传播力,为数字经济的高质量发展贡献智慧力量。

继续滑动看下一个
中移智库
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存