通信世界网消息(CWW)随着5G业务形态的多样化和业务需求的差异化,传统的网络架构及服务能力面临网络服务质量下降、运营成本与复杂度增加等诸多挑战。为此,国内外标准组织积极探索如何通过引入人工智能技术,实现通信网络的智能化、自优化运行。NWDAF是3GPP所定义的5G核心网网络功能,经过不断演进,已逐步形成完备的核心网运行智能能力体系,为驱动网络智能运行奠定了技术基础。本文回顾了NWDAF智能架构从集中式向分离式、分布式演进的过程,以及核心网运行智能标准的发展。最后,分析了网络运行智能所面临的“三结合”挑战,并展望了标准演进方向。
网络数据分析功能(Network Data Analytics Function, NWDAF)是5G核心网(5G Core Network,5GC)中的重要网络功能,可面向网络提供特定的智能分析服务。该网络功能作为5GC架构的一部分,由3GPP SA2工作组在3GPP Release 15(R15)中首次引入。然而,3GPP R15所定义的NWDAF仅支持网络切片负载分析,主要面向PCF和NSSF提供服务,功能单一,能力受限。
为进一步赋能网络,促进通信网络与人工智能要素(即数据、算力、算法)的深度融合,3GPP R16及之后的版本(R17、R18、R19),从智能架构、分析能力、服务范围、应用场景等不同层面对NWDAF进行了增强和优化,使其成为驱动网络智能运行的核心分析引擎(如图1所示)。
图1. 以NWDAF为核心的网络智能运行架构在此过程中,中国移动全面引领标准,承担了系统架构及接口设计的8个3GPP报告人职位,主导推动分布式智能架构、用户面智能、跨域联合智能等多项重点技术方向,为网络运行智能实现标准创新、凝聚产业共识,作出了突出贡献。
智能架构演进
R16定义了NWADF的集中式架构(如图2A所示)。在该架构中,NWDAF可通过调用对应的服务化接口,从5GC网络功能、AF或OAM中,定制化地采集网络数据;同时,该架构支持NWDAF以请求-反馈(单次发送)或订阅-通知(周期性/事件触发地持续发送)两种不同模式,向NWDAF服务消费者发送分析报告,包括基于历史数据的统计结果和对未来事件的预测分析。
图2. 集中式(R16)和训-推分离式(R17)的NWDAF服务架构R16定义的NWDAF架构虽能满足网络智能运行的基本数据分析要求,但在部署灵活性和可扩展性方面尚显不足。为此,由中国移动主导推动,R17对NWDAF进行了功能优化,创新性地定义了NWDAF的分析逻辑功能(Analytics Logical Function, AnLF)和模型训练逻辑功能(Model Training Logical Function, MTLF),实现了训-推分离式的NWDAF服务架构(如图2B所示)和训练平台化能力。每个NWDAF实体需集成至少一种逻辑功能。集成AnLF的NWDAF负责根据消费者请求,生成智能分析报告;集成MTLF的NWDAF负责为网络统计&预测分析提供AI模型训练和供给等服务。
同时,为保护数据隐私和提升分析效率,R17在训-推分离式架构基础上,创新性构建了支持多NWDAF协同的分层智能架构。如图3所示,该架构允许在PLMN(Public Land Mobile Network)内的不同层级部署多个具有不同分析能力的NWDAF。其中,具备分析聚合能力的NWDAF可作为分析聚合点。当聚合点NWDAF收到消费者的分析请求后,可向子节点NWDAF派发分析任务;子节点收到分析任务后,利用本地数据产生分析报告,并反馈给聚合点NWDAF;最终,由聚合点NWDAF执行分析聚合,产生最终的分析结果,反馈给分析消费者。
图3. 多NWDAF实例的分层智能架构此外,R17还通过引入由数据采集协调功能(Data Collection Coordination Function,DCCF)、消息框架适配器功能(Message Framework Adaptor Function,MFAF)和分析数据仓库功能(Analytics Data Repository Function,ADRF)等网络功能构成的数据管理框架,提升了网络数据采集和智能分析的执行效率(如图4所示)。其中,DCCF主要负责协调数据采集任务,以避免对相同数据的多次采集;MFAF主要负责消息框架和3GPP系统间的协议转换和信息交互,以降低NWDAF执行数据采集任务的通信开销;ADRF主要负责数据/分析报告的存储管理,以减轻NWDAF的数据存储负担。
图4. 增强的NWDAF数据采集框架R16与R17阶段的NWDAF仅支持集中式模型训练,难以充分发挥网络数据和算力优势。由中国移动牵头推动,R18提出了基于NWDAF的横向联邦架构(图5),可实现分布式联合学习。横向联邦架构为集成MTLF的NWDAF分配了两类角色,即中心服务器和参与服务器。其中,中心服务器负责参与服务器发现、模型训练任务派发和模型聚合,具有唯一性;参与服务器负责利用本地数据完成模型训练,并与中心服务器进行模型交互。此外,R18还引入了支持漫游交换能力的RE-NWDAF(Roaming Exchange NWDAF)作为分析数据或分析报告在不同PLMN中的接入点,从而实现跨PLMN的数据资源和分析能力开放。
图5. 支持横向联邦的NWDAF服务架构在R18横向联邦架构的基础上,R19围绕新应用场景及新技术方向,由中国移动主导定义纵向联邦架构,拓展了NWDAF的跨域联合学习能力。纵向联邦要求各节点训练集拥有处于不同特征空间的相同样本数据,有助于实现更深入的运营商数据价值挖掘和特征信息更丰富的模型构建。如图6所示,与横向联邦架构相比,纵向联邦架构允许第三方AF参与跨域模型构建及分析推理,使NWDAF具备了更加开放化的AI服务能力。
图6. 支持纵向联邦的NWDAF服务架构关键技术演进
随着3GPP等行业标准的演进,核心网运行智能在架构设计上由集中式向分离式发展、在模型构建上由单节点训练向分布式训练延伸、在应用场景上由单一化向多元化拓展,推动了网络数据能力、模型能力、协同能力和应用能力的提升。
数据能力
支撑网络运行智能的数据要素具有显著的多源异构和时序依赖特征,且生成速率快,对数据传输时延和可靠性的要求高。为此,核心网运行智能建立了定制化的高效数据采集、处理和分析机制。消费者支持根据特定事件,向NWDAF发起数据分析请求,NWDAF基于数据分析请求所携带的控制参数(如分析ID、分析报告目标、报告门限、分析时段、分析输出策略等),从数据源采集所需数据,执行分析并反馈结果。在定制化数据采集能力的基础上,为进一步提升数据采集效率,5GC借助由DCCF、MFAF所建立的数据采集/分发协调框架,实现了数据消费者和提供者的解耦,避免了数据重复订阅的发生;同时,借助ADRF的数据存储和检索能力,网络进一步提高了对历史数据的利用率,减少了数据的重复采集。在隐私保护方面,当所需数据与个人用户相关时,NWDAF通过检索签约数据,确保数据采集符合用户许可;同时,NWDAF还支持通过联邦学习框架,以“数据不出本地”的方式,联合多方数据拥有者,实现高效的模型训练。
模型能力
考虑到网络运行智能所涉及的任务场景复杂多样,为实现算法模型的快速优化、高效部署和实时推理,核心网在模型传递、存储、训练和监测等不同方面进行了能力增强。具体地,模型可通过以NWDAF为核心的订阅/请求流程,向终端、网管、5GC网络功能等任何潜在消费者按需开放,并支持指定模型互操作性信息,以确保模型在不同硬件设施和运行环境下的可用性。作为核心网运行智能的关键要素之一,模型可在ADRF中进行存储和检索,实现灵活的跨域共治共享。对于模型训练,核心网实现了对单节点集中式训练和多MTLF协同的分布式联邦学习的支持,可在保障数据隐私安全的前提下,充分利用多节点算力。此外,为确保模型在网运行可靠性,R18建立了模型性能监测机制,并支持模型重训练和重订阅,形成了模型全生命周期管理的基本协议框架。
协同能力
协同能力是指网络对连接、算力、模型、数据等各种资源的管理和调度能力。面向多NWDAF部署的场景,R17阶段引入了分析聚合和分析转移技术。分析聚合技术通过对复杂分析任务进行拆解和分发,实现了对多NWDAF数据资源和分析能力的整合;分析转移技术支持将进行中的分析订阅及分析上下文,直接从原NWDAF转移到新NWDAF,避免额外信令开销,提升分析服务的连续性。R18和R19阶段先后引入横向联邦和纵向联邦架构,在不破坏数据隐私的前提下,增强了协同计算能力,为支撑更强大的智能化应用提供了基础。面向跨域协同,NWDAF通过与网管域管理数据分析功能(Management Data Analytic Function,MDAF)进行智能交互,促进了网络运行、管理及编排的智能化。
应用能力
核心网应用能力的增强体现在网络、用户和业务三个层面。面向网络层,利用NWDAF所提供的网络数据智能分析能力,形成对网络运行状态的实时感知,推动提升资源的调度、管理和编排效率;面向用户层,网络可利用智能化算法对大量用户历史行为数据进行分析挖掘,构建更精准的用户画像,从而实现用户粒度的个性化服务和精细化管理;面向业务层,网络通过整合海量用户终端的感知数据,实现通、感、算有机融合,支撑网络资源面向业务需求的自动智能适配和动态调整。
未来挑战分析
经过持续的架构优化和能力增强,NWDAF已成为驱动核心网智能运行的关键基础设施。目前,新一代核心网标准(R19)正在逐渐形成,仍需深入探索潜在的发展方向和优化空间。以下具体分析其所面临的“三结合”挑战。
一是标准与场景挖掘相结合。网络运行智能对内需实现网络的自感知、自分析、自决策、自执行的闭环自治,对外需赋能交通、教育、工业、医疗等垂直行业的转型升级。然而,目前NWDAF所支持的切片负载、业务质量、网络拥塞等有限分析任务,难以满足不同场景的网络智能化分析需求。因此,未来的标准演进仍需进一步研究高价值场景,并结合不同场景的差异化需求,不断拓展NWDAF的能力边界。
二是标准与应用落地相结合。标准定义仅提供了网络运行智能的基本协议框架,然而面向实际需求和网络部署,仍需在智能架构、关键技术、应用方案等方面开展大量的定制化改造和增强。例如,为强化不同等级客户/场景的差异化网络服务,需新设计智能体验保障闭环架构;现有标准的数据采集机制存在瓶颈,需新定义轻量化数据采集上报方案,实现效率和开销的平衡。因此,未来的标准研究需进一步面向应用部署的实际诉求并尽量减少对现网影响。
三是标准与新技术引入相结合。近年来,人工智能技术飞速发展,为进一步提升网络的智能化水平带来了新的机遇。例如,大模型基于海量数据以及千亿级训练参数,能够捕捉更细微、更复杂的数据特征和内在模式,为解决当前网络AI场景的碎片化问题提供了重要途径。然而,如何在标准层面为新技术与网络运行智能深度融合提供原生支持,包括资源调度、安全保障、兼容性等,仍需深入探索。
结语
随着NWDAF的标准研究及产业推进,核心网已形成了基本的运行智能分析框架,但面向现网应用与部署,核心网运行智能仍存在诸多挑战性问题。本文基于3GPP对NWDAF的研究内容,介绍了NWDAF在不同版本标准中的架构特点和关键技术,并分析了网络运行智能标准演进所面临的“三结合”挑战,为未来的标准研究提供了潜在的探索方向。
发表评论