当前位置:首页|资讯|AI大模型

AI大模型专题:网络大模型十大问题白皮书(附下载)

作者:勇敢的鹏子发布时间:2024-03-22

原标题:AI大模型专题:网络大模型十大问题白皮书(附下载)

今天分享的是AI系列深度研究报告:《AI大模型专题:网络大模型十大问题白皮书》。

(报告出品方:6GANA

报告共计:21

海量/完整电子版/报告下载方式:公众号《人工智能学派》

摘要

作为 6G 的研究热点,网络与 AI被 ITU-R 正式提出作为 6G 的6大场景之一。其一直以来受到学术和工业界的广泛关注,6GANA 也提出了网络 AI的理念并展开了深入的研究。而随着大模型的兴起以及其在各行业表现出来的强大潜力,可以预见到大模型也将在 6G 网络中扮演重要的角色,相关的研究也将逐渐进入高发期。本白皮书将首先对网络大模型(NetGPT)给出明确的定义,随后从基础理论、场景需求、网络架构、部署管控、数据治理等方面系统阐述 NetGPT 的10 大重点研究问题,分析潜在的研究路线,希望能够为后续的 NetGPT的相关工作指引方向。

网络大模型的定义大模型将在运维、执行、验证等方面为移动网络服务。通过整合通信知识,大模型可以帮助检测故障和生成解决方案。随着网络服务的多样性和复杂性,大模型可以用来编排和调度任务流程,还可以进行性能优化、环境预测、资源分配等。通过出色的生成能力,大型模型有望在验证阶段发挥重要作用,如室外复杂环境的通道生成、高铁场景模拟等。因此,我们将无线通信网络中使用的大模型定义为网络大模型(NetGPT)。

由于无线通信网络包含 RAN/CN/OAM 这些不同的技术域,他们在功能特性、数据结构、以及性能需求上都有着明显的区别。例如,应用在运维领域的模型可能与 NLP 领域 LLM 类似,可以直接对 LLM 进行微调得到;而应用于空口的模型与自然语言完全是另一套体系。因此, NetGPT 并不是一个单一模型通配所有网络场景,而是一系列模型的组合。需要注意的是,这种组合并不是简单的将孤立的模型摆放在一起。我们为 NetGPT 建立了三层模型,即 L0,L1 和 L2。 其中,L0 代表全网通用大模型;L1 代表网络不同领域大模型,如 RAN/CN/OAM 域大模型;L2 代表特定场景下的网络模型,如信道预测或者负载均衡等。

NetGPT 在通用性、基础性和规模上,都是传统各网元各自训练出的特定场景模型所不能相比的。通用性上,NetGPT-L0 要能在全网各领域通用,包含是电信领域的基础知识,NetGPT- L1 的通用性就差一些,局限在对应的领域内;基础性指的是能够通过 few-shot 甚至 zero-shot 就很好的适配到下游任务上,这一点 NetGPT-L0/1 都要具备,特别是 L1,要能够作为 NetGPT- L2 的基础模型,通过各种策略来快速适配到新的场景中去,不再需要从头开始训练 L2。而在模型规模上,NetGPT-L0/1 的参数量要满足大模型的基准门限,目前业界普遍的看法是,产生智能涌现的最少参数量在 70 亿。NetGPT-L2 的参数量可以小很多,方便其部署在网络边缘和端侧。

十大基础问题

尽管大模型,尤其是 LLM,已经在很多领域展现出了令人惊叹的能力,网络大模型仍然还有很多基础问题需要去研究和解决。这些问题可以分为两类,一类是大模型本身的设计类问题,另 一类是网络设计如何支撑大模型应用类问题。也就是说,我们让 NetGPT 既要造的出,也要用得好。

报告共计:21页

海量/完整电子版/报告下载方式:公众号《人工智能学派》


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1