HUAWEI技术
文/HUAWEI无线CTO Huawei Fellow 童文
文/HUAWEI无线研究技术VP 马江镭
文/HUAWEI无线研究高级VP Huawei Fellow 朱佩英
文/HUAWEI无线研究高级专家 陈雁
大模型技术兴起,让社会加速进入了一个崭新的智能时代。AI技术的进步不仅推动了各行各业的数字化转型,也为通信技术的未来发展奠定了基础,特别是在迈向6G的过程中发挥着至关重要的作用。
在AI革命大背景下,2023年6月,国际电信联盟(ITU)完成对6G愿景的框架定义工作,从两个方面回答了什么是6G[1]。第一,6G将持续演进移动通信,持续增强移动宽带eMBB、高可靠低延时通信URLLC,以及海量连接mMTC等三大业务场景,提供沉浸式、确定性的通信体验和支撑海量连接的能力;第二,6G将超越移动通信的范畴,实现通信感知一体化、AI通信一体化,以及空天地泛在的全域连接,让人们超越人眼“观察”物理世界,并在虚拟世界中构建数字孪生。6G的愿景是全球共识的重要成果,是向6G全球统一标准迈进的重要里程碑。
在三个超越通信的场景中,AI通信一体化主要探讨的是如何设计6G来原生地支撑未来海量的AI服务和AI应用。未来的5到10年,99%的开发、设计和文字工作将被AI取代。不久的将来,大模型甚至还将取代架构设计、芯片设计。这个未来趋势,将与6G的部署时间窗相重叠。4G LTE的技术创新,把大家带入移动互联网时代,智能手机的App 成为了应用和服务的主要载体。进入人工智能时代,应用和服务的核心载体将不再是 App,也不再是网站,而是AI-Agent。
AI-Agent是一个能感知,并且能主动采取行动的智能体,能够根据环境自行设定行动目标,具有感知学习和获取常识能力,持续不断地提升自己的能力。而近年来大模型的成功,也把 AI-Agent 的能力提升到一个全新的水平,不仅仅只是生成式AI,而是交互性AI,可以进行复杂的交互式对话和决策。因此,在6G时代,网络的使能对象不仅仅是AI-Agent,而且是人工通用智能AGI(Artificial General Intelligence)。HUAWEI最早在2019年提出的“万物智联”(Connected Intelligence)的愿景(如图1),支撑原生AI能力,实际上就是两个方面:AGI for 6G 和 6G for AGI [2]。
图1 : Connected Intelligence = AGI for 6G + 6G for AGI
本文将围绕AGI for 6G和6G for AGI两个方面展开,尤其侧重6G for AGI。如图2所示,6G for AGI就是要回答如何设计eMBB+、URLLC+、mMTC+等通信能力,以及如何利用网络感知能力,共同更好地支撑AI,让6G成为连接未来AI智能体的神经中枢,成为AI学习、训练、推理的重要组成部分。这也要求6G系统的设计必须是一个超越连接的架构,并进一步集成AI-Agent的四大基本功能:感知、认知、决策、行动,通过基于意图的高效能通信,深度融合物理世界和数字世界,并对物理世界产生作用。
图2 :6G原生AI能力和6G for AGI的整体框架
AGI for 6G
6G时代AGI的通信基本模式是基于Weaver的效用通信(Effectiveness Communication [3]),也可以简称为意图通信。这是一个超越香农通信的框架:香农通信只是传输比特,然而,比特不代表理解,不具备智能,这是AGI使能的6G通信与传统通信的本质区别。 基于AI-Agent的6G通信可以分为四类: - 第一,人与人的第一系统和第二系统通信;
- 第二,机器与机器的意图通信;
- 第三,人与机器的URLLC通信;
- 第四,基于空间计算的机器与人的Metaverse 通信。
为支撑基于AI-Agent的6G通信框架,3GPP标准的设计需要考虑支撑感知、学习的上行信道,并且能够支撑推理、支撑低延时、支撑Metaverse的下行信道。下面大家着重先容前两类。后两类的通信在利用基于AI-Agent的框架上与前两类的使用方法类似,但场景不同,具体的通信需求也相应有所不同。
AI-Agent辅助的人与人通信
未来基于大模型的通信,将是物理世界通信和数字世界通信的有机融合,会引入AGI后香农通信架构。以人与人的通信举例,其核心概念包含两个部分: - 第一,每个人可以用一个大模型来代理,这个大模型就是一个GPT;
- 第二,每个人的大模型可以根据GPT,用空间计算,生成多模态的虚拟实时响应,代表人确定性行为的代理响应。在数字世界中,基于此类GPT代理之间的通信系统,称为第一系统。而对于如喜怒哀乐的情感等非确定性行为,大模型无法准确学习和建模,此时针对这部分信息的沟通传递,需要在物理世界进行实时通信,称为第二系统,其亦可基于GPT大模型来设计。
每个人可以发布自己的大模型,在人与人的通信之前,可以先获取对方的大模型,来进行两个大模型之间的第一系统通信,这实际上是本地通信,不需要用无线通信资源。当大模型无法生成第二系统通信的部分时,需要通过无线信道进行通信。 6G的AGI与AGI通信(如图3),内信道是香农通信,其外信道通信,是神经网络与神经网络的通信,是大模型与大模型的通信,是Agent与Agent的通信。这里需要指出,无线空口的GPU化,不能带来性能提升,反而要付出牺牲功耗的代价。
图3 :基于GPT大模型的AGI后香农通信架构
以AI-Agent为辅助的人与人通信是一种先进的交互方式,它利用了人工智能的强大能力来增强和优化通信过程。在这个框架中,每个人都会拥有两个主要的GPT大模型:第一系统用于本地智能处理,第二系统用于物理通信。
首先,每个人要训练好自己的第一系统AI-Agent使用的GPT大模型,以及用于物理通信第二系统的GPT大模型。这些训练主要是离线的监督学习,基于一个更广义用于的通用大模型进行训练,可以持续更新,且可以有人的参与辅助(Human in the loop),从而让所得的GPT模型更精准强大。其次,为了检测第一系统工作是否正常,需要一个涌现的检测器,当发现有第一系统不能学习和建模的部分,则分流给第二系统进行学习。
这样就形成了一个快速和慢速结合的通信架构:第一系统是快速的,可以由通信双发交互各自的AI-Agent来实现Agent之间的本地闭环通信,不需占用通信资源(如图4);第二系统是慢速的,可以用无线信道进行通信(如图5)。值得一提的是,通过基于AGI的意图通信机制,第二系统的通信流量与直接的视频通信相比,可以压缩百倍甚至千倍。此外,第一系统和第二系统的AI-Agent均可以不断对通用大模型进行刷新。
图4 :基于GPT大模型的第一系统-快速本地通信
图5 :基于GPT大模型的第二系统-慢速物理通信
AI-Agent辅助的机器与机器通信
对于机器与机器的通信,如果直接上传视觉传感的结果(如完整的视频、点云等信息)去支撑在边/云端用大模型进行计算,则需要“极大上行”的流量,能支撑的机器数量较为受限。如果在终端有初级的AI-Agent, 通过无线信道与云端的大模型计算进行Token的实时对齐,从而利用端-管-云的AI-Agent协同,就可以实现海量机器与机器的通信(如图6)。
图6 :6G机器与机器间的意图通信范式
具体而言,基于AI-Agent的后香农通信框架采用意图通信的方式包括如下步骤: - 第一步,在终端侧引入AI-Agent对场景进行初级预处理分析,即所谓的面向目标的筛选(goal-oriented filtering),从而对传感数据进行实时清洗;
- 第二步,对提取的相关对象进行transformer大模型中所谓的嵌入计算(Embedding)得到意图的极简数学描述(Token);
- 第三步,通过无线信道传回边/云端,实现双边意图(由Token表示)的实时对齐,由此完成端-管-云协同的高效机器与机器通信。
与直接的视频传输相比,此传输机制下的流量可以压缩百倍甚至千倍,从而量级性提升系统可支撑的通信用户数量。
6G for AGI6G感知为AI学习提供大数据源泉
6G网络中应用AI-Agent服务的独特优势还在于,6G系统是通感融合的。通信感知一体化为无线通信系统带来了新的机会——在通信的同时提供无线感知服务。感知和通信的原生融合,使移动基站和终端可以在不需要额外使用频谱及增加设备成本的前提下,通过协同感知,获得更大的感知范围和更高的感知精度。6G更短的无线电波长、更宽的频谱资源和更大的天线孔径将使得物理环境的高精度实时重构成为一种服务,利用这一能力也能反过来在显著增强无线传输性能的同时大幅降低传输功耗。
6G感知提取的数据不仅仅只是对整网物理世界的建模,也是AI学习的大数据源泉(如图7)。人、机器、车、建筑、材质,甚至是天气,都可作为6G感知的对象。无线感知可以通过电波传播的参数估计、成像,甚至质谱检测来提供关于环境的大数据。从厘米波、毫米波,到亚太赫兹等全通信频谱的感知能力均值得关注和研究。在高精度感知领域,太赫兹技术有望得到广泛的应用。
图7: 6G感知是支撑未来AI大模型的主要数据来源
6G提供智能普惠的A-RAN和A-CORE
以ChatGPT为代表的自然语言大模型,在不久的将来,就会达到和超越人类的能力。然而,其代价是需要基于超算集群的算力才能提供“类人”的智能。比如,拥有5千亿的神经网络参数,需要千万瓦级的供电才能运行,在未来的10年,大概率无法在手机终端上运行。
为了给所有人、所有物提供随时随地的智能服务,6G网络必须承担起智能普惠的责任。这就需要基于6G网络采用基于大模型的“通信(C)+ AI(A)+ 感知(S)”架构。而通信-AI-感知的融合,也正是6G的本质特征所在。支撑AGI的后香农通信架构,也就是:通信+AI+感知(C+A+S)的移动接入网,大家称之为A-RAN(如图8)。
图8:A-RAN架构:通信-AI-感知融合的接入网络
同样,6G网络可以基于 AI-Agent 来构建,每个AI-Agent就可以是一个逻辑网元。早在2015年,HUAWEI企业2012实验室就提出应用驱动的网络,其核心思想是,基于客户相对应用的需求,自动生成定制的网路,应用完毕,网络也就撤除。基础设施就像全网一部计算平台,这是一个基于任务的网络架构,也是6G A-CORE的雏形(如图9)。
图9:A-CORE架构:以任务为中心的网络架构
6G AGI构建实时孪生世界
在数字世界里,根据应用的“意图”,通过构建物理实体的虚拟副本来模拟和分析现实世界的行为和性能,就是大家通常所谓的数字孪生。这里主要对数字孪生的两项技术进行阐释。第一,基于意图通信,构建能够实时反映真实物理世界的数字孪生体;第二,基于实时孪生世界,对物理世界进行准确的时空推理。这两项技术具有广泛的应用潜力,可应用于如自动驾驶、机器人、智能工业生产和远程医疗等众多场景。
首先,在一个小房间的物理空间里,放置有通信和感知一体化的6G终端,这些6G终端具有AI的算力,可以计算小规模的AI模型。同时,它们也可以通过无线信号感知物理世界。通过对感知信号进行处理,可以生成点云来刻画和描述物理世界。
之后,根据给定意图,通过网络中的AI大模型与6G终端的AI小模型之间的AGI通信,有选择性地重构物理世界。这里的孪生世界并不需要完整无缺地描述物理世界,而是识别跟意图相关的内容。这样既可以节省通信开销,还可以保护隐私,保护个人和场地的私密性。
感知系统真正感知的是“点云”信息,也就是三维空间中物体的点阵表示。为了减少数据传输量和保护用户的隐私,大家只会在语义目标和原始感知信息匹配时,才会将时空语义信息上传到云端进行融合。为此,大家开发了独特的语义时空融合和预测算法,可以融合语义信息形成数字孪生。这使得数字孪生能够几乎实时地反映大家关心的信息,同时将上行传输带宽需求降低几个数量级。
基于实时孪生的世界,这里演示一个用自然语言驱动事物定位和人物追踪的用例。与目前ChatGPT不同,大家的系统能够实时感知现实世界,并进行语义、时间和空间的推理,最终以自然语言的形式呈现结果。在这个例子中,物体和人物的移动位置都会以卡通人物渲染的形式实时显示在数字孪生体中。6G AGI系统会根据感知到的点云信息,判断是否发生与预先设定的意图(如“看书”)相关的动作,并实时定位相关事件的空间位置。随着感知系统的不断完善,推理的准确性也将不断提高。 本文探讨了未来大模型时代下的6G原生AGI通信,先容了 - Connected Intelligence = AGI for 6G + 6G for AGI:
- AGI for 6G:后香农通信架构使能的效用通信(Effectiveness Communication);
- 6G for AGI:集AI学习、训练、推理为一体的普惠智能神经中枢;
- 通信、感知、AI融合的 6G A-RAN;
- 基于Agent网元构建以任务为中心的 6G A-CORE。
大家认为,6G的本质是通信-AI-感知的融合,成为服务万千AI-Agent的神经中枢。
引文: - Recommendation ITU-R M.2160-0, Framework and overall objectives of the future development of IMT for 2030 and beyond.
- Wen Tong and Peiying Zhu, "6G: The Next Horizon From connected people and things to connected intelligence," Cambridge University Press, May 2021.
- C. E. Shannon and W. Weaver, The Mathematical Theory of Communication. The University of Illinois Press, 1949.
|