基于多模态大型语言模型 (LLM) 的抽象 AI 代理有望彻底改变人机交互,并在医疗保健、教育、制造和娱乐等各个领域提供更加个性化的助理服务。在 6G 网络中部署 LLM 代理使用户能够通过移动设备民主地访问以前昂贵的 AI 助理服务,从而减少交互延迟并更好地保护用户隐私。然而,移动设备的有限容量限制了部署和执行本地 LLM 的有效性,这需要在长距离交互期间将复杂任务卸载到边缘服务器上运行的全局 LLM。在本文中,我们为 6G 网络中的 LLM 代理提出了一种分割学习系统,利用移动设备和边缘服务器之间的协作,其中具有不同角色的多个 LLM 分布在移动设备和边缘服务器上,以协作执行用户代理交互任务。在所提出的系统中,LLM 代理分为感知、接地和对齐模块,以促进模块间通信,以满足用户对 6G 网络功能的扩展要求,包括集成传感和通信、数字孪生和面向任务的通信。此外,我们在所提出的系统中引入了一种用于 LLM 的新型模型缓存算法,以提高上下文中的模型利用率,从而降低协作移动和边缘 LLM 代理的网络成本。
主要关键词