摘要 - 新应用程序的出现导致对移动边缘计算(MEC)的需求很高,这是一个有希望的范式,在网络边缘部署了类似云的架构,以向移动用户(MUS)提供计算和存储服务。由于MEC服务器与远程云相比的资源有限,因此在MEC系统中优化资源分配并平衡合作MEC服务器之间的负载至关重要。MEC服务器的不同类型计算服务(CSS)的缓存应用数据也可能是高度好处的。在本文中,我们调查了合作MEC系统中层次结构缓存和资源分配的问题,该系统被称为有限的Horizon成本成本最小化Markov决策过程(MDP)。为了处理大型状态和动作空间,我们将问题分解为两个耦合的子问题,并开发了基于分层的增强学习(HRL)基于基于的解决方案。下层使用深Q网络(DQN)来获取流量决策的服务缓存和工作量,而上层则利用DQN来获得合作MEC服务器之间的负载平衡决策。我们提出的方案的可行性和有效性通过我们的评估结果验证。
主要关键词