abtract的深入增强学习(DRL)已被广泛用于寻找最佳路由方案,以满足用户的各种需求。但是,DRL的优化目标通常是静态的,因为网络环境是动态的。交通环境的变化或净工作设备的重新配置通常会导致网络性能的定期变化(例如,吞吐量降低和潜伏期峰)。传统的静态目标配置不能反映动态净工作环境中不同指标的重要性差异,从而导致基于DRL的路由算法的僵化性。为了解决上述问题,我们建议使用Graph神经网络(GNNS)和DRL的在线路由优化算法优化。通过对网络的不同特征(例如路径,流和链接)之间的关系进行建模和理解,我们提出的GNN模型可以预测网络性能指标的未来开发(即延迟,吞吐量和丢失),从而迅速调整路由算法的目标。然后,使用我们提出的DRL模型,代理可以学习适应不同环境变化的最佳途径。我们在控制平面上实现了G路线甲基元素,并使用现实世界网络拓扑和流量数据执行模拟实验。实验结果表明,当网络环境发生重大变化时,我们提出的G路线会收敛得更快,达到较低的抖动并生成更可靠的路由方案。
主要关键词