近年来,增强学习(RL)已成为一种有力的工具,可在光网络(例如路由和波长分配(RWA)[1]等光网络中解决复杂而染色的优化问题[1],路由,调制和频谱分配(RMSA)[2]以及虚拟网络嵌入[3]。RL实现的性能效果表明其在现实世界中的应用潜力。但是,与其他机器学习(ML)算法类似,RL模型具有黑盒性质,使它们难以解释。这种特征使RL模型难以信任,因此在实际的光网部署中采用。对于监督的ML模型,Shap(Shapley添加说明)[4]是一种可解释的AI方法,已被广泛采用。Shap是一种基于合作游戏理论的方法,用于量化单个特征对模型决策过程的影响。Shap值提供了对每个功能的相对重要性(影响)的见解,从而估算了它们如何对模型的输出做出贡献。将这种解释性框架应用于传播质量(QOT)预测任务时,已显示出有希望的属性[5]。最近,由于需要解释和使RL模型的决策过程透明的驱动,可解释的RL(XRL)受到了越来越多的关注。在光网络的上下文中,XRL的概念仍然相对尚未探索。先前建议通过反向工程网络状态[6]或网络中资源使用分析(链接)来解释和解释RL模型的决策[1,7]。但是,这些研究并未分析不同特征如何影响RL药物的决策。因此,在光网络背景下,RL代理学到的政策仍然存在一段差距。这至关重要,因为网络运营商需要在其在实际网络中部署之前了解RL学习策略背后的推理。在这项工作中,我们旨在利用Shap(Shapley添加说明)[4]来解释应用于RMSA问题的RL模型的行为。为此,我们提出了一种使用训练有素的RL代理的观察和行动来以有监督的学习方式训练ML模型的方法。由Shap使用所得的ML模型来提取解释。与[2]中的RMSA问题的每个组件分别求解,RL代理解决路由问题,基于路径长度的调制格式选择以及基于第一拟合策略的频谱分配。我们分析了该问题的三种变化,改变了奖励函数和选择RL代理的不可行的动作的可能性。我们特别有兴趣解释重要的网络和LightPath请求特征,该特征导致RL模型拒绝该请求。结果允许我们确定哪些功能和哪些值范围影响RL代理接受或拒绝LightPath请求。我们观察到,通过更改奖励功能,RL策略会更改拒绝请求时所考虑的重要功能。引入了防止RL模型采取不可行的措施的掩码,使功能的重要性更加均匀地分布在不同的路由选项上。我们认为,提出的方法对于增加将在真实网络中部署的RL模型的可信度可能是有价值的。
摘要:近年来,将分布式生成(DG)技术集成到分销网络(DN)以提高系统效率,降低碳排放并提高电源系统的可靠性。但是,DG系统在DN中的最佳位置是一项艰巨的任务,因为它取决于多个变量,包括负载需求,可再生能源和储能系统(ESS)。在这种情况下,需求响应(DR)程序可以在提高DG系统效率方面发挥至关重要的作用,因为它们使消费者可以在高峰时段降低其能源使用,并将其需求转移到非高峰时段。DR和太阳能光伏(SPV)系统是两种突出的技术,可以在功率DN中发挥重要作用。在本文中,采用双层粒子群优化(PSO)方法来确定DR协调中DG的最佳分配。在建议的方法中,优化的第一级确定了DG的最佳大小和位置,第二级优化决定了DR协调中的最佳功率调度。提出的方法是在IEEE 33总线系统上实现的,结果表明功率质量参数已显着改善。
NUSTL 负责管理应急响应人员系统评估和验证 (SAVER) 计划,该计划提供有关市售设备的信息,以协助响应组织进行设备选择和采购。SAVER 知识产品提供有关 DHS 授权设备清单 (AEL) 所列类别的设备的信息,主要关注响应者社区的两个主要问题:“有哪些设备可用?”和“设备性能如何?”SAVER 计划与响应者合作,对市售应急响应设备进行客观、与从业者相关、以操作为导向的评估和验证。拥有合适的工具可以为响应者提供更安全的工作环境,并为他们服务的人提供更安全的社区。
NUSTL 负责管理应急响应人员系统评估和验证 (SAVER) 计划,该计划提供有关市售设备的信息,以协助响应组织进行设备选择和采购。SAVER 知识产品提供有关 DHS 授权设备清单 (AEL) 所列类别的设备的信息,主要关注响应者社区的两个主要问题:“有哪些设备可用?”和“设备性能如何?”SAVER 计划与响应者合作,对市售应急响应设备进行客观、与实践者相关、以操作为导向的评估和验证。拥有合适的工具可以为响应者提供更安全的工作环境,并为他们服务的人提供更安全的社区。
nustl管理紧急响应者(SAVER)计划的系统评估和验证,该计划提供了有关商业可用设备的信息,以帮助响应组织进行设备选择和采购。Saver知识产品提供有关DHS授权设备清单(AEL)中列出类别的设备的信息,主要关注响应者社区的两个主要问题:“有哪些设备可用?”和“它如何表现?” Saver计划与响应者合作,进行客观,与从业者相关的,以操作为导向的评估以及对市售紧急响应设备的验证。拥有正确的工具为响应者和服务者提供更安全的工作环境,为他们服务的人提供了更安全的社区。
NUSTL 负责管理应急响应人员系统评估和验证 (SAVER) 计划,该计划提供有关市售设备的信息,以协助响应组织进行设备选择和采购。SAVER 知识产品提供有关 DHS 授权设备清单 (AEL) 所列类别的设备的信息,主要关注响应者社区的两个主要问题:“有哪些设备可用?”和“设备性能如何?”SAVER 计划与响应者合作,对市售应急响应设备进行客观、与实践者相关、以操作为导向的评估和验证。拥有合适的工具可以为响应者提供更安全的工作环境,并为他们服务的人提供更安全的社区。
训练 最合格的人员如下: SSG:技术护航(L3)、BCT 的 CBRN 侦察(L6)、CBRN 响应者(R)、跳伞者(P)、空中突击(2B)、游骑兵(G)、MRT、SHARP、EOL、战斗参谋士官(2S) SFC:技术护航(L3)、BCT 的 CBRN 侦察(L6)、CBRN 响应者(R)、跳伞者(P)、空中突击(2B)、游骑兵(G)、MRT、EOA、战斗参谋士官(2S) MSG:技术护航(L3)、BCT 的 CBRN 侦察(L6)、CBRN 响应者(R)、跳伞者(P)、空中突击(2B)、游骑兵(G)、MRT、战斗参谋士官(2S) CSM/SGM:不适用
NUSTL 负责管理应急响应人员系统评估和验证 (SAVER) 计划,该计划提供有关市售设备的信息,以协助响应组织进行设备选择和采购。SAVER 知识产品提供有关 DHS 授权设备清单 (AEL) 所列类别的设备的信息,主要关注响应者社区的两个主要问题:“有哪些设备可用?”和“设备性能如何?”SAVER 计划与响应者合作,对市售应急响应设备进行客观、与实践者相关、以操作为导向的评估和验证。拥有合适的工具可以为响应者提供更安全的工作环境,并为他们服务的人提供更安全的社区。