16。摘要这项研究采用了A3C算法来模拟不同情况下的疏散过程(例如,多种试剂和不同的环境条件),并将结果与深Q网络(DQN)进行了比较,以证明在疏散模型中使用A3C算法的效率和有效性。结果表明,在静态环境下,A3C表现出较高的适应性和更快的响应时间。此外,在管理复杂的相互作用并提供快速撤离时,A3C越来越多,A3C显示出更好的可扩展性和鲁棒性。这些结果在不同和具有挑战性的条件下突出了A3C比传统RL模型的优势。该报告以讨论这些模型的实际含义和好处进行了讨论。它强调了它们在增强现实世界疏散计划和安全协议方面的潜力。17。关键词加强学习,多代理协作,紧急情况,机场疏散
主要关键词