摘要:大多数当前的强化学习研究都是在游戏和其他模拟域的背景下完成的。但是,利用这些领域的令人印象深刻的结果来产生现实世界的影响需要应对其他挑战。这些挑战包括处理结构化的状态和行动空间,即使是适度数据集,也可以提供安全,健壮和可扩展的解决方案,并明确考虑RL代理如何与人类合作者进行交互。AI4RealNet项目重点介绍了在现实世界中关键基础架构(例如电网,火车调度和空中交通管理)的顺序决策中的此类挑战。在本演讲中,我将讨论AI4RealNet项目如何处理这些问题,以及我们团队在这些领域的技术进步。