全球建筑物占能源消耗和供暖,倾斜度和空调(HVAC)的30%,约占建筑物征收的38%。因此,节能对于可持续性至关重要。建筑物的复杂性,具有不同的物理领域和大规模组成部分,对实现节能操作提出了挑战。实施高性能控制是有效的,但需要时间,需要合格的专家。增强学习(RL)提供适应性,但需要广泛的数据,因此很难扩展到大型系统。rl广泛用于无模型环境,例如视频游戏;但是,在控制问题时,由于必须达到系统的稳定性和鲁棒性,因此更加挑剔。该项目探索了具有物理信息的RL(PIRL),以构建能量优化,重点是监督控制级别。选择了物理模型的信息来加速学习,并研究了增强学习对建筑物冷却系统的影响。关键问题包括从物理模型中选择适当的信息,确定数据要求以及利用建筑系统体系结构以扩展PIRL。在Modelica语言中开发的动态模型,并在论文中使用了开源建筑库。数值概念,以评估PIRL的缩放势。一个目标是使用PIRL方法和载体自动化逻辑构建控制软件在循环方法中理解和应用软件。将显示物理信息有助于减少训练时间,并且与基线控制器相比,可以使用PIRL节省能量。
主要关键词