Loading...
机构名称:
¥ 1.0

强化学习(RL)在建筑物控制方面发挥了巨大的潜力,以使建筑物的运作更加节能。已经研究了各种RL算法的建筑控件性能,因此在整个功能范围内对这些算法进行基准测试对于提供概述并加深对RL应用程序的理解至关重要。因此,本研究旨在比较和分析各种RL算法的有效性,其中包括基于价值的,策略梯度,参与者 - 批评和基于模型的RL考虑模型可用性和策略表示的整个RL类别。还研究了根据RL的成本函数量化累积奖励的控制绩效,研究了超参数调整的稳定性。开源的健身房ePlus框架被选为训练和测试不同RL代理的虚拟环境。结果表明,在能耗和热舒适性方面,无模型和基于模型的RL代理都超过了基线规则的控制,并且RL代理能够评估短期和长期奖励,以连续地与在线控制过程中连续实现适应性控制优化。基于模型的RL代理提高了数据采样效率,但在经过测试的夏季表现出了相对牺牲的控制性能。

建筑物控制中的强化学习-UCL Discovery

建筑物控制中的强化学习-UCL DiscoveryPDF文件第1页

建筑物控制中的强化学习-UCL DiscoveryPDF文件第2页

建筑物控制中的强化学习-UCL DiscoveryPDF文件第3页

建筑物控制中的强化学习-UCL DiscoveryPDF文件第4页

建筑物控制中的强化学习-UCL DiscoveryPDF文件第5页