为了充分利用需求侧大量未开发的资源,智能家居技术在解决智能电网“最后一英里”问题中发挥着至关重要的作用。强化学习 (RL) 在解决许多连续决策问题方面表现出色,是智能家居控制的绝佳候选。例如,许多研究已经开始研究动态定价方案下的家电调度问题。基于这些,本研究旨在提供一种经济实惠的解决方案,以鼓励更高的智能家居采用率。具体来说,我们研究将迁移学习 (TL) 与 RL 相结合,以降低最佳 RL 控制策略的训练成本。给定基准住宅的最佳策略,TL 可以启动针对具有不同家电和用户偏好的新住宅的策略的 RL 训练。模拟结果表明,通过利用 TL,RL 训练收敛速度更快,并且对于与基准住宅相似的新住宅,所需的计算时间要少得多。总之,本研究提出了一种经济有效的方法来大规模训练家庭 RL 控制策略,最终降低控制器的实施成本,提高 RL 控制器的采用率,并使更多家庭实现电网互动。
主要关键词