摘要:由可再生能源,电池存储和负载组成的网格连接的微电网需要一个控制电池运行的适当能源管理系统。传统上,使用载荷需求的预测数据和可再生能源(RES)的24小时预测数据使用电池优化技术进行了优化,其中在一天开始之前确定了电池操作(充电/放电/空闲)。强化学习(RL)最近被建议作为这些传统技术的替代方法,因为它可以使用真实数据在线学习最佳策略。文献中已经提出了RL的两种方法。of lim and Online。在频道中,代理商使用预测的生成和加载数据来学习最佳策略。一旦达到收敛,电池命令就会实时派遣。此方法类似于传统方法,因为它依赖于预测数据。在在线RL中,代理商通过使用实际数据实时与系统进行交互来了解最佳策略。本文研究了两种方法的有效性。具有不同标准偏差的白色高斯噪声被添加到真实数据中,以创建合成的预测数据以验证该方法。在第一种方法中,预测数据由a fine rl算法使用。在第二种方法中,在线RL算法实时与实际流数据进行了交互,并且使用真实数据对代理进行了培训。当比较两种方法的能源成本时,发现在线RL提供的结果要比实际数据和预测数据之间的差异更好。
主要关键词