摘要 — 我们考虑电力聚合器试图了解客户的用电模式,同时通过实时广播调度信号实施负荷调整程序的问题。我们采用多臂老虎机问题公式来解释客户对调度信号响应的随机性和未知性。我们提出了一种受约束的汤普森抽样启发式方法 Con-TS-RTP,作为电力聚合器试图影响客户用电以匹配各种期望需求曲线(即减少高峰时段的需求、整合更多间歇性可再生能源发电、跟踪期望的每日负荷曲线等)的负荷调整问题的解决方案。所提出的 Con-TS-RTP 启发式方法考虑了每日变化的目标负荷曲线(即反映可再生能源预测和期望需求模式的多个目标负荷曲线),并考虑了配电系统的运营约束,以确保客户获得足够的服务并避免潜在的电网故障。我们对我们的算法的遗憾界限进行了讨论,并讨论了在整个学习过程中坚持分销系统约束的运行可靠性。
主要关键词