生成流动网络(GFLOWNETS)是一个概率生成模型的家族,它们学会了与奖励成正比的组成对象进行采样。Gflownets的一个重大挑战是在处理长期视野和稀疏奖励时有效地训练它们。为了解决这个问题,我们提出了进化引导的生成流网络(EGFN),这是使用进化算法(EA)对Gflownets训练的简单但强大的增强。我们的方法可以通过使用EA训练一组代理参数,将所得的轨迹存储在优先级的重播缓冲液中,然后使用存储轨迹训练GFLOWNETS代理。我们对广泛的玩具和现实世界的基准任务进行了彻底的调查,以显示我们方法在处理长轨迹和稀疏奖励方面的有效性。
主要关键词