循环神经网络已被证明可在为推荐系统建模顺序用户反馈方面发挥有效作用。然而,它们通常仅关注项目相关性,无法有效地为用户探索多样化的项目,因此从长远来看会损害系统性能。为了解决这个问题,我们提出了一种新型的循环神经网络,称为循环探索网络 (REN),以联合执行表示学习和潜在空间中的有效探索。REN 试图在相关性和探索之间取得平衡,同时考虑到表示中的不确定性。我们的理论分析表明,即使学习到的表示存在不确定性,REN 也可以保持速率最优的亚线性遗憾。我们的实证研究表明,REN 可以在合成和现实世界的推荐数据集上获得令人满意的长期回报,表现优于最先进的模型。
主要关键词