详细内容或原文请订阅后点击阅览
CTR 预测的不确定性:一个模型来澄清所有问题
了解如何使用一个统一模型以原则性的方式处理推荐系统中的不确定性。
来源:Another Datum这是与 Inbar Naor 联合发布的帖子。最初发表于 engineering.taboola.com。
这是与 Inbar Naor 联合发布的帖子。最初发表于 engineering.taboola.com。 Inbar Naor engineering.taboola.com在本系列的第一篇文章中,我们讨论了可能影响模型的三种不确定性——数据不确定性、模型不确定性和测量不确定性。在第二篇文章中,我们讨论了专门处理模型不确定性的各种方法。然后,在第三篇文章中,我们展示了如何使用模型的不确定性来鼓励在推荐系统中探索新项目。
第一篇文章 第二篇文章 第三篇文章如果我们可以使用一个统一的模型以原则性的方式处理所有三种不确定性,那不是很好吗?在这篇文章中,我们将向您展示 Taboola 如何实现一个神经网络,该网络既可以估计某个项目与用户相关的概率,也可以估计该预测的不确定性。
让我们跳到深水区
一张图片胜过千言万语,不是吗?而一张图片包含一千个神经元?...
无论如何,这是我们使用的模型。该模型由几个模块组成。我们将解释每个模块的目标,然后图片将变得更加清晰...
项目模块
该模型试图预测项目被点击的概率,即 CTR(点击率)。为此,我们有一个模块,它获取项目的特征(例如其标题和缩略图)作为输入,并输出一个密集表示 - 如果您愿意的话,可以将其称为数字向量。
一旦模型训练完成,这个向量将包含从项目中提取的重要信息。
上下文模块
我们说模型预测点击项目的概率,对吧?但项目显示在哪种上下文中?
上下文可以表示很多东西——发布者、用户、一天中的时间等。此模块将上下文的特征作为输入。然后输出上下文的密集表示。