使用嵌入进行协同过滤

嵌入不仅仅用于自然语言处理。在这里,我们将嵌入应用于协同过滤中的常见任务 - 预测用户评分 - 并在此过程中努力更好地理解嵌入层的实际作用。

来源:RStudio AI博客

当你读到嵌入这个词时,你的第一个联想是什么?对于我们大多数人来说,答案可能是词嵌入或词向量。快速搜索 arxiv 上的最新论文显示还可以嵌入哪些内容:方程(Krstovski 和 Blei 2018)、车辆传感器数据(Hallac 等人 2018)、图表(Ahmed 等人 2018)、代码(Alon 等人 2018) )、空间数据(Jean et al. 2018)、生物实体(Zohra Smaili、Gao 和 Hoehndorf 2018)……还有什么不是。

嵌入 词嵌入 词向量 存档 (Krstovski 和 Blei 2018) Krstovski 和 Blei 2018 (Hallac 等人,2018) Hallac 等人。 2018年 (艾哈迈德等人,2018) 艾哈迈德等人。 2018年 (Alon 等人,2018) 阿隆等人。 2018年 (Jean 等人,2018) 让等人。 2018年 (Zohra Smaili、Gao 和 Hoehndorf 2018) Zohra Smaili、Gao 和 Hoehndorf 2018

这个概念有什么吸引人的地方?嵌入结合了分布式表示的概念,信息的编码不是在专门的位置(比如专用神经元),而是作为一种分布在网络上的激活模式。没有比杰弗里·辛顿(Geoffrey Hinton)更好的引用来源了,他在概念的发展(Rumelhart、McClelland 和 PDP 研究小组 1986):

分布式表示 (Rumelhart、McClelland 和 PDP 研究小组 1986) Rumelhart、McClelland 和 PDP 研究小组 1986
分布式表示是指两种表示形式(例如概念和神经元)之间存在多对多的关系。每个概念由许多神经元表示。每个神经元参与许多概念的表示。

分布式表示是指两种表示形式(例如概念和神经元)之间存在多对多的关系。每个概念由许多神经元表示。每个神经元参与许多概念的表示。

分布式表示

优点是多方面的。也许使用嵌入最著名的效果是我们可以学习和利用语义相似性。

橙色 猕猴桃 雷暴 余弦距离 (Frome 等人,2013) <- ( =