机器学习中最有用的多功能工具:嵌入

嵌入是机器学习中最通用的技术之一,也是每个 ML 工程师工具箱中都应该拥有的关键工具。遗憾的是,我们中很少有人了解它们是什么以及它们有什么用处!问题可能在于嵌入听起来有点抽象和深奥:在机器学习中,嵌入是一种将数据表示为 n 维空间中的点的方式,以便相似的数据点聚集在一起。听起来无聊又不起眼?不要被愚弄。因为一旦您了解了这个 ML 多功能工具,您将能够构建从搜索引擎到推荐系统再到聊天机器人等所有内容。此外,您不必是具有 ML 专业知识的数据科学家即可使用它们,也不需要庞大的标记数据集。我是否已经说服您这些坏家伙有多棒了?🤞很好。让我们开始吧。在这篇文章中,我们将探索:什么是嵌入?它们有什么用?在哪里以及如何找到开源嵌入模型?如何使用它们?如何构建自己的嵌入?你可以用嵌入构建什么?在讨论什么是嵌入之前,让我们快速了解一下你可以用它们构建什么。(你知道——这是为了激发你的胃口。)向量嵌入的力量:推荐系统(即 Netflix 风格的如果你喜欢这些电影,你也会喜欢这部电影)所有类型的搜索文本搜索(如谷歌搜索)图像搜索(如谷歌按图搜索)音乐搜索(“这是什么歌?”)聊天机器人和问答系统数据预处理(准备数据

来源:Dale on AI

嵌入是机器学习中最通用的技术之一,也是每个 ML 工程师工具箱中都应该拥有的关键工具。遗憾的是,我们中很少有人了解它们是什么以及它们有什么用处!

问题可能在于嵌入听起来有点抽象和深奥:

在机器学习中,嵌入是一种将数据表示为 n 维空间中的点的方式,以便相似的数据点聚集在一起。

在机器学习中,嵌入是一种将数据表示为 n 维空间中的点的方式,以便相似的数据点聚集在一起。

听起来很无聊,没有什么令人印象深刻的?不要被愚弄。因为一旦你理解了这个 ML 多功能工具,你就能够构建从搜索引擎到推荐系统再到聊天机器人的一切,以及更多。此外,您不必是具有 ML 专业知识的数据科学家即可使用它们,也不需要庞大的标记数据集。

我是否已经说服您这些坏男孩有多棒?🤞

很好。让我们深入研究。在这篇文章中,我们将探索:

    什么是嵌入 它们的用途 在哪里以及如何找到开源嵌入模型 如何使用它们 如何构建自己的嵌入
  • 什么是嵌入
  • 它们的用途
  • 在哪里以及如何找到开源嵌入模型
  • 如何使用它们
  • 如何构建自己的嵌入
  • 您可以使用嵌入构建什么?

    在我们讨论什么是嵌入之前,让我们快速盘点一下你可以用它们构建什么。 (你知道——为了激发你的食欲。)向量嵌入的力量:

  • 推荐系统(即 Netflix 风格的如果你喜欢这些电影你也会喜欢这部电影)
  • 所有类型的搜索文本搜索(如谷歌搜索)图像搜索(如谷歌按图搜索)音乐搜索(“这是什么歌?”)
  • 所有类型的搜索

      文本搜索(如谷歌搜索)图像搜索(如谷歌按图搜索)音乐搜索(“这是什么歌?”)
  • 文本搜索(如谷歌搜索)
  • 图像搜索(如谷歌按图搜索)
  • 音乐搜索(“这是什么歌?”)
  • 聊天机器人和问答系统
  • 文本

    =