机器学习“降临节日历”第 22 天:Excel 中的嵌入

通过简单模型和 Excel 了解文本嵌入机器学习“降临日历”第 22 天:Excel 中的嵌入一文首先出现在《迈向数据科学》上。

来源:走向数据科学

这个系列,我们将讨论深度学习。

当人们谈论深度学习时,我们立即想到这些深度神经网络架构的图像,其中包含许多层、神经元和参数。

在实践中,深度学习带来的真正转变在其他地方。

这是关于学习数据表示的。

在本文中,我们重点关注文本嵌入,解释它们在机器学习领域的作用,并展示如何在 Excel 中理解和探索它们。

1. 经典机器收益与深度学习

我们将在这一部分讨论为什么引入嵌入。

1.1 深度学习适合什么地方?

要理解嵌入,我们首先需要明确深度学习的位置。

我们将使用术语“经典机器学习”来描述不依赖于深度架构的方法。

之前的所有文章都涉及经典的机器学习,可以用两种互补的方式进行描述。

学习范例

  • 监督学习
  • 无监督学习
  • 模型系列

  • 基于距离的模型
  • 基于树的模型
  • 基于权重的模型
  • 在本系列中,我们已经研究了这些模型背后的学习算法。特别是,我们已经看到梯度下降适用于所有基于权重的模型,从线性回归到神经网络。

    深度学习通常被简化为具有多层的神经网络。

    但这个解释并不完整。

    从优化的角度来看,深度学习并没有引入新的学习规则。

    那么它介绍了什么?

    1.2 深度学习作为数据表示学习

    深度学习是关于如何创建特征的。

    深度学习通常通过多次连续的转换来自动学习表示,而不是手动设计特征。

    这也提出了一个重要的概念问题:

    特征工程和模型学习的界限在哪里?

    一些示例使这一点更清楚:

  • 多项式回归仍然是线性模型,但特征是多项式的
  • 深度学习延续了这一想法,但规模更大。

    输入列