详细内容或原文请订阅后点击阅览
机器学习“降临日历”第 23 天:Excel 中文本的一维 CNN
用于文本的分步 1D CNN,内置于 Excel,其中每个过滤器、权重和决策都是完全可见的。机器学习“降临日历”第 23 天:Excel 中用于文本的 1D CNN 帖子首先出现在走向数据科学上。
来源:走向数据科学最初是为图像引入的,对于图像来说它们通常很容易理解。
过滤器在像素上滑动并检测边缘、形状或纹理。您可以阅读我之前写的这篇文章,了解 CNN 如何使用 Excel 处理图像。
对于文本,想法是相同的。
我们在单词上滑动过滤器,而不是像素。
我们检测的不是视觉模式,而是语言模式。
文本中的许多重要模式都是非常本地化的。让我们看这些非常简单的例子:
在我的上一篇文章中,我们了解了如何使用嵌入将单词表示为数字。
我们还看到了一个关键的限制:当我们使用全局平均值时,词序被完全忽略。
从模型的角度来看,“不好”和“不好”看起来完全一样。
所以下一个挑战很明确:我们希望模型考虑词序。
一维卷积神经网络是一个自然的工具,因为它用小滑动窗口扫描句子,并在识别出熟悉的局部模式时做出反应。
1. 理解文本的一维 CNN:架构和深度
1.1。在 Excel 中为文本构建一维 CNN
在本文中,我们使用以下组件在 Excel 中构建一维 CNN 架构:
该管道对应于标准 CNN 文本分类器。
1.2。 “深度学习”在此架构中意味着什么
所以:
