循环神经网络:构建自定义 LSTM 单元
您是否有兴趣了解循环网络如何在后台处理序列?这就是本文的全部内容。我们将检查并构建我们自己的自定义 LSTM 模型。此外,我们对循环模块和卷积模块进行了一些比较,以最大限度地加深我们的理解。
来源:AI夏令营我无数次陷入绝境,因为我不知道幕后发生了什么。对于计算机视觉社区的许多人来说,循环神经网络 (RNN) 就是这样。或多或少,是堆里的另一个黑匣子。
堆里的另一个黑匣子但是,在本教程中,我们将尝试打开 RNN 魔法黑匣子并解开它的奥秘!
尽管我已经看过数百个关于 LSTM 的教程,但我觉得缺少了一些东西。因此,我真诚地希望本教程可以作为 RNN 的现代指南。我们尝试处理多个实用细节。为此,我们将以它们的基本概念为基础。
本教程是 RNN 的现代指南 将以它们的基本概念为基础。RNN 的广泛应用领域包括序列预测、活动识别、视频分类以及各种自然语言处理任务。在仔细检查方程式之后,我们将构建自己的 LSTM 单元来验证我们的理解。最后,我们将与卷积神经网络进行一些关联,以最大限度地加深我们的理解。本教程的附带代码可在此处找到。
序列预测 我们将构建自己的 LSTM 单元来验证我们的理解 此处确实,当您开始阅读有关 RNN 的内容时,尤其是在具有计算机视觉背景的情况下,概念误导就会开始出现。更确切地说:
“使用随机梯度下降 (SGD) 的反向传播不会神奇地让您的网络工作。批量规范化不会神奇地使其收敛得更快。循环神经网络 (RNN) 不会神奇地让你“插入”序列。(...) 如果你坚持使用这项技术而不了解它的工作原理,你很可能会失败。”~ Andrey Karpathy(特斯拉人工智能总监)
循环神经网络 (RNN) 不会神奇地让你“插入”序列 Andrey Karpathy Andrey Karpathy