循环神经网络：构建自定义 LSTM 单元 XiaoMi-AI 科研信息收集

详细内容或原文请订阅后点击阅览

循环神经网络：构建自定义 LSTM 单元

2020年9月10日 00:00 33 Comments

您是否有兴趣了解循环网络如何在后台处理序列？这就是本文的全部内容。我们将检查并构建我们自己的自定义 LSTM 模型。此外，我们对循环模块和卷积模块进行了一些比较，以最大限度地加深我们的理解。

来源:AI夏令营

我无数次陷入绝境，因为我不知道幕后发生了什么。对于计算机视觉社区的许多人来说，循环神经网络 (RNN) 就是这样。或多或少，是堆里的另一个黑匣子。

堆里的另一个黑匣子

但是，在本教程中，我们将尝试打开 RNN 魔法黑匣子并解开它的奥秘！

尽管我已经看过数百个关于 LSTM 的教程，但我觉得缺少了一些东西。因此，我真诚地希望本教程可以作为 RNN 的现代指南。我们尝试处理多个实用细节。为此，我们将以它们的基本概念为基础。

本教程是 RNN 的现代指南 将以它们的基本概念为基础。

RNN 的广泛应用领域包括序列预测、活动识别、视频分类以及各种自然语言处理任务。在仔细检查方程式之后，我们将构建自己的 LSTM 单元来验证我们的理解。最后，我们将与卷积神经网络进行一些关联，以最大限度地加深我们的理解。本教程的附带代码可在此处找到。

序列预测 我们将构建自己的 LSTM 单元来验证我们的理解 此处

确实，当您开始阅读有关 RNN 的内容时，尤其是在具有计算机视觉背景的情况下，概念误导就会开始出现。更确切地说：

“使用随机梯度下降 (SGD) 的反向传播不会神奇地让您的网络工作。批量规范化不会神奇地使其收敛得更快。循环神经网络 (RNN) 不会神奇地让你“插入”序列。(...) 如果你坚持使用这项技术而不了解它的工作原理，你很可能会失败。”~ Andrey Karpathy（特斯拉人工智能总监）

循环神经网络 (RNN) 不会神奇地让你“插入”序列 Andrey Karpathy Andrey Karpathy

如何

自己的黑匣子开始尝试神经网络 Karpathy 处理使用序列教程计算机神奇 RNN 循环 LSTM 预测 Andrey