通过示例理解卷积神经网络 (CNN) XiaoMi-AI 科研信息收集

详细内容或原文请订阅后点击阅览

通过示例理解卷积神经网络 (CNN)

2018年11月18日 06:03 33 Comments

完成 Coursera 深度学习专业课程 #4 后，我想写一个简短的总结来帮助大家理解/复习卷积神经网络 (CNN) 的概念。让我们通过一个例子来理解 CNN - 图 1。CNN 示例 - 来源：Coursera DL Specialization假设您有一个 32x32 的图像，其中包含从 0 到 10 的数字，具有 3 个通道 (RGB)。您将它通过第一个卷积层 (CL1) 中大小为 f 的过滤器。过滤器的输出图像的大小是多少？输出图像的大小通过以下公式计算：来源：Medium 在我们的例子中，假设填充为 0 且步幅为 1。上述公式得出图像的高度和宽度的输出大小均为 28x28。好吧，这是一个好的开始！让我们继续。注意第 1 层输出的维度为 6。我们从哪里得到第三维度？第三维度就是层中过滤器的数量。给定一个大小为 f 的过滤器。层中有 #f 个过滤器，每个过滤器的维度为 f x f x nc，其中 nc 是前一层的通道数/体积。对于第一层，前一层有 3 个通道。现在，如果第 1 层中有 6 个这样的过滤器，则每个过滤器都会产生 nout x nout x 1 输出，并且假设我们有 6 个过滤器 - 卷积第 1 层的输出为 nout x nout x 6。最大池化有什么作用？池化是一种压缩信息的方法，将高像素值视为更多信息，将低像素值视为更多信息

来源:Ankit-AI | 分享人工智能

完成 Coursera 深度学习专业课程第 4 门后，我想写一个简短的总结来帮助大家理解/复习卷积神经网络 (CNN) 的概念。

让我们通过一个例子来理解 CNN -

图 1. CNN 示例 - 来源：Coursera DL 专业课程

假设您有一个 32x32 的图像，其中包含 0 到 10 的数字，具有 3 个通道 (RGB)。您将它通过第一个卷积层 (CL1) 中大小为 f 的过滤器。

过滤器的输出图像的大小是多少？

输出图像的大小通过以下公式计算：

来源：中等

来源：中等来源：中等来源：中等

在我们的例子中，假设填充为 0，步幅为 1。上述公式得出图像的高度和宽度均为 28x28 的输出大小。好的，这是一个好的开始！让我们继续。

注意第 1 层输出上的维度 6。

我们从哪里获得第三维度？

第三维度只不过是层中的过滤器数量。给定一个大小为 f 的过滤器。该层中有 #f 个过滤器，每个过滤器的尺寸为 f x f x nc

f x f x nc c

其中 nc 是前一层的通道数/体积。对于第一层，前一层有 3 个通道。

n c c

现在，如果第 1 层中有 6 个这样的过滤器，每个过滤器产生一个 nout x nout x 1 输出，并且假设我们有 6 个过滤器 - 卷积第 1 层的输出为 nout x nout x 6。

nout x nout x 1 out out nout x nout x 6。 out out

Max Pooling 做什么？

Max Pooling 做什么？

池化是一种压缩信息的方法，将高像素值视为更多信息，将低像素值视为较少信息。最大池化用于在对上一层的输出进行卷积时选择过滤器窗口中的最大元素。

来源：ComputerScienceWiki

来源：ComputerScienceWiki 来源：ComputerScienceWiki 来源：ComputerScienceWiki

更多阅读：

图像深度维度 CNN 池化输出来源公式 ComputerScienceWiki nout 卷积信息过滤器专业课程理解 Coursera