倒过来,猫还是猫:使用几何深度学习发展图像识别

在关于组等变卷积神经网络 (GCNN) 的系列文章的第一篇中,我们将介绍主要参与者 — 组 — 和概念(等变)。通过 GCNN,我们终于重新讨论了几何深度学习这一主题,这是一种原则性、数学驱动的神经网络方法,其范围和影响力一直在不断扩大。

来源:RStudio AI博客

这是关于组等变卷积神经网络 (GCNN) 的系列文章中的第一篇。今天,我们将简短、概括和概念性地介绍它;随后将介绍示例和实现。在研究 GCNN 时,我们将重新讨论我们在 2021 年首次撰写的一个主题:几何深度学习,这是一种原则性的、数学驱动的网络设计方法,自那时起,其范围和影响力不断扩大。

撰写 几何深度学习

从炼金术到科学:两分钟了解几何深度学习

简而言之,几何深度学习就是从两个事物中得出网络结构:域和任务。这些文章将详细介绍,但让我在这里快速预览一下:

    所谓域,我指的是底层物理空间,以及它在输入数据中的表示方式。例如,图像通常被编码为二维网格,其值表示像素强度。任务就是我们训练网络要做的事情:分类或分割。在架构的不同阶段,任务可能不同。在每个阶段,相关任务都会对层设计的外观做出规定。
  • 所谓域,是指底层物理空间,以及它在输入数据中的表示方式。例如,图像通常被编码为二维网格,其值表示像素强度。
  • 任务就是我们训练网络要做的事情:分类或分割。在架构的不同阶段,任务可能不同。在每个阶段,相关任务都会对层设计的外观做出规定。
  • 例如,以 MNIST 为例。数据集由 0 到 10 的十个数字图像组成,全部为灰度。任务 – 不出所料 – 是为每个图像分配所代表的数字。

    \(7\) \(7\) 平移等变 等变 卷积 不变性 不变性 池化 组等变

    组等变中的“组”

    真的

    来自对称性的组

    这是一个正方形。

    现在闭上眼睛。

    任何