Loading...
机构名称:
¥ 1.0

摘要 — 物联网 (IoT) 支持的网络边缘人工智能 (AI) 的最新进展通过实现低延迟和计算效率,在智能农业、智能医院和智能工厂等多个应用中实现了边缘智能。然而,在资源受限的边缘设备上部署 VGG-16 和 ResNets 等最先进的卷积神经网络 (CNN) 实际上是不可行的,因为它们有大量的参数和浮点运算 (FLOP)。因此,作为一种模型压缩的网络修剪概念正在引起人们的关注,以加速低功耗设备上的 CNN。最先进的修剪方法,无论是结构化的还是非结构化的,都没有考虑卷积层所表现出的复杂性的不同潜在性质,而是遵循训练-修剪-再训练流程,这会导致额外的计算开销。在这项工作中,我们通过利用 CNN 固有的层级复杂性,提出了一种新颖且计算高效的修剪流程。与典型方法不同,我们提出的复杂性驱动算法根据其对整体网络复杂性的贡献选择特定层进行过滤器修剪。我们遵循直接训练修剪模型的过程,避免计算复杂的排名和微调步骤。此外,我们定义了三种修剪模式,即参数感知 (PA)、FLOP 感知 (FA) 和内存感知 (MA),以引入 CNN 的多功能压缩。我们的结果表明,我们的方法在准确性和加速方面具有竞争力。最后,我们提出了不同资源和准确性之间的权衡,这有助于开发人员在资源受限的物联网环境中做出正确的决策。

复杂度驱动的 CNN 压缩,适用于资源受限的边缘 AI

复杂度驱动的 CNN 压缩,适用于资源受限的边缘 AIPDF文件第1页

复杂度驱动的 CNN 压缩,适用于资源受限的边缘 AIPDF文件第2页

复杂度驱动的 CNN 压缩,适用于资源受限的边缘 AIPDF文件第3页

复杂度驱动的 CNN 压缩,适用于资源受限的边缘 AIPDF文件第4页

复杂度驱动的 CNN 压缩,适用于资源受限的边缘 AIPDF文件第5页