机器学习 (ML) 领域特定架构 (DSA) 和芯片在过去几年中一直盛行。这些定制的 DSA 设计在能源效率、处理延迟和性能可扩展性方面优于传统的通用架构。ML 的数据密集型性质需要大量的处理能力和内存访问。数据流架构、可重构近内存电路被提出用于卷积神经网络 (CNN),从而大大降低了功耗。此外,自动驾驶汽车和机器人等复杂的边缘智能任务可能需要实时处理数据。定制的 NN 计算管道可提高整体吞吐量和延迟。此外,传统处理器可能无法满足越来越深的网络的需求。领域特定多核架构旨在随着网络的规模和复杂性而扩展,从而促进新兴算法的发展。
主要关键词