如今,数据的空前可用性和计算硬件的进步已推动机器学习 (ML) 和深度学习 (DL) 领域取得重大进展。[1] 通过利用大量开放获取数据,ML 技术可实现自动化决策,适用于医疗预测 [2]、财务预测 [3]、工业故障管理 [1] 等广泛应用。ML 技术在生产中的部署涉及数据收集和计算要求高的算法推理过程。在大多数情况下,此过程发生在昂贵的硬件系统中,例如数据中心。上述许多 ML 应用都需要实时计算,这就需要在数据采集系统和数据中心之间进行不切实际的数据传输。解决这个问题的方法是边缘计算,将采集和计算系统集成在同一设备中,从而消除了通信开销 [4]。这催生了智能工业的一个新领域,物联网 (IoT) 应用可从使用 ML 模型中获益 [5]。物联网系统的一个重要方面是功耗 [6];设备必须依靠电池自主执行高计算任务。这反过来又导致对前所未有的低功耗和低面积利用率的需求。因此,在过去的几十年里,出现了一种新趋势,即在物联网和 ML 应用中使用低面积和低功耗硬件加速器,直接连接到智能传感器或系统 [7]。
主要关键词