高质量的 AI 解决方案需要对 AI 算法(例如深度神经网络 (DNN))及其硬件加速器进行联合优化。为了提高整体解决方案质量并提高设计效率,高效的算法和加速器协同设计方法是必不可少的。在本文中,我们首先讨论了算法/加速器协同设计问题的动机和挑战,然后提供了几种有效的解决方案。特别是,我们重点介绍了三种有效的协同设计方法的主要工作:1)第一个同时进行的 DNN/FPGA 协同设计方法; 2)双向轻量级 DNN 和加速器协同设计方法; 3)可区分且高效的 DNN 和加速器协同搜索方法。我们通过在 FPGA 和 GPU 上进行大量实验来证明所提出的协同设计方法的有效性,并与现有工作进行了比较。本文强调了算法加速器协同设计的重要性和有效性,并呼吁在这个有趣且要求高的领域取得更多的研究突破。
物联网 (IoT) 是近年来不断发展的领域。随着部署的 IoT 设备数量不断增加,人们对在这些设备上加入机器学习的兴趣也与日俱增。低功耗微控制器提供了一个低成本的计算平台来部署智能 IoT 应用,但片上内存和计算能力极其有限。在这些应用中使用机器学习凸显了本地计算与将数据发送到云端等计算能力更强大的资源之间的权衡。本文通过人物分类和人物检测的计算机视觉任务探讨了这种权衡空间;人物分类涉及确定图像中是否存在人,而人物检测涉及为图像中的所有人提供边界框信息。本文使用现有模型执行这些任务,并根据延迟、能耗、内存和准确性等指标评估在本地运行模型和将数据发送到云端之间的权衡。所选模型在 nRF52840 SoC 上运行,这是一种低功耗 MCU 系统,支持 Thread 和 802.15.4 协议。我们的研究结果证实,在考虑能耗、内存、准确度和延迟的情况下,低能耗受限嵌入式系统中的本地计算对于人员分类是有意义的;但是,由于基本内存限制,这些平台与人员检测等更复杂的任务不兼容。
CGI OpenGrid Energy Control 处理电网中智能设备的事件和警报,与电网拓扑相关联,并应用自动或用户定义的规则(例如过滤、丰富和关联)来增强停电检测并确认停电恢复。这可以提高可靠性指标(例如 CAIDI 和 SAIDI),并降低运营成本。