摘要 —近年来,粗粒度可重构架构 (CGRA) 加速器越来越多地部署在物联网 (IoT) 终端节点中。现代 CGRA 必须支持并有效加速整数和浮点 (FP) 运算。在本文中,我们提出了一种超低功耗可调精度 CGRA 架构模板,称为 TRANSprecision 浮点可编程架构 (TRANSPIRE),及其支持整数和 FP 运算的相关编译流。TRANSPIRE 采用跨精度计算和多个单指令多数据 (SIMD) 来加速 FP 操作,同时提高能源效率。实验结果表明,TRANSPIRE 实现了最大 10.06 × 的性能提升并且消耗 12 .相对于基于 RISC-V 的 CPU,其能耗降低了 91 倍,并且具有支持 SIMD 样式矢量化和 FP 数据类型的增强型 ISA,同时执行近传感器计算和嵌入式机器学习的应用程序,面积开销仅为 1.25 倍。
主要关键词