Loading...
机构名称:
¥ 1.0

摘要 — 低功耗(1-20 mW)近传感器计算的最新应用需要采用浮点算法来协调高精度结果和宽动态范围。在本文中,我们提出了一种低功耗多核计算集群,该集群利用跨精度计算的细粒度可调原理,以最低的功率预算为近传感器应用提供支持。我们的解决方案基于开源 RISC-V 架构,将并行化和子字矢量化与专用互连设计相结合,能够在内核之间共享浮点单元 (FPU)。在此架构的基础上,我们提供了全面的软件堆栈支持,包括并行低级运行时、编译工具链和高级编程模型,旨在支持端到端应用程序的开发。我们对周期精确的 FPGA 仿真器上的跨精度集群的设计空间进行了详尽的探索,并改变了内核和 FPU 的数量以最大限度地提高性能。正交地,我们进行了垂直探索,以确定在非功能性要求(工作频率、功率和面积)方面最有效的解决方案。我们对一组代表近传感器处理域的基准进行了实验评估,并通过对功耗进行布局布线后分析来补充时序结果。与最先进的技术相比,我们的解决方案在能源效率方面优于竞争对手,在单精度标量上达到 97 Gflop/s/W 的峰值,在半精度矢量上达到 162 Gflop/s/W。最后,一个实际用例证明了我们的方法在满足精度约束方面的有效性。

用于高效近传感器数据分析的低功耗跨精度浮点集群

用于高效近传感器数据分析的低功耗跨精度浮点集群PDF文件第1页

用于高效近传感器数据分析的低功耗跨精度浮点集群PDF文件第2页

用于高效近传感器数据分析的低功耗跨精度浮点集群PDF文件第3页

用于高效近传感器数据分析的低功耗跨精度浮点集群PDF文件第4页

用于高效近传感器数据分析的低功耗跨精度浮点集群PDF文件第5页

相关文件推荐