我们提出了 Gamma,一种使用 Gustavson 算法解决前人工作挑战的 spMspM 加速器。Gamma 使用专门的处理单元和简单的高基数合并来执行 spMspM 的计算,并并行执行许多合并以实现高吞吐量。Gamma 使用一种新颖的片上存储结构,该结构结合了缓存和显式管理缓冲区的特性。该结构捕获了 Gustavson 的不规则重用模式,并通过明确解耦的数据移动传输数千个并发稀疏光纤(即行或列的坐标和值列表)。Gamma 采用一种新的动态调度算法,尽管存在不规则性,但仍能实现高利用率。我们还提出了新的预处理算法,以提高 Gamma 的效率和多功能性。因此,Gamma 的性能比之前的加速器高出 gmean 2.1 × ,并将内存流量减少了 gmean 2.2 × 和高达 13 × 。
主要关键词