摘要 - 神经网络(NNS)已经证明了它们在从计算机视觉到自然语言处理的各个领域中的潜力。在各种NN中,二维(2D)和三维(3D)卷积神经网络(CNN)在广泛的应用中已被广泛采用,例如图像分类和视频识别,因为它们在提取2D和3D特征方面具有出色的功能。但是,标准的2D和3D CNN无法捕获其模型不确定性,这对于包括医疗保健和自动驾驶在内的许多关键安全应用至关重要。相比之下,作为CNN的一种变体,贝叶斯卷积神经网络(贝叶斯)(贝叶斯)已经证明了它们通过数学基础在预测中表达不确定性的能力。尽管如此,由于采样和随后的前向通过多次通过了整个网络,因此贝内斯科的计算要求并未在工业实践中广泛使用。结果,与标准CNN相比,这些过程显着增加了计算和内存消耗量。本文提出了一种新型的基于FPGA的硬件体系结构,以加速通过Monte Carlo辍学推断的2D和3D贝内斯科。与其他最先进的加速器相比,贝内斯科的设计可以达到高达高达能量效率的4倍,而计算效率的9倍。考虑部分贝叶斯推断,提出了一个自动框架,以探索硬件和算法性能之间的权衡。进行了大量实验,以证明我们提出的框架可以有效地发现设计空间中的最佳点。
主要关键词





