摘要。本文介绍了用于图像识别的深度卷积神经网络训练的性能-能量权衡研究。使用配备 Nvidia Quadro RTX 6000 和 Nvidia V100 GPU 的系统测试了几种具有代表性且广泛采用的网络模型,例如 Alexnet、VGG-19、Inception V3、Inception V4、Resnet50 和 Resnet152。使用 GPU 功率上限,我们发现除了默认配置之外,还可以最小化三个不同的指标:能量 (E)、能量延迟积 (EDP) 以及能量延迟总和 (EDS),从而节省大量能源,EDP 和 EDS 的性能损失较低到中等。具体来说,对于 Quadro 6000 和最小化 E,我们获得了 28.5%–32.5% 的节能效果;对于 EDP,我们获得了 25%–28% 的节能效果,平均性能损失为 4.5%–15.4%;对于 EDS (k=2),我们获得了 22%–27% 的节能效果,平均性能损失为 4.5%–13.8%。对于 V100,我们发现平均节能效果为 24%–33%;对于 EDP,我们获得了 23%–27% 的节能效果,平均性能损失为 13%–21%;对于 EDS (k=2),我们获得了 23.5%–27.3% 的节能效果,平均性能损失为 4.5%–13.8%。
主要关键词