Loading...
机构名称:
¥ 1.0

摘要。本文介绍了用于图像识别的深度卷积神经网络训练的性能-能量权衡研究。使用配备 Nvidia Quadro RTX 6000 和 Nvidia V100 GPU 的系统测试了几种具有代表性且广泛采用的网络模型,例如 Alexnet、VGG-19、Inception V3、Inception V4、Resnet50 和 Resnet152。使用 GPU 功率上限,我们发现除了默认配置之外,还可以最小化三个不同的指标:能量 (E)、能量延迟积 (EDP) 以及能量延迟总和 (EDS),从而节省大量能源,EDP 和 EDS 的性能损失较低到中等。具体来说,对于 Quadro 6000 和最小化 E,我们获得了 28.5%–32.5% 的节能效果;对于 EDP,我们获得了 25%–28% 的节能效果,平均性能损失为 4.5%–15.4%;对于 EDS (k=2),我们获得了 22%–27% 的节能效果,平均性能损失为 4.5%–13.8%。对于 V100,我们发现平均节能效果为 24%–33%;对于 EDP,我们获得了 23%–27% 的节能效果,平均性能损失为 13%–21%;对于 EDS (k=2),我们获得了 23.5%–27.3% 的节能效果,平均性能损失为 4.5%–13.8%。

GPU 功率上限用于权衡能源性能...

GPU 功率上限用于权衡能源性能...PDF文件第1页

GPU 功率上限用于权衡能源性能...PDF文件第2页

GPU 功率上限用于权衡能源性能...PDF文件第3页

GPU 功率上限用于权衡能源性能...PDF文件第4页

GPU 功率上限用于权衡能源性能...PDF文件第5页

相关文件推荐

2025 年
¥1.0
2023 年
¥3.0
2025 年
¥1.0
2021 年
¥2.0
2024 年
¥1.0
2010 年
¥13.0
2022 年
¥1.0