Loading...
机构名称:
¥ 1.0

摘要 - 在图形处理单元(GPU)上执行的深神经网络(DNN)的可靠性评估是一个具有挑战性的问题,因为硬件体系结构非常复杂,软件框架由许多抽象层组成。虽然软件级故障注入是评估复杂应用程序可靠性的一种常见且快速的方法,但它可能会产生不切实际的结果,因为它对硬件资源的访问有限,并且采用的故障模型可能太幼稚(即单位和双位翻转)。相反,用中子光束注射物理断层提供了现实的错误率,但缺乏故障传播可见性。本文提出了DNN故障模型的表征,该模型在软件级别结合了中子束实验和故障注入。我们将运行一般矩阵乘法(GEMM)和DNN的GPU暴露于梁中子,以测量其错误率。在DNNS上,我们观察到关键错误的百分比可能高达61%,并表明ECC在减少关键错误方面无效。然后,我们使用RTL模拟得出的故障模型进行了互补的软件级故障注入。我们的结果表明,通过注射复杂的断层模型,Yolov3的误导率被验证为非常接近通过光束实验测得的速率,该速率比仅使用单位倒换的断层注射测量的频率高8.66倍。

表征深神经网络中子诱导的断层模型

表征深神经网络中子诱导的断层模型PDF文件第1页

表征深神经网络中子诱导的断层模型PDF文件第2页

表征深神经网络中子诱导的断层模型PDF文件第3页

表征深神经网络中子诱导的断层模型PDF文件第4页

表征深神经网络中子诱导的断层模型PDF文件第5页

相关文件推荐

2025 年
¥3.0
2024 年
¥1.0
2024 年
¥1.0
2013 年
¥1.0