识别 GPU 微架构漏洞的有效方法___XiaoMi-AI 助力科研平台

识别 GPU 微架构漏洞的有效方法

可下载资源数量

已经购买

下载数量：1

单价	0 1.0
Coupon	100% 0%
Total	0 1.0

点击下载点击购买并下载

点击购买，资源将自动在新窗口打开.

机构名称：

识别 GPU 微架构漏洞的有效方法

¥ 1.0

热度

摘要 — 图形处理单元 (GPU) 越来越多地被应用于可靠性至关重要的多个领域，例如自动驾驶汽车和自主系统。不幸的是，GPU 设备已被证明具有很高的错误率，而实时安全关键应用程序所施加的限制使得传统的（且昂贵的）基于复制的强化解决方案不足。这项工作提出了一种有效的方法来识别 GPU 模块中的架构易受攻击的位置，即如果损坏则最影响正确指令执行的位置。我们首先通过基于寄存器传输级 (RTL) 故障注入实验的创新方法来识别 GPU 模型的架构漏洞。然后，我们通过对已确定为关键的触发器应用选择性强化来减轻故障影响。我们评估了三种强化策略：三重模块冗余 (TMR)、针对 SET 的三重模块冗余 (∆ TMR) 和双联锁存储单元（骰子触发器）。在考虑功能单元、流水线寄存器和 Warp 调度器控制器的公开 GPU 模型 (FlexGripPlus) 上收集的结果表明，我们的方法可以容忍流水线寄存器中 85% 到 99% 的故障、功能单元中 50% 到 100% 的故障以及 Warp 调度器中高达 10% 的故障，同时降低硬件开销（与传统 TMR 相比，在 58% 到 94% 的范围内）。最后，我们调整了该方法以针对永久性故障执行补充评估，并确定了容易在 GPU 上传播故障影响的关键位置。我们发现，对瞬态故障至关重要的触发器中相当一部分（65% 到 98%）对永久性故障也至关重要。

添加pdf代下载 VIP点击下载文件