摘要 - 在本文中,我们在现代英特尔处理器中揭示了一类新的Prefetcher XPT Prefetcher的存在,该处理器从未正式详细介绍。它在预测负载请求会导致LLC失误时,绕过最后一级缓存(LLC)查找。我们证明了XPT Prefetcher在不同的内核之间共享,这使攻击者能够构建跨核侧通道和掩护通道攻击。我们提出了一种跨核攻击机制P Refetch X,以泄露用户的敏感数据和活动。我们从经验上证明,Prefetch X可用于提取现实世界中RSA应用程序的私钥。fur-hoverore,我们表明precth x可以启用侧向通道攻击,以监视用户的击键和网络流量模式。我们的两次跨核秘密通道攻击也看到较低的错误率和122 KIB/s的最大通道容量。由于P Refetch X的无缓存功能,当前基于缓存的缓解措施对我们的攻击无效。总的来说,我们的工作发现了XPT Prefetcher的重要脆弱性,可以利用这些脆弱性,以损害密码学和处理器核心中敏感信息的机密性。
现代服务器工作负载具有较大的代码占用空间,由于指令缓存容量未命中,这些代码很容易出现前端瓶颈。即使现代处理器中实现了积极的提取定向指令预取 (FDIP),由于 I-Cache 未命中,仍然会出现严重的前端停顿。FDIP 可以容忍 BPU 预测路径上发生的大部分未命中,而不会导致停顿。然而,先前的指令预取工作并非设计用于 FDIP 处理器。它们的唯一目标是减少 I-Cache 未命中,而 FDIP 处理器则旨在容忍它们。设计与 FDIP 协同工作的指令预取器需要确定影响前端性能的缓存未命中比例(未被 FDIP 完全隐藏),并仅针对它们。在本文中,我们提出了优先级定向指令预取 (PDIP),这是一种新颖的指令预取技术,它通过仅针对 FDIP 遇到困难的目标发出预取来补充 FDIP——沿着导致前端停顿事件的重新引导路径。PDIP 识别这些目标并将它们与未来预取的触发器相关联。在 43.5KB 的预算下,PDIP 在重要的工作负载(例如 Cassandra)上实现了高达 5.1% 的 IPC 加速,并在 16 个基准测试中实现了 3.2% 的几何平均 IPC 加速。