许多分析计算都由迭代处理阶段主导,一直执行到满足收敛条件为止。为了加速此类工作负载,同时跟上数据的指数增长和 DRAM 容量的缓慢扩展,Spark 采用了内存外缓存中间结果。然而,堆外缓存需要对数据进行序列化和反序列化(serdes),这会增加大量开销,尤其是在数据集不断增长的情况下。本文提出了 TeraCache,这是 Spark 数据缓存的一个扩展,它使用内存映射 I/O(mmio)将所有缓存数据保留在堆上但不在内存中,从而避免了对 serdes 的需求。为了实现这一点,TeraCache 使用托管堆扩展了原始 JVM 堆,该托管堆驻留在内存映射的快速存储设备上,专门用于缓存数据。初步结果表明,与最先进的 serdes 方法相比,TeraCache 原型可以将缓存中间结果的机器学习 (ML) 工作负载加快多达 37%。
备注:驱逐设置算法是实现更强大的缓存正时攻击的关键1.last级高速缓存侧渠道攻击是实用的,刘,奥克兰,2015年,2015年2。加密地址缓存的新攻击和防御寻找驱逐集的理论和实践,奥克兰Vila,2019年4。对基于随机的保护缓存架构的系统分析。Purnal等。al。2021 5。最后一级的缓存侧通道攻击在现代公共云中是可行的,
微处理器描述HXRHPPC处理器集成了五个执行单元 - 一个整数单元(IU),浮点单元(FPU),分支处理单元(BPU),负载/存储单元(LSU)和系统寄存器单元(SRU)。并行执行五个指令的能力以及使用快速执行时间的简单指令产生高系统效率和吞吐量。大多数整数指令具有一个时钟周期的吞吐量。FPU是管道的,因此可以在每个时钟周期中发出单精确的多重ADD指令。处理器提供独立的片上,16个kbyte,四向设置缔合性,物理上的caches,用于指令和数据以及芯片指令和数据存储器管理单位(MMU)。它还通过使用两个独立指令和数据块地址
摘要 - 对性能的持续追求推动了专业人员,以结合多个内核,缓存,加速单元或投机执行,使系统变得非常复杂。另一方面,这些功能通常会暴露出构成新挑战的意外漏洞。为了进行检查,可以利用缓存或投机执行引入的定时差异以泄漏信息或检测活动模式。保护嵌入式系统免受现有攻击是极具挑战性的,而且由于新的微体系攻击的持续崛起(例如,幽灵和编排攻击),这使它变得更加困难。在本文中,我们提出了一种新方法,该方法基于计数示意图,用于检测嵌入式系统介绍的微处理器中的微体系攻击。这个想法是将安全检查模块添加到系统中(无需修改保护器,而不是在保护下),负责观察被提取的说明,并识别和发出信号可能的可疑活动,而无需干扰系统的标称活动。可以在设计时(在部署后重新编程)对所提出的方法进行编程,以便始终更新Checker能够识别的攻击列表。我们将所提出的方法集成到了大型RISC-V核心中,我们证明了它在检测几种版本的幽灵,编排,Rowhammer和Flush+重新加载攻击方面的有效性。在最佳配置中,提出的方法能够检测到100%的攻击,没有错误的警报,并引入了大约10%的面积开销,大约增加了4%的功率,并且没有降低工作频率。
媒体流媒体缓存并使用以下HTTP蒸汽协议为媒体播放器提供支持的网络内容,软件和流媒体:Apple HTTP Live流媒体(HLS),Microsoft HTTP Smooth Streaming(HSS),Adobe HTTP HTTP HTTP HTTP Dynaming(HDS)和MPEG DynamiC DynamiC Dynamic Addaptive Adpastive越过HTTP(HTTP)。媒体流媒体支持视频按需(VOD),实时视频,时移电视(TSTV),渐进下载,安全下载和从普通高性能HTTP缓存中的小对象缓存。媒体流媒体根据客户端位置,缓存可用性,缓存负载和所请求的内容执行用于缓存选择的复杂算法。
我们提出了玛格拉(Marghera),这是一种系统设计,可防止云中的跨VM微构造侧通道攻击。Marghera是基于隔离合同的,对于给定的CPU,它描述了物理线程和内存的分区,以防止通过共享的微构造资源来防止信息泄漏。我们为AMD EPYC 7543P(Modern Cloud CPU)开发了隔离合同。为此,我们首先确定如何在其物理线程之间共享微体系结构资源,包括缓存,cache-coherence目录和DRAM银行。然后,我们使用以前未知的,反向工程的索引功能开发着着色方案 - 全面分区这些资源。我们在Microsoft Hyper-V中实现Marghera,并使用云基准进行评估。我们的结果表明,我们的方法有效地消除了由共享的微构造资源造成的侧向通道,其性能较小。
我们提出了 Gamma,一种使用 Gustavson 算法解决前人工作挑战的 spMspM 加速器。Gamma 使用专门的处理单元和简单的高基数合并来执行 spMspM 的计算,并并行执行许多合并以实现高吞吐量。Gamma 使用一种新颖的片上存储结构,该结构结合了缓存和显式管理缓冲区的特性。该结构捕获了 Gustavson 的不规则重用模式,并通过明确解耦的数据移动传输数千个并发稀疏光纤(即行或列的坐标和值列表)。Gamma 采用一种新的动态调度算法,尽管存在不规则性,但仍能实现高利用率。我们还提出了新的预处理算法,以提高 Gamma 的效率和多功能性。因此,Gamma 的性能比之前的加速器高出 gmean 2.1 × ,并将内存流量减少了 gmean 2.2 × 和高达 13 × 。
10:30 – 12:00 沙龙 A 会议 5a - 工作负载和系统的分析 会议主席:Antonio Gonzáles (UPC) • 理解性能下降指令的后向片段 Craig Zilles、Gurindar Sohi (威斯康星大学) • 关于存储指令的值局部性 Kevin Lepak、Mikko Lipasti (威斯康星大学) • 基于 Alpha 21264 的 Compaq ES40 系统的性能分析 Zarka Cvetanovic、RE Kessler (康柏电脑公司) 10:30 – 12:00 沙龙 B 会议 5b - 可定制的系统 会议主席:Margaret Martonosi (普林斯顿大学) • Lx:可定制 VLIW 嵌入式处理的技术平台 Paolo Faraboschi、Joseph Fisher、Geoffrey Brown、Giuseppe Desoli (惠普实验室)、Fred Homewood (ST微电子学)• 可重构缓存及其在媒体处理中的应用 Parthasarathy Ranganathan(莱斯大学)、Sarita Adve(伊利诺伊大学)、Norman Jouppi(康柏西部研究实验室)• CHIMAERA:具有紧密耦合的可重构功能单元的高性能架构 Alex Ye、Prithviraj Banerjee、Andreas Moshovos(西北大学)、Scott Hauck(华盛顿大学)
巴基斯坦军方媒体部门周一称,安全部队在俾路支省偏远地区开展情报行动,消灭 27 名恐怖分子。三军公共关系部 (ISPR) 在一份声明中称,1 月 12 日,由于收到恐怖分子出现的报告,安全部队在俾路支省卡奇区开展了情报搜集行动。在行动中,部队“秘密包围并有效打击恐怖分子,在激烈交火后,27 名恐怖分子被击毙”。ISPR 补充道,行动中还摧毁了多个藏身之处,包括武器、弹药和爆炸物的储藏地。ISPR 称,这些恐怖分子参与了多起针对安全部队和无辜平民的恐怖活动,遭到执法机构的严密通缉。 “巴基斯坦安全部队与国家步调一致,决心挫败破坏俾路支省和平、稳定和进步的企图。”自塔利班统治者回归以来,该国一直饱受暴力袭击之苦