摘要 - 不像众所周知的计数器模式内存en-哭泣(例如SGX1),更近期的内存加密(例如SGX2,SEV)没有柜台。在不访问任何计数器的情况下,这种无反内存加密可以改善计数器模式加密的性能,并因此获得广泛的采用。无抵抗的加密仍然会产生昂贵的开销。在无反加密后,密码计算将数据作为其直接输入。因此,只有在丢失的数据从内存到达后,才能顺序计算用于解密数据的密码;这需要所有最后级别的缓存失误才能在所需数据从内存到达后停滞在密码计算上。我们的实际系统测量结果发现无反加密可以平均减少不规则的工作量9%。我们观察到计数器模式加密会产生昂贵的内存访问开销,其密码计算通常可以在数据到达之前完成,因为它们将计数器作为输入而不是数据,而不是数据柜员比数据更好。因此,我们探讨了如何结合两种加密模式以实现两全其美的最佳 - 无反对加密的有效内存访问和计数器模式加密的快速密码计算。对于不规则的工作负载,我们提出的内存加密 - 反灯加密 - 达到98%的无内存加密性能的平均性能。当存储器带宽饥饿时,在最坏情况下,反光加密的速度仅比无抵抗加密慢1.4%。
增强学习(RL)是代理通过与经验数据集进行交互来学习最佳行为的过程,所有这些都旨在最大化奖励信号。rl算法通常在现实世界应用中面临性能挑战,尤其是在使用广泛而多样的数据集培训时。例如,诸如自动驾驶汽车之类的应用程序包括感官数据,Dy-Namic的交通信息(包括其他车辆和行人的运动),关键的风险评估以及各种代理行动。因此,由于对大量体验数据集进行了抽样,因此RL训练可能完全不适合硬件缓存,并且在内存和计算单元(例如CPU,GPU)之间所需的频繁数据传输,尤其是批量批次更新。这种瓶颈会产生大量的执行潜伏期,并影响整体培训时间。为了减轻最近提出的以内存为中心的计算范例(例如内存中的处理(PIM)),可以通过执行内存设备内的计算来解决与内存延迟相关的瓶颈。在本文中,我们介绍了Swiftrl,该文章探讨了现实世界中PIM体系结构加速流行的RL工作负载及其培训阶段的潜力。我们在Upmem Pim系统上调整了RL算法,即Tabular Q-Learning和SARSA,并首先使用两种不同的环境和三种采样策略观察他们的性能。此外,我们开发和评估了针对硬件优化的Q学习的多代理版本,并说明了如何使用多个代理来利用PIM进行算法缩放。然后,我们通过近似Q值更新功能(由于运行时库使用的运行时指令仿真而避免了高性能成本),并结合了基础算法所需的某些PIM特异性例程,从而实现了RL适应PIM期间的性能选择策略。我们使用Upmem硬件在OpenAI健身房环境上实验评估RL工作负载。我们的结果表明,当PIM核心数量增加16×(125至2000)时,性能的近线性缩放比例为15倍。我们还将我们的PIM实施与Intel(R)Xeon(R)Silver 4110 CPU和NVIDIA RTX 3090 GPU进行了比较,并在Upmem PIM系统上观察到具有不同实现的UPMEM PIM系统。
黄油含量(又称矩形)是一个循环图案1,在图形分析中至关重要。尤其是,在两部分图上[41,61,3,97]上,But-Ter-ter-ter-ter-ter-ter-ter-ter-ter-ter-ter-ter-ter-ter-ter-ter-ter-ter-ter-ter-ter-ter-ter-ter-ter-ter-ter-ter-ter-ter-ter-ter-terlif y [78,80,77,76],可以将顶点分为两个不相交组,并且仅在两组Vertices之间进行边缘。考虑图G =(v,e),其中v和e分别是ver和边缘的集合。黄油粉计数的问题是计算G中的黄油含量总数。黄油流数在许多应用中起着重要的作用,例如垃圾邮件检测[19,81,82],推荐系统[70],单词文献集群[16],研究小组识别[15],并根据传输理论[11]链接前词典。最近,Lyu等。[46]在电子商务的欺诈检测场景中,将黄油计算到修剪的顶点。
在轨人工智能和机器学习将颠覆卫星服务和应用:地球观测运营商正在执行更多的机载处理,以实时提取有价值的见解用于灾害管理,而不是在地面上进行缓慢的基于云的后处理。智能电信转发器正在根据实时流量和链路需求自主重新配置和优化其频率计划,以最大限度地提高性能,而无需地面干预。
微构造的侧通道攻击动摇了现代处理器设计的基础。针对这些攻击的基石防御是为了确保关键安全计划不会使用秘密依赖数据作为地址。简单:不要将秘密作为地址传递给,例如数据存储器说明。然而,发现数据内存依赖性预定器(DMP)(DMP)(将程序数据直接从内存系统内部转换为地址)质疑该方法是否会继续保持安全。本文表明,DMP的安全威胁要比以前想象的要差得多,并使用Apple M-Series DMP证明了对关键安全软件的首次端到端攻击。对我们的攻击进行了探讨,这是对DMP的行为的新理解,该行为表明Apple DMP将代表任何受害者计划激活,并试图“泄漏”任何类似于指针的缓存数据。从这种理解中,我们签署了一种新型的输入攻击,该攻击使用DMP对经典的经典恒定时间实现(OpenSSL Diffie-Hellman键交换,GO RSA解密)和后Quantum Cryptogragra-Phy(Crystals-kyber-kyber-kyber and Crystals-dilith)进行端到端的键提取。
• 多路复用两个数据流使内存总线能够以大约 2 倍于原生 DRAM 的速度运行 • 克服了 DRAM 设备扩展的限制 • 建立并扩展了更高模块智能的趋势,以提供更大的带宽和容量 • MRDIMM 采用多路复用来扩展 DDR5 性能路线图
大规模数据存储的爆炸性增长和对超快数据处理的需求需要具有出色性能的创新记忆设备。2D材料及其带有原子尖锐界面的范德华异质结构对内存设备的创新有着巨大的希望。在这里,这项工作呈现出所有由2D材料制成的功能层,可实现超快编程/擦除速度(20 ns),高消光率(最高10 8)和多位存储能力。这些设备还表现出长期的数据保留超过10年,这是由高栅极偶联比(GCR)和功能层之间的原子尖锐接口促进的。此外,这项工作证明了通过协同电气和光学操作在单个设备单元上实现“或”逻辑门的实现。目前的结果为下一代超速,超级寿命,非挥发性存储器设备提供了坚实的基础,并具有扩展制造和灵活的电子应用程序的扩展。
摘要 - 在以人为本的环境中执行多功能移动操作任务,可以有效地将学习的任务和经验从一个机器人转移到另一个机器人或跨不同环境的能力是关键。在本文中,我们提出了一个多功能的单项和多手册移动操作框架,可促进能力和知识在不同的任务,环境和机器人之间的传递。我们的框架将基于负担的任务描述为以记忆为中心的ARMAR人形机器人机器人家族的认知结构,该架构支持分享经验和演示以进行转移学习。通过代表可承受的移动操作动作,即。例如,机器人与其环境的交互可能性,我们为在各种环境中对已知和未知对象的自动单和多手动操纵提供了一个统一的框架。我们演示了该框架在实际实验中对于多个机器人,任务和环境的适用性。这包括抓住已知和未知的对象,放置对象,双人对象抓握,启用记忆的技能转移在抽屉开放方案中,跨两个不同的人形机器人开放场景,以及从人类演示中学到的倾泻任务。接受后,代码将通过我们的项目第1页发布。
人类的大脑可以通过动态变化的环境不断地获取和学习新技能和知识,而不会忘记以前学习的信息。这样的能力可以选择性地将一些重要且最近看到的信息转移到大脑的持续知识区域。受到这种直觉的启发,我们提出了一种基于内存的新方法,用于持续学习中的图像重建和重构,由临时和不断发展的记忆组成,并具有两种不同的存储策略,涉及临时和永久记忆。临时内存旨在保留最新信息,而不断发展的内存可以动态增加其功能,以保留永久的知识信息。这是通过提出的内存扩展机械性来实现的,该机构有选择地将这些数据样本从临时存储器转移到根据信息新颖性标准在进化存储器中罚款的新群集。这种机制促进了进化记忆中群集之间的知识多样性,从而通过使用紧凑的mem-ory容量来捕获更多多样化的信息。此外,我们提出了一种两步优化策略,用于训练变分自动编码器(VAE)以实现生成和表示学习任务,该策略使用两个优化路径分别更新了生成器和推理模型。这种方法导致了一代和重建性能之间的取舍。源代码和补充材料(SM)可在https://github.com/dtuzi123/demc上找到。我们从经验和理论上表明,所提出的方法可以学习有意义的潜在表示,同时从不同领域产生各种图像。