摘要 —人工智能 (AI) 和机器学习 (ML) 正在彻底改变许多研究领域,例如视觉识别、自然语言处理、自动驾驶汽车和预测。传统的冯诺依曼计算架构具有分离的处理单元和存储设备,随着工艺技术的扩展,其计算性能一直在迅速提高。然而,在人工智能和机器学习时代,存储设备和处理单元之间的数据传输成为系统的瓶颈。为了解决这个数据移动问题,以内存为中心的计算采用了将存储设备与处理单元合并的方法,以便可以在同一位置进行计算而无需移动任何数据。内存处理 (PIM) 引起了研究界的关注,因为它可以通过最小化数据移动来显着提高以内存为中心的计算系统的能源效率。尽管 PIM 的好处被广泛接受,但它的局限性和挑战尚未得到彻底研究。本文全面研究了基于各种存储设备类型(例如静态随机存取存储器 (SRAM)、动态随机存取存储器 (DRAM) 和电阻式存储器 (ReRAM))的最先进的 PIM 研究工作。我们将概述每种存储器类型的 PIM 设计,涵盖位单元、电路和架构。然后,我们将讨论一种新的软件堆栈标准及其将 PIM 与传统计算架构相结合所面临的挑战。最后,我们将讨论 PIM 的各种未来研究方向,以进一步减少数据转换开销、提高测试准确性并最大限度地减少内存内数据移动。
一种顺序靶向策略中断裸体驱动的亚克隆介导的胶质母细胞瘤的进展。 Tragider 7.8, Andreas Till 7, Franziska K. Lorbeer 7, Anja Wieland 7, Timo Wilhelm book 9, Ashar Ahmad 10, Holger Fr € 10.11, Igor Cima 1,2,4, Shruthi Prasad 1,2,4,5, Johann Matschke 12, Verena Jendrossek 12, Marc Remke M. € undesigned by 2.14, Alexander Roesch 2.4.15, Jens T. Siveke 2.4.16.17, Christel Herold-Mende 18, Tobias Blau 19, Kathy Keyvani 19, Frank K. H. van Landghem 20, Torsten Pietsch 20, J € Orgfelsberg 21, Guido Reifenberger 2.21, Michael Weller €7.8,Matthias Simon 23.24,Martin Glas 1,2,3,4和BJOrnSchefüfflen1,2,4,5,25
石墨烯是一块薄薄的碳原子,类似于金属,因为它的电子在纸板的平面上自由移动,形成密集的云,通常阻止其他颗粒和离子穿过它。但是,电子场可以使质子从上到下渗透薄片,从而将石墨烯变成一种筛子1。某些质子与云中的电子结合,形成缺陷,而缺陷又在剩下的电子流过纸张时散射其剩余的电子。结果类似于不受监管的交通交集:电子在一个方向上移动的电子与质子来自另一个。第619页,Tong等人。2报告一种驯服这些质子和电子产生两个独立电流的方法。非常不可渗透是石墨烯的电子云,即使是最小的原子,氢也可能需要数十亿年的时间才能通过纸。从氢叶中去除孤独的质子,其质子甚至更小,并且具有电荷。电场可以将质子通过聚合物或电解质驱动到相邻的石墨烯薄片中,从而使石墨烯成为易于用作氢燃料电池过滤器的杂物材料。这些设备通过将氢原子拆分为质子和电子来起作用:元素会产生电流,然后与质子和氧气重组以形成水作为废物。石墨烯和这些漫游质子之间的相互作用也可用于计算。以及渗透石墨烯,质子可以与其电子结合。切换的能力,尽管原始石墨烯具有出色的电导率(比金属的电导率更好,但如果其电子中的足够多的电子结合到传入的质子,材料就会变成电绝缘体。,但是可以通过使用电极(称为栅极)施加将电场泵入石墨烯的电场来恢复其电导率。
摘要 — 通过使用一组数学方程式捕捉一阶性能现象,分析模型使架构师能够比周期精确模拟快几个数量级地进行早期设计空间探索。但是,如果由于模型不准确而导致通过模型获得的结论具有误导性,则这种速度优势无效。因此,实用的分析模型需要足够准确,以捕捉广泛应用程序和架构配置中的关键性能趋势。在这项工作中,我们专注于分析建模新兴的内存发散 GPU 计算应用程序的性能,这些应用程序在机器学习和数据分析等领域很常见。这些应用程序的空间局部性较差,导致 L1 缓存频繁阻塞,因为应用程序发出的并发缓存未命中数量远远超过缓存可以支持的次数,从而削弱了 GPU 使用线程级并行 (TLP) 隐藏内存延迟的能力。我们提出了 GPU 内存发散模型 (MDM),该模型忠实地捕捉了内存发散应用程序的关键性能特征,包括内存请求批处理和过多的 NoC/DRAM 排队延迟。我们根据详细的模拟和真实硬件验证了 MDM,并报告了以下方面的重大改进:(1) 范围:除了非内存发散应用程序外,还能够对流行的内存发散应用程序进行建模;(2) 实用性:通过使用二进制插装而不是功能模拟来计算模型输入,速度提高了 6.1 倍;(3) 准确性:平均预测误差为 13.9%,而最先进的 GPUMech 模型为 162%。
相变内存(PCM)是一种非易失性存储技术,被认为是存储类内存和神经启发设备的最有前途的候选人。通常是根据Gete制造的 - SB 2 TE 3伪二元合金。但是,它具有技术局限性,例如电阻的噪声和漂移以及用于现实世界设备应用的高电流。最近,在记忆细胞中使用功能性(屏障)材料异质化材料的异质结构化PCM(HET-PCM),通过降低此类固有限制,在设备性能中表现出巨大的增强器件性能的增强。从这个角度来看,我们与常规合金型PCM相比,介绍了HET-PCM的最新发展和相关的操作机制。我们还突出了相应的设备增强功能,尤其是它们的热稳定性,耐力,复位电流密度,设定速度和电阻漂移。最后,我们为HET-PCM的有希望的研究方向提供了前景,包括基于PCM的神经形态计算。
设计域特定的神经网络是一项耗时,容易出错且昂贵的任务。神经体系结构搜索(NAS),以简化特定于域的模型开发,但在微控制器上进行时间分类的文献存在差距。因此,我们调整了可区分的神经修道搜索搜索(DNA)的概念,以解决有关资源约束的Mi-Crocontrollers(MCUS)的时间序列分类问题。我们介绍了Micronas,这是DNA,延迟查找表,动态音量和专门针对MCUS时序列分类设计的新颖搜索空间的DNA,延迟查找表,动态结合表和新颖的搜索空间的Micronas。所得系统是硬件感知的,可以生成满足用户定义的执行延迟和峰值内存消耗的限制的神经网络体系结构。我们在不同的MCUS和标准基准数据集上进行的广泛研究表明,Micronas找到了达到性能的MCU量身定制的体系结构(F1得分),附近是最先进的桌面模型。我们还表明,与独立于域的NAS基准(如DARTS)相比,我们的方法在遵守记忆和潜伏期限制方面具有优越性。
摘要 - 数据科学在生物医学和生理时间序列和空间图的分析中的使用允许提取有关生物体整体和单个器官的动态状态和功能的可靠信息。在本文中,基于记忆函数形式主义,这是统计物理学的方法之一,我们分析了人脑和人类神经肌肉系统的生物电活动的信号。我们从对人类信号中揭示的全球模式的研究进行过渡到对时间动态各个部分的分析。基于局部特征和参数(功率谱和统计记忆度量的时间窗口绘图),我们建立了周期性模式和动态模式相关性的变化。在时间序列分析的情况下,各种定位过程扮演着“统计显微镜”的作用,该过程捕获信号详细信息或反映对象的局部结构的特征。在记忆功能形式主义框架内引入的广义和局部参数被证明可用于寻找心脏病学,神经生理学,流行病学以及研究人类感觉运动和运动活性的诊断标准。
为了提供连接世界的数据基础架构技术,我们正在建立最强大的基础:与客户的合作伙伴关系。在25年内全球领先的技术公司信任,我们使用为客户当前的需求和未来野心设计的半导体解决方案搬迁,存储,处理和保护世界数据。通过深层协作和透明度的过程,我们最终改变了明天的企业,云,汽车和载体体系结构的变化方式。
内存计算 (IMC) 已成为一种新的计算范式,能够缓解或抑制内存瓶颈,这是现代数字计算中能源效率和延迟的主要问题。虽然 IMC 概念简单且前景广阔,但其实施细节涵盖了广泛的问题和解决方案,包括各种内存技术、电路拓扑和编程/处理算法。本观点旨在提供涵盖 IMC 这一广泛主题的方向图。首先,将介绍内存技术,包括传统的互补金属氧化物半导体和新兴的电阻/忆阻设备。然后,将考虑电路架构,描述其目的和应用。电路包括流行的交叉点阵列和其他更先进的结构,例如闭环存储器阵列和三元内容可寻址存储器。同一电路可能服务于完全不同的应用,例如,交叉点阵列可用于加速神经网络中前向传播的矩阵向量乘法和反向传播训练的外积。本文将讨论实现电路功能多样化的不同算法和记忆特性。最后,本文将介绍 IMC 面临的主要挑战和机遇。
摘要 — 脑启发式方法可以有效地分析生物神经网络的活动,并以冯·诺依曼架构无法实现的能效解决计算难题,这表明对神经元通信和功能的理解有了显著的提高。在这里,我们提出了一种脑启发式多模态信号处理系统,该系统具有有机忆阻器阵列,可以潜在地整合信号传感、存储和计算。为了促进多模态信号处理系统的设计,我们使用了四个组件。首先,我们提出了一个多模态信号传感模块,主要负责多模态(图像、回声、嗅觉、肌肉和味觉)信号的收集、融合和存储。其次,在制造白蛋白忆阻器后,构建了一个高密度交叉点忆阻突触阵列,以实现计算、数据存储和通信层之间的密集连接。第三,考虑到大脑区域的结构和功能,我们展示了一个用于分层学习的通用学习模块,它可以识别和想象多模态信息。最后设计了必要的外围电路模块(包括无胜者竞争功能电路、模拟数字转换器、数字模拟转换器、脉冲调制器等)。值得注意的是,我们的系统可以每秒捕获大量数据并对多模态信号进行原位处理。这项研究有望帮助实现纳米材料与神经形态计算系统和节能集成电路的深度集成。