摘要——基于头皮记录脑电图 (EEG) 的脑机接口 (BCI) 系统可以极大地改善患有运动障碍的人的生活质量。创建由多个卷积、LSTM 和全连接层组成的深度神经网络来解码 EEG 信号,以最大限度地提高人类意图识别的准确性。然而,之前的 FPGA、ASIC、ReRAM 和光子加速器在处理实时意图识别时无法保持足够的电池寿命。在本文中,我们提出了一种超低功耗光子加速器 MindReading,仅通过低位宽的加法和移位运算即可实现人类意图识别。与之前的神经网络加速器相比,在保持实时处理吞吐量的情况下,MindReading 将功耗降低了 62.7%,并将每瓦吞吐量提高了 168%。
摘要——基于头皮记录脑电图 (EEG) 的脑机接口 (BCI) 系统可以极大地改善患有运动障碍的人的生活质量。创建由多个卷积、LSTM 和全连接层组成的深度神经网络来解码 EEG 信号,以最大限度地提高人类意图识别的准确性。然而,之前的 FPGA、ASIC、ReRAM 和光子加速器在处理实时意图识别时无法保持足够的电池寿命。在本文中,我们提出了一种超低功耗光子加速器 MindReading,仅通过低位宽的加法和移位运算即可实现人类意图识别。与之前的神经网络加速器相比,在保持实时处理吞吐量的情况下,MindReading 将功耗降低了 62.7%,并将每瓦吞吐量提高了 168%。
摘要:我们对硬件神经网络(NN)进行了不同的仿真实验,以分析不同数据集在网络准确性中不同NN体系结构的突触数量的作用。一项在4 kbit 1T1R reram阵列上的技术,其中采用了基于H FO 2电介质的电阻开关设备作为参考。在我们的研究中,考虑了完全致密的(FDNN)和卷积神经网络(CNN),在这种情况下,在突触的数量和隐藏层神经元的数量方面,NN的大小各不相同。cnns效果更好。如果包括量化的突触权重,我们观察到随着突触的数量减少,NN的精度显着降低。在这方面,必须实现突触数量与NN准确性之间的权衡。因此,CNN架构必须经过精心设计;特别是,注意到不同的数据集根据其复杂性需要特定的架构以取得良好的结果。表明,由于可以在NN硬件实现的优化中更改的变量数量,因此必须在每种情况下都在突触重量级别,NN体系结构等方面使用特定的解决方案。
摘要:近年来,内存计算 (CIM) 得到了广泛研究,通过减少数据移动来提高计算的能效。目前,CIM 经常用于数据密集型计算。数据密集型计算应用,例如机器学习 (ML) 中的各种神经网络 (NN),被视为“软”计算任务。“软”计算任务是可以容忍低计算精度且准确度损失较小的计算。然而,针对数值计算的“硬”任务需要高精度计算,同时也伴随着能效问题。数值计算存在于许多应用中,包括偏微分方程 (PDE) 和大规模矩阵乘法。因此,有必要研究用于数值计算的 CIM。本文回顾了用于数值计算的 CIM 的最新发展。详细推导了求解偏微分方程的不同种类的数值方法和矩阵的变换。本文还讨论了对数值计算效率影响很大的大规模矩阵的迭代计算问题,重点介绍了基于ReRAM的偏微分方程求解器的工作过程,并总结了其他PDE求解器以及CIM在数值计算中的研究进展,最后对高精度CIM在数值计算中的应用前景和未来进行了展望。
摘要 —人工智能 (AI) 和机器学习 (ML) 正在彻底改变许多研究领域,例如视觉识别、自然语言处理、自动驾驶汽车和预测。传统的冯诺依曼计算架构具有分离的处理单元和存储设备,随着工艺技术的扩展,其计算性能一直在迅速提高。然而,在人工智能和机器学习时代,存储设备和处理单元之间的数据传输成为系统的瓶颈。为了解决这个数据移动问题,以内存为中心的计算采用了将存储设备与处理单元合并的方法,以便可以在同一位置进行计算而无需移动任何数据。内存处理 (PIM) 引起了研究界的关注,因为它可以通过最小化数据移动来显着提高以内存为中心的计算系统的能源效率。尽管 PIM 的好处被广泛接受,但它的局限性和挑战尚未得到彻底研究。本文全面研究了基于各种存储设备类型(例如静态随机存取存储器 (SRAM)、动态随机存取存储器 (DRAM) 和电阻式存储器 (ReRAM))的最先进的 PIM 研究工作。我们将概述每种存储器类型的 PIM 设计,涵盖位单元、电路和架构。然后,我们将讨论一种新的软件堆栈标准及其将 PIM 与传统计算架构相结合所面临的挑战。最后,我们将讨论 PIM 的各种未来研究方向,以进一步减少数据转换开销、提高测试准确性并最大限度地减少内存内数据移动。
引言由于构建太比特容量的非易失性存储器集成电路和在神经形态计算中的应用前景看好[1],基于电介质电阻切换的存储器设备领域的研究数量呈指数级增长。由于缺乏理想的电介质、通过结构缺陷限制电流泄漏以及隧道效应,基于电荷存储的存储单元已经接近缩放的物理极限。相反,在基于电阻切换机制 (ReRAM) 的存储单元中,不需要理想的电介质,但其局部缺陷区域的结构必须限制在纳米级。在外部电场的影响下,该区域中的阳离子-阴离子电荷传输导致电介质结构缺陷发生局部可逆变化,这种变化在外部表现为单元电导率的逐步变化和高阻状态(HRS 或 RESET 状态)和低阻状态(LRS 或 SET 状态)之间的电阻切换。这些状态是在暴露于具有特定极性、持续时间和幅度的开关脉冲后建立的。在没有外部电场的情况下,理想的忆阻器(具有记忆功能的电阻器)能够在单元电阻的固定值下根据需要长时间维持HRS和LRS。因此,忆阻器存储单元中的一比特信息以结构变化的形式存储在两个导电电极之间封闭的电介质的局部区域中。只有两级电阻(一位)的忆阻器集成到交叉结构[2–6]中,并以3D配置
有机 - 无机杂种钙钛矿(OIHP)已被证明是有希望的非易失性记忆的活动层,因为它们在地球,移动离子和可调节的尺寸中的丰富丰度。但是,缺乏对一维(1D)OIHP的可控制造和存储特性的研究。在这里,报告了1D(NH = CINH 3)3 PBI 5((IFA)3 PBI 5)钙钛矿和相关的电阻记忆特性。溶液处理的1D(IFA)3 PBI 5晶体具有良好定义的单斜晶相和长度约为6 mm的针状形状。它们表现出3 eV的宽带隙,高分解温度为206°C。此外,使用N,N-二甲基甲酰胺(DMF)和Dimethyl Sulfoxide(DMSO)的双溶剂获得了具有良好均匀性和结晶的(IFA)3 PBI 5薄膜。研究了这种各向异性材料的内在电性能,我们构建了仅由Au /(IFA)3 PBI 5 /ITO组成的最简单的存储单元,该电池构成了带有横式阵列设备构造的高型设备。电阻随机访问存储器(RERAM)设备具有双极电流 - 电压(I-V)磁滞特性,显示了所有基于OIHP的新闻器的记录低功耗〜0.2 MW。此外,我们的设备拥有最低的功耗和“设置”电压(0.2 V),其中最简单的基于钙钛矿的存储器设备(也包括无机设备),这不需要需要双金属电极或任何其他绝缘层。他们还表现出可重复的电阻切换行为和出色的保留时间。我们设想1D OIHP可以丰富低维杂种钙钛矿库,并为内存和其他电子应用程序领域中的低功率信息设备带来新的功能。
事实证明,二维层状材料的氧化有利于形成氧化物/二维材料异质结构,这为低功耗电子设备的新范式打开了大门。硫化镓(II)(𝜷-GaS)是一种六方相 III 族单硫属化物,是一种宽带隙半导体,单层和少层形式的带隙超过 3 eV。其氧化物氧化镓(Ga 2 O 3)兼具大带隙(4.4-5.3 eV)和高介电常数(≈ 10)。尽管这两种材料都具有技术潜力,但原子级厚度的𝜷-GaS 的受控氧化仍未得到充分探索。本研究重点关注使用氧等离子体处理对𝜷-GaS 进行受控氧化,以解决现有研究中的重大空白。结果表明,在暴露于 10 W 的 O 2 时,能够形成厚度为 4 nm 的超薄天然氧化物 (GaS x O y ),从而形成 GaS x O y /GaS 异质结构,其下方的 GaS 层保持完整。通过将此类结构集成在金属电极之间并施加电压斜坡或脉冲等电应力,研究了它们在电阻式随机存取存储器 (ReRAM) 中的应用。所产生的氧化物的超薄特性可实现低操作功率,能耗低至每次操作 0.22 nJ,同时分别保持 350 次循环和 10 4 s 的耐久性和保持力。这些结果表明基于氧化的 GaS x O y /GaS 异质结构在电子应用,特别是低功耗存储设备中具有巨大的潜力。
高级电子学学分 3-0-0:3 课程教育目标: COE1 让学生熟悉先进的电子设备及其应用。 COE2 培养对数字电路设计和使用微控制器连接简单系统的理解。 COE3 培养对通信系统的理解。 UNIT-1 9 L 半导体器件:载流子的漂移和扩散、电荷的产生和复合、直接和间接半导体。PN 结、二极管方程、PN 结的势垒宽度和电容、变容二极管、开关二极管、作为开关和放大器的 FET、光电器件:LED、二极管激光器、光电探测器和太阳能电池。 UNIT-2 9 L 先进电子设备:金属氧化物场效应晶体管 (MOSFET)、MOSFET 中的短沟道效应、鳍式场效应晶体管 (FinFET)、铁电场效应器件和 2D 纳米片器件;新兴存储设备:DRAM、ReRAM、FeRAM 和相变存储器 (PCM) 以及通用存储设备。UNIT-3 10 L 模拟系统:锁相环及其应用频率倍增;模拟乘法器及其应用;对数和反对数放大器;仪表放大器;传感器:温度、磁场、位移、光强度和力传感器组合电路设计:编程逻辑器件和门阵列、7 段和 LCD 显示系统、数字增益控制、模拟多路复用器、基于 PC 的测量系统;序贯电路设计:不同类型的 A/D 和 D/A 转换技术、TTL、ECL、MOS 和 CMOS 操作和规格。 UNIT-4 9 L 通信系统:通信系统的概念、电磁频谱的作用、通信系统术语的基本概念、调制的必要性、幅度、频率、脉冲幅度、脉冲位置、脉冲编码调制、通信系统中的信息、编码、脉冲调制的类型、脉冲宽度调制 (PWM)、脉冲位置调制 (PPM)、脉冲编码调制 (PCM) 的原理;数字通信简介。参考书:
为了打击主要存储器和CPU之间移动数据的高能量成本,最近的作品提出了执行加工记忆(PUM)的工作,这是一种记忆中的一种处理,其中在现场进行数据操作(即,在存储单元格在持有数据的存储单元上)。几种常见和新兴的记忆技术提供了通过互连单元相互作用来执行比尔原始功能的能力,从而消除了对多个常见操作使用离散的CMOS计算单元的需求。最近的PUM架构扩展了这些布尔原始图,以使用内存执行比特系列的组合。不幸的是,基础内存设备的几个实际局限性限制了新兴内存阵列的大小,这阻碍了传统的位式计算方法的能力,除了大量的能源节省外,还可以提供高性能。在本文中,我们提出了赛车手,这是一个具有成本效益的PUM档案馆,可使用少量的电阻性记忆提供高性能和大量节省的能源。Racer利用了一个比特的上流执行模型,该模型可以在W小图块上管道位的w-bit计算。我们完全设计有效的控制和外围电路,它们的区域可以在不牺牲记忆密度的情况下在小记忆砖上摊销,我们为Racer提出了ISA抽象,以允许简单的程序/编译器集成。We evaluate an implementation of RACER using NOR- capable ReRAM cells across a range of microbenchmarks extracted from data-intensive applications, and find that RACER provides 107 × , 12 × , and 7 × the performance of a 16-core CPU, a 2304-shader- core GPU, and a state-of-the-art in-SRAM compute substrate, re- spectively, with energy savings of 189 × , 17 × ,和1.3×。