摘要 - 近年来,神经形态计算的领域一直在迅速发展,越来越重视硬件设计和可靠性。本特别会议论文概述了神经形态计算的最新发展,重点是硬件设计和可靠性。我们首先回顾了传统的基于CMO的神经形态硬件设计的方法,并确定与可扩展性,延迟和功耗相关的挑战。然后,我们研究基于新兴技术的替代方法,在神经素影项目中采用了特定整体的光子学方法。最后,我们研究了设备可变性和衰老对神经形态硬件的可靠性的影响,以及用于减轻这些影响的技术。本评论旨在为神经形态计算中的研究人员和从业者提供宝贵的资源。索引术语 - 硅光子学,神经形态硬件,人工神经网络,尖峰神经网络,可靠性,相变材料
随着传统的计算技术达到极限,一个新的计算系统领域已经出现了,试图效仿人脑的例子,成为一个新时代 - 神经形态计算。本文介绍了神经形态计算,为什么需要和其他新颖的新计算系统以及当前在神经形态领域中存在哪些技术。它从对传统计算及其当前问题的历史的一般介绍开始,然后进行了广泛的神经形态系统概述。随后讨论了当前正在开发的主要技术。为了完整性,本文首先讨论了传统硬件上的神经形态风格计算,然后讨论了该领域中专用硬件的两个顶级分支 - 神经形态芯片和光子系统。都解释了两个分支机构及其相对好处和缺点。本文得出的结论是,手头的技术都是非常有前途的。尚不清楚他们将如何进入公共领域,但是他们的高性能不能忽略。
摘要神经形态计算领域遵循受大脑启发的原理,在提高计算效率和能力方面有着巨大的前景。然而,神经形态研究中所采用的技术种类繁多,导致缺乏明确的基准测试标准,阻碍了对神经形态方法与传统的基于深度学习的方法相比的优势和长处进行有效评估。本文介绍了一项合作努力,汇集了来自学术界和工业界的成员,以定义神经形态计算的基准:NeuroBench。NeuroBench 的目标是成为一个由社区开发、服务于社区的协作、公平和具有代表性的基准测试套件。在本文中,我们讨论了与神经形态解决方案基准测试相关的挑战,并概述了 NeuroBench 的主要特性。我们相信,NeuroBench 将是定义标准的重要一步,这些标准可以统一神经形态计算的目标并推动其技术进步。请访问 neurobench.ai 获取有关基准测试任务和指标的最新更新。
简要介绍了所提供的课程:神经形态计算是一个跨学科研究领域,涉及大脑启发的设备电路 - 系统 - 系统 - 系统 - 安装的共同设计和共同实施,以实现人工智能(AI)/机器学习(ML)任务,并且具有很高的能量效率。神经形态计算的可能应用是在边缘设备中实施AI,在这些设备中,数据需要非常快速处理并且能量预算非常紧张。Edge Healthcare,机器人技术和无线传感器网络被认为是一些此类Edge-AI应用程序。在本课程中,我们将介绍神经形态设备,电路,系统和算法设计的基本原理,并讨论这些抽象级别如何取决于其他抽象级别。鉴于该受试者的跨学科性质,材料物理学,模拟电路设计,ML算法甚至神经科学的初步背景将在课程中提供,以便学生可以更好地理解不同级别的抽象水平的不同神经形态设计原理。我们还将探索各种神经形态应用,例如Edge Healthcare和Robotics,这些应用是通过神经形态传感器从环境中获取的信号,然后神经形态电路和算法旨在快速处理这些信号,并具有高能量效率。
摘要 - 迄今为止的神经形态计算体系结构遭受了大规模神经处理所需的互连可伸缩性。我们提出了用于分层地址事件路由(多播 - 示威者)的高性能和低空的多播网络(NOC)体系结构,适用于适用于大规模重新确定的神经形态系统。此效率NOC体系结构的每个构建块由几个多铸高级高性能总线(MAHB)组成,并并行运行,用于高带宽核心间尖峰事件传输。此用于可扩展事件路由的体系结构可以帮助实施分布在神经形态处理核心内的脑尺度稀疏神经网络连接,具有典型的局部密集和全球稀疏神经元连接性的网络约束。使用Xilinx virtex ultrascale vu37p fpga进行演示,我们显示了8×8网格的MAHB在512MHz时钟以512MHz时钟的表现和2级核心间通信,最高带宽的最高带宽为420m,每秒每秒每秒128K Neuron Node node in horierarchy中的每秒。这个峰值绝对带宽支持在所有突触后目的地的最差情况下,在最差的情况下,以次数潜伏期为单位的峰值事件注册。索引术语 - 非形态计算,芯片上的多播网络,高级高性能总线(AHB),地址 - 事件代表(AER),可伸缩AER
同步通信(单个中央时钟的高能量)具有高可塑性,可实现动态重构。大多数数字电路的重构能力有限。神经元可以随时访问突触(内存);无需浪费能量在内存和处理器之间来回传送信息,因为处理是在现场进行的。
i。在国际单位制中,电感的单位是亨利 (H)。如图 1 所示,通过在线圈内添加由铁磁材料(例如铁)制成的磁芯,来自线圈的磁化通量会在材料中感应出磁化,从而增加磁通量。铁磁芯的高磁导率可以使线圈的电感比没有铁磁芯时增加数千倍 [1]。变形虫等生物表现出原始的学习以及记忆、计时和预测机制。它们的自适应行为可以通过基于忆阻器的 RLC 电路模拟 [2]。受这项工作的启发,我们将设计一种基于忆阻器的神经形态架构,该架构可根据外部刺激频率以自然的方式自行调整其固有谐振频率。与之前的研究相比,我们的创新之处在于,该架构使用独特的记忆电感器来增加其时间常数,然后降低其谐振频率以匹配刺激频率。我们的目的是利用这种架构来帮助更好地研究原始智能的细胞起源。这也是这类研究的意义所在,不仅可以理解原始学习,还可以开发一种新颖的计算架构。
i。在国际单位制中,电感的单位是亨利 (H)。如图 1 所示,通过在线圈内添加由铁磁材料(例如铁)制成的磁芯,来自线圈的磁化通量会在材料中感应出磁化,从而增加磁通量。铁磁芯的高磁导率可以使线圈的电感比没有铁磁芯时增加数千倍 [1]。变形虫等生物表现出原始的学习以及记忆、计时和预测机制。它们的自适应行为可以通过基于忆阻器的 RLC 电路模拟 [2]。受这项工作的启发,我们将设计一种基于忆阻器的神经形态架构,该架构可根据外部刺激频率以自然的方式自行调整其固有谐振频率。与之前的研究相比,我们的创新之处在于,该架构使用独特的记忆电感器来增加其时间常数,然后降低其谐振频率以匹配刺激频率。我们的目的是利用这种架构来帮助更好地研究原始智能的细胞起源。这也是这类研究的意义所在,不仅可以理解原始学习,还可以开发一种新颖的计算架构。
摘要 — 实时尖峰分类和处理对于闭环脑机接口和神经假体至关重要。具有数百个电极的高密度多电极阵列的最新发展使得能够同时记录来自大量神经元的尖峰。然而,高通道数对实时尖峰分类硬件的数据传输带宽和计算复杂性提出了严格的要求。因此,有必要开发一种专门的实时硬件,该硬件可以在高吞吐量下动态地对神经尖峰进行分类,同时消耗最少的功率。在这里,我们介绍了一种实时、低延迟的尖峰分类处理器,它利用高密度 CuO x 电阻交叉开关以大规模并行方式实现内存尖峰分类。我们开发了一种与 CMOS BEOL 集成兼容的制造工艺。我们广泛描述了 CuO x 存储设备的开关特性和统计变化。为了使用交叉开关阵列实现尖峰分类,我们开发了一种基于模板匹配的尖峰分类算法,该算法可以直接映射到 RRAM 交叉开关上。通过使用合成和体内细胞外脉冲记录,我们通过实验证明了高准确度的节能脉冲分类。与基于 FPGA 和微控制器的其他硬件实现相比,我们的神经形态接口在实时脉冲分类的面积(减少约 1000 倍面积)、功率(减少约 200 倍功率)和延迟(对 100 个通道进行分类的延迟为 4.8μs)方面均有显著改善。