摘要 — 本研究重点研究了在 FPGA 片上系统 (SoC) 上加速的深度神经网络 (DNN) 的时间可预测执行。本文考虑了 Xilinx 的现代 DPU 加速器。针对 Zynq Ultrascale+ 平台进行了广泛的分析活动,以研究 DPU 在加速一组用于高级驾驶辅助系统 (ADAS) 的最先进的 DNN 时的执行行为。基于分析,提出了一个执行模型,然后用于得出响应时间分析。还提出了一个名为 DICTAT 的定制 FPGA 模块,以提高 DNN 加速的可预测性并收紧分析界限。最后,基于分析界限和目标平台的测量结果,提供了一组丰富的实验结果,以评估所提出的方法在 ADAS 应用上的有效性和性能。
摘要:脑机接口 (BCI) 可以检测特定的脑电图模式并将其转换为外部设备的控制信号,为患有严重运动障碍的人提供与外界沟通和互动的替代/附加渠道。许多基于脑电图的 BCI 依赖于 P300 事件相关电位,主要是因为它们需要的用户训练时间相对较短,并且选择速度更快。本文提出了一种基于 P300 的便携式嵌入式 BCI 系统,该系统通过基于 FPGA(现场可编程门阵列)的嵌入式硬件平台实现,确保灵活性、可靠性和高性能。该系统在用户视觉刺激期间获取脑电图数据并实时处理这些数据,以正确检测和识别脑电图特征。BCI 系统旨在允许用户执行通信和家庭自动化控制。
• Forth 是一个虚拟机,Forth 是一个芯片! • Chuck 在编写汇编代码时“发现了 Forth” • Forth 是理想的处理器架构 • Forth 易于在硬件中实现 • Chuck 的芯片:NC4000、Sh-Boom、RTX2000、F21 • https://colorforth.github.io/bio.html • Green Array 的 144 多计算机芯片 http://www.greenarraychips.com/ • 硅片中的 Forth 世界 http://www.ultratechnology.com/chips.htm
摘要:近年来,已经引入了基于非声音和非人工界面的监视和控制家庭环境的系统,以改善流动性困难的人的生活质量。在这项工作中,我们介绍了利用经常性神经网络(RNN)的这种新型系统的可重新实现和优化。在实现现实世界结果中所证明的是,在实施RNN时,FPGA被证明非常有效。尤其是,我们可重新发现的实现比执行参考推理任务的高端Intel Xeon CPU快150×。此外,与服务器CPU相比,所提出的系统在能量效率方面达到了300倍以上的改进,而在所报告的已达到的GFLOPS/W方面,它甚至超过了服务器量的GPU。本研究中讨论的工作的另一个重要贡献是,所证明的实施和优化过程也可以作为对实施RNN的推理任务的任何人的参考;我们的C ++代码是针对高级合成(HLS)工具量身定制的,这进一步促进了这一事实。
摘要 — 基于 SRAM 的 FPGA 经常用于太空应用中的关键功能。通常需要在这些 FPGA 中实现软处理器来满足任务要求。开放 ISA RISC-V 允许开发各种开源处理器。与所有基于 SRAM 的 FPGA 数字设计一样,这些软处理器容易受到 SEU 的影响。本文介绍了对一组新推出的开源 RISC-V 处理器的性能和相对 SEU 敏感度的研究。利用动态部分重构,这种新颖的自动测试设备可以快速部署不同的实现并通过故障注入评估 SEU 敏感度。使用 BYU 的新 SpyDrNet 工具,还将细粒度 TMR 应用于每个处理器,结果显示敏感度降低了 20 倍到 500 倍。
摘要根据摩尔定律,每年单位区域的晶体管数量都在增加。估计,芯片设计领域的当前进化速率将在2024年将晶体管的大小减少到原子量表。在原子级别,量子性特征占主导地位,从而影响了晶体管以位的形式存储信息的能力。量子计算机已被提出是一种有效处理这种困境的一种方法。量子计算电路利用电子的旋转特征来存储信息。本文描述了基于FPGA的量子量子抽象的命题。实施了一个不可编程的emded系统,能够在量子位中存储,测量和引入相移。提议的抽象的主要目标是提供基于FPGA的平台,该平台包括用于设计量子电路的基本子块。Pri-Mary量子键分布算法,即BB84在拟议平台上实施,作为概念证明。所提出的特征的区别特征是以计算源成本增强量子电路仿真精度的灵活性。提出的仿真表现出量子计算的两个主要特性,即并行性和概率测量。
医生在诊断中面临的最大困难之一是对磁共振成像 (MRI) 图像中的脑卒中的分析和诊断。脑卒中是指脑部血液流动中断,导致细胞死亡。为了让医生更容易诊断,许多研究人员使用 Matlab 程序对 MRI 图像进行了一些过滤处理,以改善图像并使其更加明显,从而方便医生诊断。本文介绍了一种使用硬件概念来阐明 MRI 图像中脑卒中的数字系统。现场可编程门阵列 (FPGA) 用于实现该系统,该系统分为四个阶段:预处理、调整图像、中值滤波器和形态滤波器交替进行。整个系统是基于 Zynq FPGA 评估板实现的。该设计已在两个 MRI 图像上进行了测试,并将结果与 Matlab 进行了比较,以确定所提出的系统的效率。与 Matlab 相比,所提出的硬件系统实现了总体良好的准确率,准确率在 90.00% 到 99.48% 之间。
摘要 由于其多种优势(尤其是体积小、重量轻),电力电子变压器在铁路应用中引起了显著的关注。本文主要致力于开发一种基于完全可编程门阵列 (FPGA) 的电力电子变压器控制平台,用于上述应用中。由于 FPGA 的并行处理可以加快控制算法的执行速度,因此可以保证可靠的运行(这在牵引应用中至关重要)。为此,构建了一种输入串联输出并联电力电子变压器结构,并在 Xilinx FPGA 控制平台上设计和实现了电力电子变压器在牵引应用中可靠稳定运行的各种考虑因素,例如安全启动和双向功率流,以及所需的控制和脉冲生成方案。此外,还提出了一种改进的控制算法,以便以简单、更可靠的方式控制电力电子变压器。该控制方案基于DC-DC-LLC谐振变换器的输出电压而开发,能够有效地控制整流器直流母线电压之和并跟踪输入正弦参考电流,并且所需的传感器数量较少。最后,通过实验测试从各个方面检验了该方案的有效性。
DFF触发器DMM数字万用表DMA直接内存访问DSP数字信号处理DSPI动态信号处理仪器DTMR分布式三模块冗余双CH。双通道DUT设备在测试ECC错误纠正代码下进行EDAC误差检测和校正EEE电气,电子,电子机械和机电EMAC设备监控器监控器监视器和控制EMIB多-DIE互连桥EPC EPC延长物理编码层ESA ESA ESA ESA ESA ESA ESA ESA ESA ESA ESA ESA ESA ESA ESA ESA ESA ESA ESA ESA ESA ESA ESA ESA ESA ESA ESA ESA ESA ESA ESA ESA ESA ESA ETIMERS ETIMER ETIMERS ETIMERS ETIMERS ETIMERS ETIMERS ETW Finite impulse response filter FMC FPGA Mezzanine Card FPGA Field Programmable Gate Array FPU Floating Point Unit FY Fiscal Year Gb Gigabit Gbps Gigabit per second GCR Galactic Cosmic Ray GEO geostationary equatorial orbit GIC Global Industry Classification GOMACTech Government Microcircuit Applications and Critical Technology Conference GPIO General purpose input/output GPIB General purpose interface bus GPU Graphics处理单元GR全球路线GRC NASA GLENN研究中心GSFC Goddard太空飞行中心双通道DUT设备在测试ECC错误纠正代码下进行EDAC误差检测和校正EEE电气,电子,电子机械和机电EMAC设备监控器监控器监视器和控制EMIB多-DIE互连桥EPC EPC延长物理编码层ESA ESA ESA ESA ESA ESA ESA ESA ESA ESA ESA ESA ESA ESA ESA ESA ESA ESA ESA ESA ESA ESA ESA ESA ESA ESA ESA ESA ESA ESA ESA ESA ESA ESA ETIMERS ETIMER ETIMERS ETIMERS ETIMERS ETIMERS ETIMERS ETW Finite impulse response filter FMC FPGA Mezzanine Card FPGA Field Programmable Gate Array FPU Floating Point Unit FY Fiscal Year Gb Gigabit Gbps Gigabit per second GCR Galactic Cosmic Ray GEO geostationary equatorial orbit GIC Global Industry Classification GOMACTech Government Microcircuit Applications and Critical Technology Conference GPIO General purpose input/output GPIB General purpose interface bus GPU Graphics处理单元GR全球路线GRC NASA GLENN研究中心GSFC Goddard太空飞行中心
摘要 基于反向传播的现代深度学习方法越来越受欢迎,并已用于多个领域和应用领域。与此同时,还有其他鲜为人知的机器学习算法,它们具有成熟而坚实的理论基础,但其性能仍未被探索。类似大脑的贝叶斯置信传播神经网络 (BCPNN) 就是一个例子。在本文中,我们介绍了 StreamBrain——一个允许基于 BCPNN 的神经网络实际部署在高性能计算系统中的框架。StreamBrain 是一种领域特定语言 (DSL),概念上类似于现有的机器学习 (ML) 框架,并支持 CPU、GPU 甚至 FPGA 的后端。我们通过经验证明 StreamBrain 可以在几秒钟内训练著名的 ML 基准数据集 MNIST,并且我们是第一个在 STL-10 大小网络上展示 BCPNN 的人。我们还展示了如何使用 StreamBrain 进行自定义浮点格式训练,并说明了使用 FPGA 对 BCPNN 使用不同 bfloat 变体的影响。关键词 HPC、无监督学习、表示学习、神经网络、AI、新兴机器学习、BCPNN、GPU、FPGA