现场可编程门阵列(FPGA)被广泛用于本地加速深度神经网络(DNN)算法,具有高计算吞吐量和能效。虚拟化FPGA和在云端部署FPGA正成为越来越有吸引力的DNN加速方法,因为它们可以增强计算能力,实现跨多用户的按需加速。在过去的五年中,研究人员广泛研究了基于FPGA的DNN加速器的各个方向,例如算法优化、架构探索、容量改进、资源共享和云构建。然而,以前的DNN加速器调查主要集中于在本地FPGA上优化DNN性能,而忽略了将DNN加速器放置在云端FPGA中的趋势。在本研究中,我们深入研究了基于FPGA的DNN加速器中使用的技术,包括但不限于架构设计、优化策略、虚拟化技术和云服务。此外,我们还研究了 DNN 加速器的演进,例如从单个 DNN 到框架生成的 DNN、从物理到虚拟化 FPGA、从本地到云、从单用户到多租户。我们还确定了云端 DNN 加速的重大障碍。本文增强了对基于 FPGA 的 DNN 加速器演进的当前理解。
结到外壳 (Θjc) 热阻设置:在封装顶部安装一个充当边界条件的冷板。较热结和冷板之间的温差迫使热量从芯片表面流到封装顶部。根据 CG/CGG1657 和 CG1509 封装的结构,由于结到外壳的热阻较低,因此可以通过 Kovar 盖散热(图 1 和表 1-1)。但是,绑在 Kovar 盖顶部的散热器会增加 CG/CGG1657 和 CG1509 封装的质量。航天器发射期间封装所经受的冲击和振动可能会使封装的焊柱引脚承受巨大的应力,从而对焊柱引脚和焊点造成潜在损坏。此外,用于将盖子粘合到硅芯片背面的热界面材料 (TIM) 可能会损坏。
我们展示了如何使用场合可编程的门阵列(FPGA)及其协会的高级合成(HLS)编译器来求解具有不完整市场的异质代理模型,并且汇总了不确定性(Krusell和Smith(Krusell和Smith(1998)))。我们记录了一个单个FPGA传递的加速度与在常规群集中使用69个CPU内核提供的加速度相当。解决模型的1200版的时间从8小时下降到7分钟,说明了结构估计的巨大潜力。我们描述了如何实现多个加速机会(二线,数据级并行性和数据精度),并以为传统的顺序专业人员编写的C/C ++代码的最小修改,然后我们在Amazon Web服务中易于使用FPGA。我们量化了这些加速度的加速和成本。我们的论文是迈向新的,电气工程经济学的第一步,重点是设计经济学的综合加速器,以解决具有挑战性的定量模型。复制代码可在GitHub上获得。
© Altera Corporation。Altera、Altera 徽标、“a”徽标和其他 Altera 标志是 Altera Corporation 的商标。Altera 和 Intel 保证其 FPGA 和半导体产品的性能符合 Altera 或 Intel 的标准保修(如适用),但保留随时更改任何产品和服务的权利,恕不另行通知。除非 Altera 或 Intel 明确书面同意,否则 Altera 和 Intel 不承担因应用或使用本文描述的任何信息、产品或服务而产生的任何责任或义务。建议 Altera 和 Intel 客户在依赖任何已发布信息和订购产品或服务之前获取最新版本的设备规格。*其他名称和品牌可能被视为其他所有者的财产。
本文对不同入射角下 28 纳米块状商用现货 (COTS) Xilinx Artix-7 FPGA 的单粒子翻转 (SEU) 抗热中子辐射敏感性进行了实验研究。实验结果表明,配置 RAM (CRAM) 单元、触发器 (FF) 和块 RAM (BRAM) 上存在 SEU。还分析了多重事件 (范围从 2 位到 12 位) 的形状,以及它们对粒子束对设备表面的入射角的依赖性。还研究了 128 位和 384 位多重事件的可能形状,揭示了遵循字线的趋势。将前入射角的结果与 14.2 MeV 中子进行比较,表明该装置对两种辐照源的灵敏度存在相当大的差异。最后,使用名为 MUSCA-SEP3 的建模工具来预测该装置在相同环境条件下的灵敏度。获得的实验结果将以非常准确的方式与预测结果显示出良好的一致性。
在车载太空系统上的广泛的传感器,设备和仪器范围会产生大量旨在传输到地面的数据。但是,下行链路数据速率固有地通过传输功率和地面站访问来限制。边缘计算旨在通过将处理硬件靠近数据源的处理硬件来减少数据链路内链路内的延迟和带宽。在本文中,我们将边缘计算应用于卢森堡大学开发的热异常检测的有效载荷。有效载荷包括一系列前瞻性红外(FLIR)高分辨率长波长红外(LWIR)微摄像机作为边缘感应组件,以生成热图像。使用支持向量机(SVM)算法来检测异常情况,可用于处理热图像和热分布纤维的边缘计算系统,用于处理热图像和热分布。©2025 Cospar。由Elsevier Ltd发布的所有权利保留。
快速傅立叶变换(FFT)广泛用于数字信号处理应用中,尤其是用于使用CNN实时对象检测的卷积操作。本文提出了用于在FPGA上实现的Radix-2 FFT计算的有效的硬件档案,采用了蝴蝶单元的多个平行和管道阶段。所提出的架构利用块RAM存储输入和Twiddle因子值来计算转换。在Zync Ultrascale FPGA上合成了所提出的体系结构的硬件,并使用诸如关键路径延迟,吞吐量,设备利用率和功耗等参数评估其性能。发现在FFTOPS中测量的8点FFT所提出的平行管道结构的性能比非二叠体的AR插条高67%。性能比较与最新的并行管道管道方法证实了所提出的FFT体系结构达到的加速度。在论文中还介绍了拟议的硬件与与Vivado Design套件捆绑在一起的FFT IP核心的合成版本的全面比较。
©Altera Corporation。Altera,Altera徽标,“ A”徽标和其他Altera标记是Altera Corporation的商标。Altera和Intel保证其FPGA和半导体产品的保证按照Altera或Intel的标准保修为适用,但保留随时随时更改任何产品和服务的权利,恕不另行通知。Altera和Intel不承担由于本文所述的任何信息,产品或服务的申请,产品或服务所产生的责任或责任,除非明确同意Altera或Intel的写作。Altera和Intel客户被建议在依靠任何已发表的信息之前并在下达产品或服务订单之前获得最新版本的设备规格。*其他名称和品牌可能被称为他人的财产。
© Altera Corporation。Altera、Altera 徽标、“a”徽标和其他 Altera 标志是 Altera Corporation 的商标。Altera 和 Intel 保证其 FPGA 和半导体产品的性能符合 Altera 或 Intel 的标准保修(如适用),但保留随时更改任何产品和服务的权利,恕不另行通知。除非 Altera 或 Intel 明确书面同意,否则 Altera 和 Intel 不承担因应用或使用本文描述的任何信息、产品或服务而产生的任何责任或义务。建议 Altera 和 Intel 客户在依赖任何已发布信息和订购产品或服务之前获取最新版本的设备规格。*其他名称和品牌可能被视为其他所有者的财产。
现场可编程的门阵列(FPGA)广泛用于嵌入式和低功率系统,用于各种实时工业应用。他们的硬件可重构性可以使应用程序灵活性,并满足严格的计算,实时和控制要求,这是由大量工业和特征(IoT)应用在包括制造,汽车,无人机,无人机,机器人,机器人,军事,军事,空间站,智能家居和智能运输的领域中引起的。此外,与中等体积市场的ASIC相比,FPGA提供了有利的价格表现比,这要归功于它们的众多I/O引脚,可重新配置的逻辑和嵌入式数字信号处理核心以及现成的可用性。此外,他们能够在延迟和能量方面通过空间和可重构计算来胜过CPU。本期特刊的目的是突出基于FPGA的嵌入式系统的最新研究和开发,用于计算,实时和控制需求,这是由现有或新兴的工业和物联网应用产生的。它包括六篇有趣的论文,其中涵盖了许多主题,包括量词后加密(PQC),机器学习(ML),安全,设计和验证以及传感器系统。前两个作品为PQC利用FPGA。具体来说,G。Li等人的第一批作品“ ProgramGalois:基于晶格的加密术的Radix-4离散GALOIS转换架构的实体发电机”。旨在利用FPGA进行完全同态加密,尤其是数字理论转换操作。专注于数字签名类别中的括约肌+方案。本文提出了一种新型离散的Galois Transermation算法,该算法利用Radix-4变体和一组可扩展的构件来实现更高水平的并行性。J.López-Valdivivieso等人的第二件作品“基于HASHES的硬件软件体系结构的设计和实现”。本文通过利用在FPGA上合成的RISC-V处理器来介绍用于SPHINCS+方案的硬件 - 软件体系结构。选择在算法级别使用哪种类型的实例时,可以提供模块化。与参考软件相比,他们的实现通过Shake-256功能提高了15倍,使用Haraka时的效果提高了近90倍。E. Jellum等人的第三项工作“针对网络物理系统的面向反应器的硬件和软件的代码”。提出了一种形式的方法,这是一个定义明确的计算模型