摘要 — 能够进行多点电记录、现场信号分类和闭环治疗的神经接口对于神经系统疾病的诊断和治疗至关重要。然而,在低功耗神经设备上部署机器学习算法具有挑战性,因为此类设备的计算和内存资源受到严格限制。在本文中,我们回顾了在神经接口中嵌入机器学习的最新发展,重点关注设计权衡和硬件效率。我们还介绍了我们优化的基于树的模型,用于对脑植入物中的神经信号进行低功耗和内存高效的分类。使用能量感知学习和模型压缩,我们表明所提出的斜树在癫痫或震颤检测和运动解码等应用中可以胜过传统的机器学习模型。索引词 — 神经接口、低功耗、机器学习、斜树、疾病检测、闭环刺激。I. 介绍
湍流和阵风会导致施加在飞机结构上的空气动力和力矩发生变化,从而导致乘客不适,并且结构上必须设计能够支撑的动态载荷。通过设计阵风载荷缓解 (GLA) 系统,可以实现两个目标:第一,实现更高的乘客舒适度;第二,减少动态结构载荷,从而可以设计更轻的结构。本文提出了一种设计组合反馈/前馈 GLA 系统的方法。该方法依赖于多普勒激光雷达传感器测量的飞机前方的风廓线,并基于 H ∞ 最优控制技术和离散时间预览控制问题公式。此外,为了允许在这两个目标之间进行设计权衡(以实现设计灵活性)以及允许指定稳健性标准,引入了使用多通道 H ∞ 最优控制技术的问题变体。本文开发的方法旨在应用于大型飞机,例如运输机或公务机。模拟结果表明,所提出的设计方法在考虑测量的风廓线以实现上述两个目标方面是有效的,同时确保了设计灵活性以及控制器的稳健性和最优性。
在核潜艇反应堆燃料中使用高浓缩铀 (HEU) 与使用低浓缩铀 (LEU) 之间存在某些设计权衡,这些权衡包括堆芯寿命和大小、总功率和反应堆安全性等因素。为了评估这些权衡,对三种分别使用浓缩度为 7%、20% 和 97.3% 的铀燃料的 50MWt 反应堆设计进行了比较。7% 和 20% 的设计假定使用二氧化铀 (U02) 燃料,燃料为“焦糖配置”,而 97.3% 的设计假定为分散型。(这些设计使用阿贡国家实验室 IBM 3033 上的 EPRI-Cell 计算机代码建模。通过 TYMNET 公共网络系统从麻省理工学院的 DEC VT-100 终端访问该设施)。结论是,20% 浓缩堆芯的设计寿命(1200 天满功率运行)可与 97.3% 浓缩堆芯相同。7% 浓缩堆芯无法维持这段时间的临界状态。但是,堆芯寿命可以达到 600 天满功率运行。7% 和 20% 浓缩堆芯都比 97.3% 浓缩堆芯大。但是,使用整体设计而不是环型设计可以弥补较大的堆芯尺寸。
摘要 - 软马克斯函数用作放置在神经网络输出层中的激活函数。它允许提取输出类的概率,同时向模型引入非线性。在低端FPGA领域,深神经网络(DNN)的实现需要探索优化技术,以提高计算效率和硬件资源消耗。这项工作探讨了使用Taylor和Pad'E近似方法以及带有查找表(LUTS)的插值方法来促进软效果的近似计算技术。引入近似值旨在减少所需的执行时间,同时降低SoftMax函数产生的结果的精度。使用均方根误差(RMSE)评估每个实现,以进行准确评估,并通过测量执行时间来验证个人绩效。从我们的评估中,使用LUTS的二次插值实现了最低的错误,但是在性能方面,泰勒和垫子近似显示了更好的执行时间,这突出了数值准确性和功耗之间的现有设计权衡。索引项 - 评估计算,高级合成,推理算法,神经网络压缩,多层感知器。
随着星载传感器的小型化,预计小型卫星将使用更强大的有效载荷。因此,需要新的热概念来应对日益增加的热耗散和负面影响。本文提出了一种新的热控制概念,以对具有功率耗散问题的小型卫星进行热标准化,使其在热方面不受轨道的影响。这种新的热设计概念是微型机械泵回路 (MPL)。微型 MPL 的设计考虑了立方体卫星及其子系统的要求,从而确保其与小型卫星和各种任务的兼容性。该系统的核心是荷兰航空航天中心 (NLR) 开发的多并联微型泵 (MPMP)。这种泵概念提供了一种低质量、高可靠性的 MPL 解决方案。随后,本文描述了回路和泵的概念,并给出了微型泵的测试结果。Mini-MPL 也在 Matlab 中建模,以支持 MPL 系统设计权衡。本文描述了该模型,并展示了建模结果,并将其纳入了详细的工作流体选择中。最后,通过与传统热设计方案的比较,阐明了该系统的优点和缺点。本文最后展望了进一步的发展和 mini-MPL 应用。
与去年一样,初创公司和老牌科技公司发布、发布和部署人工智能 (AI) 和机器学习 (ML) 加速器的新步伐一直不大。这并非不合理;许多发布加速器报告的公司都花了三到四年的时间研究、分析、设计、验证和确认其加速器设计权衡,并构建软件堆栈来对加速器进行编程。对于那些发布了加速器后续版本的公司来说,他们报告的开发周期更短,尽管至少也需要两三年。这些加速器的重点仍然是加速深度神经网络 (DNN) 模型,应用空间从超低功耗嵌入式语音识别和图像分类到数据中心规模训练,而作为现代计算向机器学习解决方案的更大规模工业和技术转变的一部分,对定义市场和应用领域的竞争仍在继续。人工智能生态系统汇集了嵌入式计算(边缘计算)、传统高性能计算(HPC)和高性能数据分析(HPDA)的组件,这些组件必须协同工作才能有效地为决策者、作战人员和分析师提供使用能力 [1]。图 1 捕获了此类端到端人工智能解决方案及其组件的架构概览。在图 1 的左侧,结构化和非结构化数据源提供了实体和/或现象学的不同视图。
光电传感器眼动仪 (PSOG) 是一种眼动追踪技术,其原理是使用简单的光电传感器来测量眼睛旋转时反射的(通常是红外线)光量。光电传感器眼动仪可以提供高精度、低延迟和低功耗的测量,因此它似乎是在新兴头戴式交互设备(例如增强现实和虚拟现实 (AR/VR) 耳机)中进行眼动追踪的一种有吸引力的选择。在我们目前的工作中,我们采用可调节的模拟框架作为对不同光电传感器眼动仪设计的眼动追踪行为进行探索性研究的共同基础。通过进行的实验,我们探索了设计的一些基本参数的变化对最终准确性和串扰的影响,这些是基于眼动追踪的人机交互应用程序无缝运行的关键特征。我们的实验结果揭示了需要采取的设计权衡,以解决导致不同眼动追踪特性最佳性能的竞争条件。我们还介绍了传感器发生偏移时眼动追踪输出中出现的变化,并评估了不同眼动和传感器偏移组合导致的准确度下降。
无电池的传感设备已经越来越受欢迎,因为它们可以仅依靠收获的能量和环境友好的电容器运行。然而,尽管无电池解决方案数量增加,但它们的设计仍然是一项艰巨的任务。实际上,能源供应和需求之间的有限的能源存储容量以及产生的融合引入了新的设计权衡,这些折衷方案无法使用考虑恒定电源的常规工具进行探索。为了启用快速设计空间并促进无电池系统的开发,我们介绍了Simba,Simba是一个开源模拟框架,允许详细研究各种副组件之间的复杂相互作用。我们证明了Simba在两个案例研究中的好处,对实验进行了评估,以现实世界,最先进的电池设备为目标。首先,我们说明了Simba如何探索不同组件配置之间的依赖性并评估其对整体系统性能的影响。除其他外,我们表明,更改存储容量或稍微修改负载行为可以将数据吞吐量提高到最高5倍。1𝑥和9。7𝑥。第二,我们介绍了Simba如何自动选择优化无电池系统操作(例如,其检查点的机械师)的关键参数,并展示Simba如何基于现实世界的能源收集痕迹来启用性能评估。
Aladdin [1] 是一个预 RTL 功耗/性能模拟器,旨在实现以加速器为中心的系统的快速设计空间搜索。该框架将算法的高级语言描述作为输入(C 或 C++),并使用动态数据依赖图 (DDDG) 作为加速器的表示,而无需生成 RTL。从无约束程序 DDDG(对应于加速器硬件的初始表示)开始,Aladdin 对图形应用优化和约束,以创建加速器活动的真实模型。我们针对一系列应用,通过手写 Verilog 和商用高级综合 (HLS) 工具对加速器的 RTL 实现验证了 Aladdin。我们的结果表明,与传统 RTL 流程生成的加速器设计相比,Aladdin 可以高精度地模拟功耗、性能和面积,误差在 10% 以内,同时以更少的设计工作量和时间提供这些估算。 Aladdin 可以捕捉加速器设计的权衡,从而为异构系统(包括加速器、通用核心和共享内存层次结构,例如在移动 SoC 中看到的)提供新的架构研究方向。特别是,Aladdin 允许用户在异构环境中探索加速器的定制和共享内存层次结构。例如,在使用 GEMM 基准的案例研究中,Aladdin 通过评估整个系统的更广泛设计空间发现了重要的高级设计权衡。我们设想 Aladdin 既可以用作加速器模拟器,也可以用作未来多加速器系统的设计空间探索工具。
摘要:近年来,量子计算 (QC) 在流体动力学模拟中的应用已发展成为一个动态研究课题。由于许多科学和工程领域中的流动问题需要大量计算资源,因此 QC 加速模拟和促进更详细建模的潜力成为这一研究兴趣日益增长的主要动机。尽管取得了显著进展,但在创建流体建模的量子算法方面仍然存在许多重要挑战。本文在基于格子的流体建模背景下研究了流体建模中控制方程的非线性这一关键挑战。详细介绍了 D1Q3(一维,三个离散速度)格子玻尔兹曼模型的量子电路以及涉及电路宽度和深度的设计权衡。然后,将设计扩展为非线性 Burgers 方程的一维格子模型。为了便于评估非线性项,所提出的量子电路采用量子计算基编码。本研究的第二部分介绍了一种用于多维晶格模型中非线性项的新型模块化量子电路实现。具体而言,详细介绍了二维模型中动能的评估,这是二维和三维格子玻尔兹曼方法碰撞项量子电路的第一步。量子电路分析表明,利用 O (100) 容错量子比特,可以在不久的将来进行有意义的概念验证实验。