摘要 — 量子计算的主要前景之一是利用叠加现象实现 SIMD(单指令 - 多数据)操作。由于状态空间的维度随着量子比特的数量呈指数增长,我们很容易达到这样的情况:我们为数据处理指令支付的费用不到每个数据点一个量子门,而这在传统计算中是相当昂贵的。然而,以量子门的形式化此类指令仍然是一项具有挑战性的任务。因此,为更高级的数据处理制定基础功能对于推进量子计算领域至关重要。在本文中,我们介绍了编码所谓半布尔多项式的形式化。事实证明,算术 Z / 2 n Z 环操作可以表述为半布尔多项式评估,从而可以方便地生成无符号整数算术量子电路。对于算术评估,所得算法被称为傅里叶算术。我们扩展了这种类型的算法,增加了一些附加功能,例如无辅助函数的就地乘法和整数系数多项式求值。此外,我们引入了一种定制方法,用于对有符号整数进行编码,然后对任意浮点数进行编码。这种浮点数表示及其处理可应用于执行无符号模整数运算的任何量子算法。我们讨论了半布尔多项式编码器的一些进一步的性能增强,并最终提供了复杂度估计。与进位纹波方法相比,将我们的方法应用于 32 位无符号整数乘法可减少 90% 的电路深度。
Chenyi Wen是博士学位。由智格大学信息科学与电子工程学院郑朱教授监督的学生。她获得了学士学位2022年智格大学微电子科学与工程学学位。她的研究兴趣包括近似计算和低功率优化。
识别外星生命是太空研究中最令人兴奋和最具挑战性的努力之一。可以从生物元素,同位素和分子中推断出灭绝或现存生命的存在,但是需要准确和敏感的仪器来检测这些物种。在这张白皮书中,我们表明基于激光的质谱仪是原位鉴定原子,同位素和分子生物签名的有前途的仪器。给出了开发用于空间探索的激光射击/电离质谱(LIM)和激光解吸/电离质谱(LD-MS)仪器的概述。他们的用途是在火星场景和欧罗巴场景的背景下讨论的。我们表明,基于激光的质谱仪具有多功能和技术范围内的仪器,具有许多有益的特征可检测生命。fu-future行星着陆器和漫游者任务在其科学有效载荷中利用基于激光的质谱工具。
摘要。使用单个精度的渗透点反应在操作天气预测中变得越来越普遍。同时,气候模拟通常仍以双重精度运行。这样做的原因可能是多种多样的,范围从对依从性和保护法的关注到对缓慢过程的未知效果,或者仅仅是较不频繁的机会和较高的验证计算成本。使用基于合奏的统计方法,Zeman和Schär(2022)可以检测区域天气和气候模型Cosmo的双重和单位仿真之间的差异。但是,这些差异是最小的,通常只能在模拟的第一个小时或几天内检测到。为了评估这些差异是否与区域气候模拟相关,我们已经对100年的区域气候下限实验(Euro-Cordex)进行了为期10年的集合模拟,并与100个合奏成员进行了单一和双重精度。通过基于所有测试变量的分布差异,我们仅在每12或24小时以47个输出变量应用47个输出变量的统计测试每12或24 h,每12或24 h都会发现单精度气候模拟的排斥率略有增加。拒绝率的增加远小于模型中水平差异系数的较小变化而产生的。因此,我们认为它可以被模型不确定性掩盖,因为它被忽略了。据我们所知,这项研究代表了迄今为止对
遗传算法最近已成为实用且可靠的优化方法。试图解决特定问题时要考虑的最重要的问题之一是选择适当的染色体表示。主要使用的染色体表示是二进制字符串,字符串,浮点数,数字,矩阵和其他数据结构的阵列[3,4,5,6,8,10]。对于给定的问题,与其他表示相比,总会有一个表现出更好的优化结果。然而,遗传算法理论主要集中在二进制表示上,对非二进制表示几乎没有什么可说的。遗传算法结构中的另一个重要问题,与染色体表示的选择密切相关,是编码和解码机制,它们在染色体表示和优化问题的变量之间执行转换[10]。这些机制取决于问题变量的性质。
摘要。可变形图像配准是医学图像分析中的关键步骤,用于找到一对固定图像和运动图像之间的非线性空间变换。基于卷积神经网络 (CNN) 的深度配准方法已被广泛使用,因为它们可以快速、端到端地执行图像配准。然而,这些方法通常对具有较大变形的图像对性能有限。最近,迭代深度配准方法已被用来缓解这一限制,其中变换以由粗到细的方式迭代学习。然而,迭代方法不可避免地延长了配准运行时间,并且倾向于在每次迭代中学习单独的图像特征,这阻碍了利用这些特征来促进以后的迭代配准。在本研究中,我们提出了一种用于可变形图像配准的非迭代由粗到细配准网络 (NICE-Net)。在 NICE-Net 中,我们提出了:(i) 单次深度累积学习 (SDCL) 解码器,可以在网络的单次(迭代)中累积学习从粗到细的转换;(ii) 选择性传播特征学习 (SFL) 编码器,可以学习整个从粗到细配准过程的常见图像特征并根据需要选择性传播这些特征。在 3D 脑磁共振成像 (MRI) 的六个公共数据集上进行的大量实验表明,我们提出的 NICE-Net 可以胜过最先进的迭代深度配准方法,而只需要与非迭代方法类似的运行时间。
摘要 — 低功耗(1-20 mW)近传感器计算的最新应用需要采用浮点算法来协调高精度结果和宽动态范围。在本文中,我们提出了一种低功耗多核计算集群,该集群利用跨精度计算的细粒度可调原理,以最低的功率预算为近传感器应用提供支持。我们的解决方案基于开源 RISC-V 架构,将并行化和子字矢量化与专用互连设计相结合,能够在内核之间共享浮点单元 (FPU)。在此架构的基础上,我们提供了全面的软件堆栈支持,包括并行低级运行时、编译工具链和高级编程模型,旨在支持端到端应用程序的开发。我们对周期精确的 FPGA 仿真器上的跨精度集群的设计空间进行了详尽的探索,并改变了内核和 FPU 的数量以最大限度地提高性能。正交地,我们进行了垂直探索,以确定在非功能性要求(工作频率、功率和面积)方面最有效的解决方案。我们对一组代表近传感器处理域的基准进行了实验评估,并通过对功耗进行布局布线后分析来补充时序结果。与最先进的技术相比,我们的解决方案在能源效率方面优于竞争对手,在单精度标量上达到 97 Gflop/s/W 的峰值,在半精度矢量上达到 162 Gflop/s/W。最后,一个实际用例证明了我们的方法在满足精度约束方面的有效性。
第 1 章 未来英特尔® 架构指令扩展和特性 1.1 关于本文档. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1-1 1.2 未来处理器的 DisplayFamily 和 DisplayModel . . . . . . . . . . . . . . . . . . . . . . . . . . 1-1 1.3 Intel® 64 和 IA-32 处理器中的指令集扩展和特性介绍 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1-4 1.5 EVEX 中的压缩位移(disp8*N)支持 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1-55 1.6 bfloat16 浮点格式 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ................. ... 1-57 1.7.2 浮点舍入、非规范处理、NaN/Inf/溢出处理和浮点异常 . . 1-57
摘要:本文对锂离子电池中的浮点电流分析进行了全面的探索,这是一种有希望的新测试方法来评估日历老化。浮点电流定义为瞬态部分后的稳态trick流动电流。在文献中,报告了与容量损失的相关性。假设浮点电流会补偿随着时间的推移的电压衰减,并且与日历老化有关,则必须考虑电压滑动的效果。DU/DQ分析仅表明活跃锂的损失。因此,我们研究了固体电解质相(SEI)的生长,作为解释浮点电流起源的一般老化机制。我们的结果表明,电压滑理论在低至中间测试电压范围内保持真实。然而,该理论的解释能力开始在更高的电压范围内减少,这表明存在影响浮动电流的其他但未知的因素。通过电解质分解对阴极的穿梭反应或晶石是高压下最有前途的替代老化机制。本文提出了一个独特的电压滑模型,以检查老化机制,浮点电流测试和检查测试之间的相关性。为了更好地理解,提出了测试策略来验证/伪造SEI以外的老化机制。