摘要 — 基因组分析从根本上始于一个称为读取映射的过程,其中将生物体基因组的测序片段与参考基因组进行比较。读取映射目前是整个基因组分析流程的主要瓶颈,因为最先进的基因组测序技术能够比用于分析基因组的计算技术更快地对基因组进行测序。我们描述了显著提高读取映射性能的持续历程。我们解释了最先进的算法方法和基于硬件的加速方法。算法方法利用基因组的结构以及底层硬件的结构。基于硬件的加速方法利用专门的微架构或各种执行范例(例如,在内存内部或附近处理)。我们最后指出了采用这些硬件加速读取映射器的挑战。
摘要 — 近年来,计算技术(例如传感器、计算机视觉、机器学习和硬件加速)的普及以及通信机制(例如 DSRC、C-V2X、5G)的广泛部署推动了自动驾驶的发展,自动驾驶利用基于多个传感器的感知结果来自动决策和控制车辆。这些自动驾驶系统成功的关键是实时做出可靠的决策。然而,早期部署的自动驾驶汽车造成的事故和死亡事件时有发生。真实的交通环境过于复杂,当前的自动驾驶计算系统无法理解和处理。在本文中,我们介绍了用于自动驾驶的最先进的计算系统,包括七个性能指标和九项关键技术,以及实现自动驾驶的十二个挑战。我们希望这篇论文能够引起计算和汽车界的关注,并激发更多这方面的研究。
大多数云服务和分布式应用程序都依赖于哈希算法,这些算法允许动态扩展稳健且高效的哈希表。示例包括 AWS、Google Cloud 和 BitTorrent。一致性和会合哈希是在哈希表调整大小时最小化密钥重新映射的算法。虽然大规模云部署中的内存错误很常见,但这两种算法都不能同时提供效率和稳健性。超维计算是一种新兴的计算模型,具有固有的效率、稳健性,非常适合矢量或硬件加速。我们提出了超维 (HD) 哈希,并表明它具有在大型系统中部署的效率。此外,实际的内存错误水平会导致一致性哈希超过 20% 的不匹配,而 HD 哈希不受影响。
本期观点主要关注物理和化学领域中量子算法和蒙特卡罗方法之间的几个重叠部分。我们将分析将已建立的量子蒙特卡罗解决方案集成到量子算法中的挑战和可能性。这些包括精细的能量估计器、参数优化、实时和虚时动力学以及变分电路。相反,我们将回顾利用量子硬件加速统计经典模型中采样的新想法,并将其应用于物理、化学、优化和机器学习。本评论旨在让两个社区都能阅读,并旨在促进量子计算和蒙特卡罗方法交叉领域的进一步算法发展。本期观点中讨论的大多数作品都是在过去两年内出现的,表明人们对这一有前途的研究领域的兴趣正在迅速增长。
非传染性疾病发病率不断上升,加上减缓气候变化、主权债务和地区冲突的成本,正在破坏全球卫生安全,威胁实现联合国可持续发展目标的进程。这些多重危机的负面影响主要由中低收入国家承担,这些国家的疾病负担最高,医疗支出最低。医疗数字化正成为一种有前途的应对措施,人工智能 (AI) 软件和量子计算硬件加速了这一进程。我们对负责任的人工智能数字化的三个关键推动因素(治理、基础设施和安全)进行了多部门政策和实践批判性分析,以实现中低收入国家安全、负担得起、公平和可持续的医疗保健系统。我们考虑了公私伙伴关系、民主化的主权人工智能和嵌入式人类安全方面的主要用例。我们的分析表明,这些用例展示了数字人工智能如何
随着边缘计算平台变得更加广泛,新公司加入了该领域,因此很难知道在任何特定情况下要使用哪个平台。这些系统通常包含一系列不同的计算体系结构和不同的硬件加速技术,这在选举时可能会令人困惑,以将它们整合为较大设计中的硬件加速器。由于这些平台的效率,它们通常可以为机器人技术和其他领域提供创造性的解决问题的方法,在这种情况下,很久以前的计算在边缘上并不常见。本文深入研究了领先的硬件加速器,分析了三个平台的性能和功率使用:KRIA KV260,Jetson Nano和RTX 3060。实验是使用两个神经网络模型-Resnet-50进行的,并进行了YOLO训练以进行图像识别任务。与其他平台相比,我们的发现在每瓦的推理速度方面强调了基于FPGA的平台的效率。
•SCE5为机密性提供了硬件加速对称加密。更新的SCE5_B使用增强的安全密钥处理,利用注射的MCU唯一Huk。•SCE7为完整性和身份验证添加了不对称的加密和高级哈希功能。•SCE9通过利用注射的MCU-INIQUE HUK来扩展SCE7,用于安全键处理,并将RSA支持提高到RSA-4K。•RSIP通过添加EDDSA,ECC SECP521R1,SHA384和SHA512等高级加密算法来扩展SCE9。RA安全引擎使用硬件唯一密钥(HUK)来保护应用程序密钥的存储。对于RSIP-E51A和SCE9,MCU-INIQUE HUK是256位随机键。对于SCE5_B,HUK是一个128位随机键。这些武器在Renesas工厂注入,并且从未在安全引擎外面暴露。使用MCU唯一的键包装机制以包装格式存储此键,确保
随着6G技术的出现,目前正在将无线通信领域推向新的边界。这项先进的技术需要大幅提高数据速率和处理速度,同时需要用于现实世界实用性的能源解决方案。在这项工作中,我们应用了一个名为Echo State Network(ESN)的神经科学启发的机器学习模型,以在Massive Mimo-Ofdm Systems中的符号检测的关键任务,这是6G网络的关键技术。我们的工作涵盖了硬件加速储层神经元体系结构的设计,以加快基于ESN的符号检测器。然后,通过在现实世界中的Xilinx Virtex-7 FPGA板上的概念证明进行验证。实验结果表明,与传统的MIMO符号检测方法(如线性最小均方根误差)相比,在一系列MIMO配置中,我们的符号检测器设计的性能和可扩展性很高。我们的发现还确认了整个系统的性能和可行性,以低误差率,低资源利用率和高吞吐量的形式反映。
摘要 量子计算机、相干伊辛机和数字退火机等新型计算设备的出现为硬件加速混合优化算法提供了新的机会。不幸的是,利用新型硬件平台展示无可置疑的性能提升面临着重大障碍。一个关键挑战是理解区分此类设备与现有优化方法的算法特性。通过精心设计人为的优化任务,这项工作为量子退火的计算特性提供了新的见解,并表明该模型有可能快速识别高质量解决方案的结构。与涵盖完整搜索和局部搜索的各种算法进行细致的比较表明,量子退火在所提出的优化任务上的表现是不同的。这一结果为时间尺度和优化问题类型提供了新的见解,在这些优化问题中,量子退火有可能比现有的优化算法提供显着的性能提升,并建议开发结合量子退火的最佳特性和最先进的经典方法的混合算法。
摘要 —在连续变量量子密钥分发(CV-QKD)系统中,后处理过程(包括信息协调(IR)和隐私放大(PA))的计算速度不可避免地影响实际密钥速率。IR 和 PA 可以分别使用低密度奇偶校验(LDPC)码和哈希函数并行实现。利用现场可编程门阵列(FPGA)卓越的并行处理能力,在FPGA上实现了高斯符号的高速硬件加速后处理过程。为此,开发并采用了适应FPGA特点的和积算法解码器和改进的LDPC码构造算法。设计了复用和非复用两种不同的结构来实现FPGA速度和面积之间的权衡,以便根据实际系统的要求采用最佳方案。仿真结果表明,最大吞吐量可以达到100 M 符号/秒。我们在装有 Virtex-7 XC7VX690T FPGA 的 Xilinx VC709 评估板上验证了后处理程序的正确性,并提供了在有更先进的 FPGA 可用时获得更好性能的一些可能的解决方案。该方案可轻松应用于实时密钥提取,并有效降低 CV-QKD 系统的功耗。