2018 年,尼日利亚成功将微型中子源反应堆 (MNSR) NIRR-1 从可用于武器的高浓缩铀 (HEU) 转换为低浓缩铀 (LEU)。将世界各地的研究反应堆燃料从 HEU 转换为 LEU 是国际社会为尽量减少 HEU 的民用用途并降低相关安全和扩散风险而做出的努力的一部分。该转换项目由尼日利亚原子能委员会 (NAEC) 和国际原子能机构 (IAEA) 发起,并得到了中国、挪威、英国和美国能源部国家核安全局 (NNSA) 的支持。NIRR-1 的转换使超过 1 公斤的中国产高浓缩铀 (HEU) 得以成功运回,从而使尼日利亚不再使用 HEU。五年后,NIRR-1 继续为尼日利亚提供宝贵的科学见解。
4 月,全球材料安全办公室 (GMS) 的放射安全计划启动了 RadSecure 100 倡议,通过为执法部门提供培训并为另外 100 个拥有放射性物质的城市提供激励措施和安全加强战略,加强放射安全。国防核不扩散研究与发展办公室 (DNN R&D) 资助了内华达国家安全站和桑迪亚国家实验室的科学家进行研究,他们测量了大气条件以改进声学信号在空气中传播的模型。材料管理和最小化办公室推进了其剩余钚处置计划,在萨凡纳河场址 K 区完成了临界控制外包装特性描述和储存平台。在美国国务院的支持下,防扩散和军备控制办公室为来自美国和菲律宾的 60 多名官员协调了一次关于战略贸易管制执法的虚拟研讨会。
新的 ISLE 部署以早期的移动探测系统部署为基础,侧重于巡逻和拦截小组、调查和拦截单位、国家反恐和其他执法部门等功能性任务。这些单位经常在城市地区、关键道路和基础设施沿线开展行动,不太可能像海关和边境机构那样受到地理限制。许多 ISLE 部署还将集成新的模块化移动探测能力——由其他 NNSA 项目、联邦调查局、国土安全部和其他美国跨部门合作伙伴测试和使用的探测系统。ISLE 部署还可以包括传统的反走私工具,这可以增加拦截的可能性。ISLE 的一个关键要素是新的 NSDD 培训模块,侧重于新设备套件和运营需求。通过扩大伙伴国家内部的合作并吸引新的利益相关者,NSDD 正在增强执法能力,同时加强整体核探测架构。这些项目以 NSDD 的分层防御战略为基础,使 ISLE 合作伙伴能够发现并发现储存、运输和准备用于恶意使用的对手、材料或设备。引入新的模块化移动系统与 NNSA 管理员 Jill Hruby 的目标直接一致,即提供创新技术并加速防扩散技术创新。
机器学习技术通常用于助听器领域,最常见的方法是识别不同类型的声学环境,尤其是在有语音的情况下。这些算法通常在外部计算机上进行训练,并在助听器中实施缩小版,仅受处理能力和助听器内存限制的限制。深度神经网络 (DNN) 是机器学习的一个子集,它为创建更复杂、更准确的算法提供了可能性。DNN 试图通过创建节点和层的网格来模仿大脑处理信息的方式,这些节点和层可以在经过广泛训练后解码信息。虽然 DNN 背后的概念无处不在,但它在不同品牌的助听器中并不一定以相同的方式实现。
摘要 — 低位宽量化神经网络 (QNN) 通过减少内存占用,支持在受限设备(如微控制器 (MCU))上部署复杂的机器学习模型。细粒度非对称量化(即,在张量基础上为权重和激活分配不同的位宽)是一种特别有趣的方案,可以在严格的内存约束下最大限度地提高准确性 [1]。然而,SoA 微处理器缺乏对子字节指令集架构 (ISA) 的支持,这使得很难在嵌入式 MCU 中充分利用这种极端量化范式。对子字节和非对称 QNN 的支持需要许多精度格式和大量的操作码空间。在这项工作中,我们使用基于状态的 SIMD 指令来解决这个问题:不是显式编码精度,而是在核心状态寄存器中动态设置每个操作数的精度。我们提出了一种基于开源 RI5CY 核心的新型 RISC-V ISA 核心 MPIC(混合精度推理核心)。我们的方法能够完全支持混合精度 QNN 推理,具有 292 种不同的操作数组合,精度为 16 位、8 位、4 位和 2 位,而无需添加任何额外的操作码或增加解码阶段的复杂性。我们的结果表明,与 RI5CY 上的基于软件的混合精度相比,MPIC 将性能和能效提高了 1.1-4.9 倍;与市售的 Cortex-M4 和 M7 微控制器相比,它的性能提高了 3.6-11.7 倍,效率提高了 41-155 倍。索引术语 —PULP 平台、嵌入式系统、深度神经网络、混合精度、微控制器
摘要:机器学习为科学家实现伟大的技术壮举提供了途径。在图像检测和分割方面取得显著成果的算法被称为深度神经网络。为了增强和完善这些技术,我们提出了一种利用堆叠自动编码器的 DNN 结构。活检用于对脑肿瘤进行分类,通常不会在确定性脑外科手术之前进行。机器学习的进步将有助于协助放射科医生在不使用侵入性手术的情况下进行肿瘤诊断。我们利用它的速度和以人为本的优势来改进医学成像设施。随着训练速度和准确性的提高,机器学习可以为医务人员打开新的大门。它将简化理解人脑的过程,并节省大量时间,避免手动扫描医学图像的计算负担。关键词:深度神经网络 (DNN)、卷积神经网络、自动编码器、脑肿瘤、机器学习
摘要 — 量化通常用于深度神经网络 (DNN),通过降低激活和权重(又称张量)的算术精度来减少存储和计算复杂度。高效的硬件架构采用线性量化,以便将最新的 DNN 部署到嵌入式系统和移动设备上。然而,线性均匀量化通常无法将数值精度降低到 8 位以下,而不会牺牲模型精度方面的高性能。性能损失是由于张量不遵循均匀分布。在本文中,我们表明大量张量符合指数分布。然后,我们提出 DNA-TEQ 以自适应方案对 DNN 张量进行指数量化,以在数值精度和精度损失之间实现最佳权衡。实验结果表明,DNA-TEQ 提供的量化位宽比以前的方案低得多,平均压缩率比线性 INT8 基线高出 40%,准确度损失可以忽略不计,并且无需重新训练 DNN。此外,DNA-TEQ 在指数域中执行点积运算方面处于领先地位。对于一组广泛使用的 DNN,与基于 3D 堆叠内存的基线 DNN 加速器相比,DNA-TEQ 平均可提供 1.5 倍的加速和 2.5 倍的节能。索引术语 —DNN、量化、指数、Transformer
在本文中,我们提出了一种用于边缘系统的新设备类感知的修剪方法,即OCAP。背后的动机是,深度神经网络(DNN)模型通常经过大型数据集训练,以便他们可以学习更多的多样性功能并被概括以准确预测众多类别。一些作品表明某些功能(频道)仅与某些类有关。和边缘系统通常在系统检测到的特定环境中实现。结果,为特定边缘环境实施一般培训模型会导致不必要的冗余。同时,将一些数据和模型转移到云中以进行个性化会导致隐私问题。因此,我们可能有一种在设备上意识到的修剪方法来删除与类无关紧要的通道,而边缘系统主要观察到,从而减少了模型的浮点操作(拖放),记忆足迹,潜伏期,潜伏期,能源效率,提高能量效率,并提高了相对较高的类别的准确性,并在同时保护了SITUD DATA DAPAIN PLISTERS PLASSICS。OCAP提出了一种基于输入图像的中间激活的新型类感知的修剪方法,以识别类 - 近距离的通道。此外,我们提出了一种基于KL差异的方法,以选择有效调整修剪模型的多样性和代表性数据。实验结果显示了OCAP的有效性和效率。与最先进的类感知的修剪方法相比,OCAP具有更好的准确性和更高的压缩比。代码可在https://github.com/mzd22222/ocap上获得。此外,我们在Nvidia Jetson Nano,Nvidia Jetson TX2和Nvidia Jetson Agx Xavier上评估了OCAP,在效率方面,实验结果证明了OCAP在边缘系统上的适用性。
深度神经网络 (DNN) 已成为一种强大且日益普遍的人类认知建模工具,并且经常产生类似的行为。例如,凭借其受大脑启发的分层计算组织,DNN 似乎以与人类相同的方式对现实世界的图像进行分类。这是否意味着它们的分类算法也相似?我们将问题框定为三个嵌入程度,逐步限制算法相似性评估:(i) 行为/大脑反应的等价性(这是当前的做法)、(ii) 处理以产生这些结果的刺激特征的等价性(这更具约束性)以及 (iii) 处理这些共享特征的算法的等价性(最终目标)。为了改进 DNN 作为认知模型的功能,我们为每个程度开发了一个越来越受约束的基准,该基准指定了考虑等价性的认识论条件。
深度神经网络 (DNN) 的训练每年都变得越来越耗费资源和能源。遗憾的是,现有的研究主要侧重于优化 DNN 训练以加快完成速度,而往往不考虑对能源效率的影响。在本文中,我们观察到,提高训练性能的常见做法往往会导致能源使用效率低下。更重要的是,我们证明了能耗和性能优化之间存在权衡。为此,我们提出了 Zeus,这是一个优化框架,可通过自动为重复的 DNN 训练作业找到最佳的作业和 GPU 级配置来解决这一权衡。Zeus 使用在线探索-利用方法结合即时能源分析,避免了昂贵的离线测量,同时适应数据随时间的变化。我们的评估表明,Zeus 可以将不同工作负载的 DNN 训练能源效率提高 15.3%–75.8%。