摘要 — 在硬件加速器上运行大型深度神经网络 (DNN) 所消耗的能量主要来自需要大量快速内存来存储状态和权重。目前,只有通过 DRAM 才能经济地满足这种大型内存需求。尽管 DRAM 是高吞吐量和低成本内存(成本比 SRAM 低 20 倍),但其较长的随机访问延迟不利于脉冲神经网络 (SNN) 中不可预测的访问模式。此外,从 DRAM 访问数据比使用该数据进行算术运算消耗的能量高出几个数量级。如果有本地内存可用且产生的峰值很少,则 SNN 是节能的。本文报告了我们在过去 5 年中在卷积和循环深度神经网络硬件加速器方面的发展,这些加速器利用了与 SNN 类似的空间或时间稀疏性,但即使使用 DRAM 来存储大型 DNN 的权重和状态,也能实现 SOA 吞吐量、功率效率和延迟。
关键词:历史文献、手写、数字化、数字化、文化遗产、保存。摘要:保存历史档案遗产不仅涉及保护这些宝贵文本的物理措施,还涉及提供数字保存。然而,仅仅将手稿和抄本数字化是不够的。还需要进一步的步骤:数字化其内容,即逐字转录扫描的文本。此过程可以准确保存其文本内容,从而更易于搜索信息和进行进一步分析。借助人工智能,特别是深度神经网络 (DNN),可以执行自动手写识别。在本研究中,我们使用了一种成熟的 DNN 类型的卷积循环神经网络 (CRNN) 来确定自动转录五个不同语言和时间段不同的历史数据集所需的最少标记数据量。结果表明,在几乎所有情况下,仅使用几百行标记文本就可以实现低于 10% 的字符错误率 (CER)。
摘要 - 占对象检测是在各种高安全地点执行的关键任务,包括机场,火车施工,地铁和港口。每小时检查数千张X射线图像的持续和乏味的工作可能会在精神上征税。因此,深层神经网络(DNN)可用于自动化X射线图像分析过程,提高效率并减轻安全人员的检查负担。通常在相关文学中使用的神经体系结构是卷积神经网络(CNN),而视觉变压器(VIT)很少使用。为了解决这一差距,本文对X射线图像中非法项目检测的相关VIT体系结构进行了全面评估。这项研究利用了变压器和杂化主链,例如Swin和Nextvit,以及探测器,例如Dino和RT-Detr。结果证明了Dino Transformer探测器在低数据策略,令人印象深刻的Yolov8实时性能以及混合NextVit主链的有效性中的出色准确性。索引术语 - 对象检测,X射线,视觉变压器,深神经网络
最近,对不同深度神经网络(DNNS)架构的平行杂交模型的持续发展,越来越多的兴趣激增,以保持有用寿命(RUL)估计。在这方面,本文在文献中的第一次介绍了一种新的基于Hybrid DNN的框架,用于RUL估算,称为嘈杂的多径平行混合模型,用于剩余有用的寿命估计(NMPM)。提议的NMPM框架是三个平行路径的编写,第一个使用了一个嘈杂的双向长短术语记忆(BLSTM),用于提取时间特征并学习在两个方向,正向和后门中学习序列数据的依赖。第二个平行路径采用嘈杂的多层感知器(MLP),由三层组成以提取不同特征类别的层。第三个平行路径利用嘈杂的卷积神经网络(CNN)来提取特征的组成类。然后将三个平行路径的串联输出送入嘈杂的融合中心(NFC)以预测RLU。提出的NMPM已根据嘈杂的训练机制进行了培训,以增强其泛化行为,并增强模型的整体准确性和鲁棒性。使用NASA提供的CMAPS数据集对NMPM框架进行了测试和评估,该数据集说明了卓越的性能与最先进的对应物相比。
摘要。深度加强学习技术的快速进步可以通过使用深神经网络(DNNS)来监督安全 - 关键系统。这强调了迫切需要为此类DNN控制系统建立精心设计的安全保证。大多数现有的验证方法都取决于定性方法,主要是使用可达性分析。但是,定性验证证明了DNN控制的系统不足,因为在开放和对抗环境中运行时,其行为表现出随机趋势。在本文中,我们提出了一个新的框架,用于统一DNN控制系统的定性和定量安全验证概率。这是通过将验证任务作为有效神经屏障证书(NBC)的综合来实现的。最初,该框架试图通过定性验证来建立几乎固定的安全保证。在定性验证失败的情况下,我们调用了我们的定量验证方法,在无限和有限的时间范围内都可以在概率安全性上获得精确的下限和上限。为了促进NBC的合成,我们引入了它们的𝑘诱导变体。我们还设计了一种模拟引导的训练NBC的方法,旨在在计算精确认证的上限和上限时达到紧密度。我们将方法原型化为一个名为uniqq的工具,并在四个经典的DNN控制系统上展示了其e ffi cacy。
包括(见图 1):(1) 数据依赖,即算法对数据的依赖,数据可能有偏差、不完整或有缺陷;(2) 学习易于操纵的统计模式;(3) 当代 DNN 的黑箱性质意味着决策如何做出并不总是很清楚,这可能会延续或隐藏偏差。这些特征共同解释了为什么漏洞可能成为对手的目标或无意中触发。事实上,主要问题在于数据集偏差,而 ML 模型往往会延续数据中固有的缺陷。在 ML 中,(训练)数据集是算法所看到的全部;数据集就是世界。9 有偏差的数据集是指 ML 模型不是训练模型使其具有在现实开放世界中概括的能力,而是变成了一个封闭的世界。9 数据集偏差的一个例子如下:如果训练数据中一头牛经常和草一起出现,那么检测草并输出“牛”可以成为最终的 ML 分类器的一个特征。10 此外,这种偏差不仅会被 ML 复制,还会通过偏差放大而恶化。11
量子计算机能否用于实现比传统方法更好的机器学习模型?这些方法是否适合当今嘈杂的量子硬件?在本文中,我们制作了一个 Python 框架,用于实现基于在量子硬件上评估的参数化量子电路的机器学习模型。该框架能够实现量子神经网络 (QNN) 和量子电路网络 (QCN),并使用基于梯度的方法对其进行训练。为了计算量子电路网络的梯度,我们开发了一种基于参数移位规则的反向传播算法,该算法同时利用了经典硬件和量子硬件。我们进行了一项数值研究,试图描述密集神经网络 (DNN)、QNN 和 QCN 如何作为模型架构的函数运行。我们专注于研究消失梯度现象,并分别使用经验费舍尔信息矩阵 (EFIM) 和轨迹长度量化模型的可训练性和表达性。我们还通过在人工数据以及真实世界数据集上训练模型来测试模型的性能。
五十多年来,冯·诺依曼体系结构的灵活性(其中来自离散内存单元的数据作为操作和操作数到达专用计算单元)推动了系统性能的指数级提升。这些计算系统需要在执行计算任务期间高速来回传送大量数据。但是,随着设备缩放因功率和电压考虑而放缓,在内存和计算单元之间所谓的“冯·诺依曼瓶颈”上传输数据所花费的时间和能量已成为问题。这些性能瓶颈和明显的面积/功率效率低下对于以数据为中心的应用尤其不可避免,例如实时图像识别和自然语言处理,其中最先进的冯·诺依曼系统努力匹配普通人的表现。我们正处于人工智能 (AI) 和认知计算革命的风口浪尖,算法的进步使得深度神经网络 (DNN) 在模式识别、游戏、机器翻译等许多任务上接近甚至超越人类的表现。
摘要虽然生成式深度神经网络 (DNN) 已展示出其创作新颖乐曲的能力,但人们对与这些音乐 AI 共同创作的挑战和潜力关注较少,尤其是对于新手而言。在一项对一种广泛使用的交互式音乐 AI 的需求探索研究中,我们发现 AI 会因其生成的音乐内容数量而让用户不知所措,并因其非确定性输出而令他们沮丧。为了更好地满足共同创作需求,我们开发了 AI 指导工具,包括将内容生成限制为特定声音的语音通道;用于控制生成内容与现有示例的相似性的基于示例的滑块;用于推动音乐生成朝高级方向(快乐/悲伤、常规/惊讶)的语义滑块;以及可供试听和选择的生成内容的多种替代方案。在一项总结性研究(N=21)中,我们发现这些工具不仅增强了用户对人工智能的信任、控制、理解和合作感,而且还有助于增强用户相对于人工智能的自我效能感和对作品的主人翁感。
皮肤癌检测是临床决策支持的一个常见应用 [7]。由于皮肤癌患者数量的增加和早期检测的良好治疗效果,过去几年来,人们在该领域进行了大量研究。在此背景下,DNN 已成为开发皮肤图像分类模型的可行方法 [2、8、12、30]。社区的高度关注导致出现了各种不同方法,其性能水平也参差不齐。1 所有方法的共同点都是训练一个可用于诊断并从而用于临床决策支持的模型。因此,新方法的评估标准通常是它们是否能够使模型在各种皮肤病诊断任务中取得更好的性能结果 [21]。同时,其他 AI 研究领域也越来越多地考虑对模型预测的解释。相比之下,这些技术在皮肤图像分类中的应用几乎没有得到解决,尽管最近的一些研究已经认识到