在3D医学图像中对感兴趣的器官进行分割是准确诊断和纵向研究的必要条件。尽管使用深度学习的最新进展已显示出许多细分任务的成功,但是高性能需要大的数据集,而注释过程既耗时又耗时。在本文中,我们提出了一个3D少数射击分割框架,以使用目标器官注释的有限训练样本进行准确的器官序列。为了实现这一目标,像U-NET一样的网络旨在通过了解支持数据的2D片与查询图像之间的关系,包括辅助门控复发单元(GRU),该单元(GRU)了解相邻切片之间编码特征的一致性。此外,我们会介绍一种传输学习方法,以通过在支持数据中采样的任意支持和查询数据进行测试之前对模型进行更新,以适应目标图像和器官的特征。我们使用带有不同器官注释的三个3D CT数据集评估了我们提出的模型。我们的模型比最先进的射击分段模型产生了显着提高的性能,并且与经过更多目标培训数据训练的完全监督模型相当。
摘要:人类动议的预测是对人类自主机器人安全导航的关键。在混乱的环境中,由于其与环境和其他脚步的相互作用,可能会有几种运动假设。以前用于估计多个运动假设的工作需要大量样本,这限制了其在实时运动计划中的适用性。在本文中,我们提出了一种基于深层生成神经网络的相互作用和多模式轨迹预测的变分学习方法。我们的方法可以实现更快的收敛性,并且与最新方法相比,需要更少的样本。对真实和模拟数据的实验结果表明,我们的模型可以有效地学习推断出不同的轨迹。我们将我们的方法与三种基线方法进行了比较,目前的性能结果表明,我们的生成模型可以通过产生各种轨迹来实现轨迹预测的更高准确性。
随着时间的推移,音乐制作的艺术随着技术的进步而变化缓慢。多种自动解决方案为从实践到生产和舞台表现的不同方式提供了帮助和音乐家的帮助。在音乐作品的背景下,背景音乐(BGM)作为主旋律非常重要。BGM的基础之一是一个和弦,由两个或多个音符同时播放。每个和弦可以通过多种方式播放,从而增加旋律品种。这些方式中的每一种都被称为倒置,其识别对于分析组成和转录它们非常重要。对于自动化的BGM或铅旋律产生也非常重要,其中和弦的反转形式或形状在组成的感觉中起关键作用。和弦形状识别的挑战进一步增加了长度剪辑的剪辑,这对于实时处理至关重要。在本文中提出了一个系统,该系统将和弦形状与持续时间短的剪辑区分开。实验,使用LSF-Deltas Deltag特征和基于LSTM-RNN的分类获得了99.47%的最高精度。
摘要 — 在硬件加速器上运行大型深度神经网络 (DNN) 所消耗的能量主要来自需要大量快速内存来存储状态和权重。目前,只有通过 DRAM 才能经济地满足这种大型内存需求。尽管 DRAM 是高吞吐量和低成本内存(成本比 SRAM 低 20 倍),但其较长的随机访问延迟不利于脉冲神经网络 (SNN) 中不可预测的访问模式。此外,从 DRAM 访问数据比使用该数据进行算术运算消耗的能量高出几个数量级。如果有本地内存可用且产生的峰值很少,则 SNN 是节能的。本文报告了我们在过去 5 年中在卷积和循环深度神经网络硬件加速器方面的发展,这些加速器利用了与 SNN 类似的空间或时间稀疏性,但即使使用 DRAM 来存储大型 DNN 的权重和状态,也能实现 SOA 吞吐量、功率效率和延迟。
在本文中,我们提出了一种预测事件发生时间的新模型:威布尔事件时间 RNN。这是一个用于预测下一个事件发生时间的时间序列的简单框架,适用于我们遇到连续或离散时间、右删失、重复事件、时间模式、随时间变化的协变量或不同长度的时间序列中的任何一个或所有问题。所有这些问题在客户流失、剩余使用寿命、故障、尖峰序列和事件预测中经常遇到。所提出的模型估计下一个事件发生时间的分布具有离散或连续威布尔分布,其参数是递归神经网络的输出。该模型使用生存分析中常用的特殊目标函数(删失数据的对数似然损失)进行训练。威布尔分布足够简单,可以避免稀疏性,并且可以轻松进行正则化以避免过度拟合,但仍然具有足够的表现力来编码诸如增加、平稳或减少风险之类的概念,并且如果允许的话可以收敛到点估计。预测的威布尔参数可用于预测下一个事件发生时间的预期值和分位数。它还会导致未来风险的自然 2d 嵌入,可用于监测和探索性分析。我们使用一个通用的删失数据框架来描述 WTTE-RNN,该框架可以轻松地与其他分布一起扩展并适用于多变量预测。我们表明,常见的比例风险模型和威布尔加速故障时间模型是 WTTE-RNN 的特殊情况。对具有不同程度删失和时间分辨率的模拟数据评估了所提出的模型。我们将它与二元固定窗口预测模型和处理删失数据的简单方法进行了比较。该模型优于简单方法,并且被发现具有许多优点和与二元固定窗口 RNN 相当的性能,而无需指定窗口大小和在更多数据上训练的能力。将 CMAPSS 数据集应用于模拟喷气发动机的 PHM 运行至故障得到了有希望的结果。
在本论文中,我们提出了一种预测事件发生时间的新模型:威布尔事件时间 RNN。这是一个用于预测下一个事件发生时间的时间序列的简单框架,适用于我们遇到连续或离散时间、右删失、重复事件、时间模式、随时间变化的协变量或不同长度的时间序列中的任何一个或所有问题时。所有这些问题在客户流失、剩余使用寿命、故障、尖峰训练和事件预测中经常遇到。所提出的模型估计下一个事件发生时间的分布具有离散或连续威布尔分布,其参数是递归神经网络的输出。该模型使用生存分析中常用的特殊目标函数(删失数据的对数似然损失)进行训练。威布尔分布足够简单,可以避免稀疏性,并且可以轻松地进行正则化以避免过度拟合,但仍然具有足够的表现力来编码诸如增加、平稳或减少风险等概念,并且可以在允许的情况下收敛到点估计。预测的威布尔参数可用于预测下一个事件时间的预期值和分位数。它还导致未来风险的自然 2d 嵌入,可用于监控和探索性分析。我们使用通用的审查数据框架来描述 WTTE-RNN,该框架可以轻松地与其他分布一起扩展并适用于多变量预测。我们表明,常见的比例风险模型和威布尔加速故障时间模型是 WTTE-RNN 的特殊情况。所提出的模型在具有不同程度的审查和时间分辨率的模拟数据上进行了评估。我们将其与二元固定窗口预测模型和处理审查数据的简单方法进行了比较。该模型优于简单方法,并且被发现具有许多优势和与二元固定窗口 RNN 相当的性能,而无需指定窗口大小和在更多数据上进行训练的能力。应用于 CMAPSS 数据集以进行模拟喷气发动机的 PHM 运行至故障得到了有希望的结果。