4f 5此UDRA通过合并反馈机制来推动数据产品内容和质量,提供了满足士兵对数据需求的方法。它描述并定义了用于自助数据产品发现和消费的服务。此UDRA包括传输不可能的数据交换,这些数据交换支持所有梯队的全部网络范围,从而减少了数据的复制和持久性。它还利用联合治理并实现了全球和地方治理政策的自动执行。此UDRA分散了数据产品的责任和权限,以提高数据质量并扩展陆军在数据域之间共享数据产品的能力。最终,这种UDRA将指导以数据为中心的能力获得,并提高陆军的有效性,这是合并/联合战斗力的一部分。
基于能量的模型 (EBM) 因其在似然建模中的通用性和简单性而具有吸引力,但传统上很难训练。我们介绍了在连续神经网络上扩展基于 MCMC 的 EBM 训练的技术,并展示了它在 ImageNet32x32、ImageNet128x128、CIFAR-10 和机器人手轨迹的高维数据域上的成功,获得了比其他似然模型更好的样本,接近当代 GAN 方法的性能,同时覆盖了数据的所有模式。我们重点介绍了隐式生成的一些独特功能,例如组合性和损坏图像重建和修复。最后,我们表明 EBM 是适用于各种任务的有用模型,实现了最先进的分布外分类、对抗鲁棒分类、最先进的持续在线类学习和连贯的长期预测轨迹推出。
摘要:近年来端到端学习的图像压缩编解码器显着出现。这些编解码器表现出比常规方法的优越性,在支持新的失真损失的同时,展示了各种数据域之间的显着灵活性和适应性。尽管诸如计算复杂性之类的挑战,但由于其非常合适的内部表示,学习的图像压缩方法与基于学习的数据处理和分析管道固有地保持一致。机器视频编码的概念引起了学术研究人员和行业从业人员的极大关注。这个概念反映了将数据压缩与计算机视觉应用程序集成的日益增长的需求。根据这些发展,我们提出了一项全面的调查和综述,对有损图像压缩方法。此外,我们还提供了两个著名国际标准的简明概述,即机器和JPEG AI的MPEG视频编码。这些标准旨在弥合数据压缩和计算机视觉之间的差距,以适应实际行业用例。
决策驱动的数据概念(CONOPS)。2,3,4,5此UDRA通过合并反馈机制来推动数据产品内容和质量,提供了满足士兵对数据需求的方法。它描述并定义了用于自助数据产品发现和消费的服务。此UDRA包括传输不可能的数据交换,这些数据交换支持所有梯队的全部网络范围,从而减少了数据的复制和持久性。它还利用联合治理并实现了全球和地方治理政策的自动执行。此UDRA分散了数据产品的责任和权限,以提高数据质量并扩展陆军在数据域之间共享数据产品的能力。最终,这种UDRA将指导以数据为中心的能力获得,并提高陆军的有效性,这是合并/联合战斗力的一部分。
摘要。车辆轨迹预测越来越依赖于数据驱动的解决方案,但是它们扩展到不同数据域的能力以及较大数据集大小对其概括的影响仍然不足。虽然可以通过使用多个数据集来研究这些问题,但由于几个差异,例如,在数据for-mats,MAP分辨率和语义注释类型中,这是具有挑战性的。为了应对这些挑战,我们介绍了Unitraj,这是一个综合框架,该框架统一了各种数据集,模型和评估标准,为车辆轨迹预测字段提供了新的机会。特别是,使用Unitraj,我们进行了广泛的实验,并发现当转移到其他数据集时,模型的模型显着下降。但是,扩大数据大小和多样性可以大大提高性能,从而导致Nuscenes数据集的最新结果。我们对数据集特征提供了见解,以解释这些发现。代码可以在此处找到:https://github.com/vita-epfl/unitraj。
预训练已在深度学习中被广泛采用,以提高模型性能,特别是当目标任务的训练数据有限时。在我们的工作中,我们试图了解这种训练策略对下游模型泛化特性的影响。更具体地说,我们提出以下问题:预训练分布的属性如何影响微调模型的鲁棒性?我们探索的属性包括预训练分布的标签空间、标签语义、图像多样性、数据域和数据量。我们发现影响下游有效鲁棒性的主要因素 [44] 是数据量,而其他因素的重要性有限。例如,将 ImageNet 预训练类别的数量减少 4 倍,同时将每个类别的图像数量增加 4 倍(即保持总数据量固定)不会影响微调模型的鲁棒性。我们展示了从各种自然和合成数据源中提取的预训练分布的发现,主要使用 iWildCam-WILDS 分布转变作为稳健性测试。
近年来,解释机器学习模型的算法方法激增。我们进行了首次以人为本的测试,以分离算法解释对模型可解释性的关键方面(可模拟性)的影响,同时避免重要的混杂实验因素。当一个人能够预测其对新输入的行为时,该模型是可模拟的。通过两种涉及文本和表格数据的模拟测试,我们评估了五种解释方法:(1)LIME,(2)Anchor,(3)决策边界,(4)原型模型,以及(5)结合每种方法的解释的复合方法。在极少数情况下,方法的有效性得到了明确的证据:LIME 提高了表格分类的可模拟性,而我们的原型方法在反事实模拟测试中是有效的。我们还收集了解释的主观评分,但我们发现评分并不能预测解释的有用程度。我们的结果首次提供了可靠而全面的估计,表明解释如何影响各种解释方法和数据域的可模拟性。我们表明 (1) 我们需要谨慎使用用于评估解释方法的指标,(2) 当前方法还有很大的改进空间。1
摘要 目的。本文提出了一种新的领域适应 (DA) 框架,以提高基于脑电图 (EEG) 的听觉注意力分类的准确性,特别是对注意语音的方向(左或右)进行分类。该框架旨在提高最初分类准确度较低的受试者的表现,克服工具和人为因素带来的挑战。数据集大小有限、由于噪声、电极错位或受试者等因素导致的 EEG 数据质量变化以及跨不同试验、条件和受试者进行概括的需要,必须使用 DA 方法。通过利用 DA 方法,该框架可以从一个 EEG 数据集中学习并适应另一个,从而可能产生更可靠和更强大的分类模型。方法。本文重点研究一种基于并行传输的 DA 方法,用于解决听觉注意力分类问题。本研究中使用的 EEG 数据来自一项实验,其中受试者被指示选择性地注意同时呈现的两个空间分离的声音之一。主要结果。与基线相比,当将来自一个受试者的不良数据传输到来自不同受试者的良好数据域时,分类准确度显著提高。数据较差的受试者的平均分类准确度从 45.84% 提高到 67.92%。具体而言,来自一个受试者的最高分类准确度达到 83.33%,比基线准确度 43.33% 大幅提高。意义。我们的研究结果表明,通过实施 DA 方法可以提高分类性能。这使我们更接近在神经引导听力设备中利用 EEG。
摘要简介:用于医学成像的深度学习 (DL) 模型发展迅速。然而,DL 需要大量标记数据集来训练模型。获取大规模标记数据仍然是一个挑战,并且由于患者的多样性和不同的成像协议,多中心数据集存在异质性。域自适应 (DA) 已经开发出来将知识从标记数据域转移到图像空间或特征空间中的相关但未标记的域。DA 是一种迁移学习 (TL),当应用于多个不同的数据集时可以提高模型的性能。目标:在这篇调查中,我们回顾了用于医学成像的最先进的基于 DL 的 DA 方法。我们旨在总结最近的进展,强调动机、挑战和机遇,并讨论未来医学成像 DA 工作的有希望的方向。方法:我们调查了 2017 年至 2020 年间来自领先生物医学期刊和会议的经过同行评审的出版物,这些出版物报告了 DA 在医学成像应用中的使用情况,并按方法、图像模态和学习场景对它们进行分组。结果:我们主要关注病理学和放射学作为应用领域。在各种 DA 方法中,我们讨论了域变换 (DT) 和潜在特征空间变换 (LFST)。我们强调了无监督 DA 在图像分割中的作用,并描述了未来的发展机会。结论:DA 已经成为一种有前途的解决方案,可以解决缺乏带注释的训练数据的问题。使用对抗技术,无监督 DA 已经取得了良好的性能,尤其是在分割任务方面。机会包括域可转移性、多模态 DA 和受益于合成数据的应用程序。