时空卷积通常无法学习视频中的运动动态,因此需要一种有效的运动表示来理解自然界中的视频。在本文中,我们提出了一种基于时空自相似性(STSS)的丰富而鲁棒的运动表示。给定一系列帧,STSS 将每个局部区域表示为与空间和时间中邻居的相似性。通过将外观特征转换为关系值,它使学习者能够更好地识别空间和时间中的结构模式。我们利用整个 STSS,让我们的模型学习从中提取有效的运动表示。我们所提出的神经块称为 SELFY,可以轻松插入神经架构中并进行端到端训练,无需额外监督。通过在空间和时间上具有足够的邻域体积,它可以有效捕捉视频中的长期交互和快速运动,从而实现鲁棒的动作识别。我们的实验分析表明,该方法优于以前的运动建模方法,并且与直接卷积的时空特征互补。在标准动作识别基准 Something-Something-V1 & V2、Diving-48 和 FineGym 上,该方法取得了最佳效果。
大规模视觉语言预训练模型的最新进展已在自然图像领域中的零样本/少样本异常检测方面取得了重大进展。然而,自然图像和医学图像之间巨大的领域差异限制了这些方法在医学异常检测中的有效性。本文介绍了一种新颖的轻量级多级自适应和比较框架,以重新利用 CLIP 模型进行医学异常检测。我们的方法将多个残差适配器集成到预训练的视觉编码器中,从而实现不同级别视觉特征的逐步增强。这种多级自适应由多级、逐像素的视觉语言特征对齐损失函数引导,将模型的重点从自然图像中的对象语义重新校准到医学图像中的异常识别。调整后的特征在各种医学数据类型中表现出更好的泛化能力,即使在模型在训练期间遇到看不见的医学模态和解剖区域的零样本场景中也是如此。我们在医学异常检测基准上进行的实验表明,我们的方法明显优于当前最先进的模型,在零样本和少样本设置下,异常分类的平均 AUC 改进分别为 6.24% 和 7.33%,异常分割的平均 AUC 改进分别为 2.03% 和 2.37%。源代码可从以下网址获取:https://github.com/MediaBrain-SJTU/MVFA-AD
Index: 5 Foreword 6 Application of monoclonal antibodies in the management of Kawasaki 7 Genny Elizabeth Segura Alcivar 7 Innovations in fetal surgery for the correction of spine Bifid Lorena Álamos Encalada 36 Anyoly Yanetty Garcia 36 Use of probiotics in the treatment of the colic of the infant 52 YESENIA PAOLA MARTINEZ ALVAREZ 52 MyriamLissethGarcíaVinueza52使用磁性心脏共振出生90 CarolinaEstefaníaPalmaLeguísamo90ThalíaCristinaCarrisinaCarriunPatiñpatiñ
本文介绍了GenH2R,这是一个学习基于远见的人类到机器人(H2R)han-dover技能的框架。目标是为机器人配备能够以各种复杂轨迹的人类传递的几何形状可靠接收对象。我们通过通过全面的解决方案进行大规模学习H2R移交,包括程序模拟资产创建,自动演示式概述和有效的模仿学习。我们利用大型3D模型存储库,敏感的GRASP生成方法和基于曲线的3D动画来创建名为GenH2R-SIM的H2R交换模拟环境,并通过三个尺度级传递了现有模拟器中现有模拟器中的场景数量。我们进一步引入了一种蒸馏友好的演示生成方法,该方法自动产生了一百万个适合学习的高质量演示。最后,我们提出了一种4D模仿的学习方法,该方法通过将来的预测目标增强,以将示范示例提炼为视觉运动切换政策。在所有情况下,模拟器和现实世界中的实验评估都表现出比基线的显着提高(至少 +10%的成功率)。
尽管隐式神经表征 (INR) 近期取得了进展,但对于基于坐标的 INR 多层感知器 (MLP) 来说,学习跨数据实例的通用表征并将其推广至未见实例仍然具有挑战性。在这项工作中,我们为可推广的 INR 引入了一个简单而有效的框架,该框架使基于坐标的 MLP 能够通过仅调节早期 MLP 层中的一小组权重作为实例模式组合器来表示复杂数据实例;其余 MLP 权重学习跨实例通用表示的模式组合规则。我们的可推广 INR 框架与现有的元学习和超网络完全兼容,可用于学习预测未见实例的调节权重。大量实验表明,我们的方法在音频、图像和 3D 对象等广泛领域都实现了高性能,而消融研究验证了我们的权重调节。
IEEE 是一家非盈利组织,是世界上最大的技术专业组织,致力于推动技术进步,造福人类。© 版权所有 2023 IEEE - 保留所有权利。使用本网站即表示您同意条款和条件。
对于医学图像分割,想象一下如果一个模型仅使用源域中的 MRI 图像进行训练,那么它在目标域中直接分割 CT 图像的性能如何?这种设置,即具有临床潜力的通用跨模态分割,比其他相关设置(例如域自适应)更具挑战性。为了实现这一目标,我们在本文中提出了一种新颖的双重规范化模型,该模型在通用分割过程中利用增强的源相似和源不相似图像。具体而言,给定一个源域,旨在模拟看不见的目标域中可能的外观变化,我们首先利用非线性变换来增强源相似和源不相似图像。然后,为了充分利用这两种类型的增强,我们提出的基于双重规范化的模型采用共享主干但独立的批量规范化层进行单独规范化。随后,我们提出了一种基于风格的选择方案,在测试阶段自动选择合适的路径。在三个公开数据集(即 BraTS、跨模态心脏和腹部多器官数据集)上进行的大量实验表明,我们的方法优于其他最先进的领域泛化方法。代码可在 https://github.com/zzzqzhou/Dual-Normalization 获得。
另请参阅:可穿戴传感器在 SARS-CoV-2 感染检测中的表现:系统评价,Mitratza 和 Goodale 等人。《柳叶刀数字健康》
飓风 飓风是一种非常强大的风暴。它是一种气旋风暴,这意味着飓风内部呈圆形。飓风这个名字指的是始于大西洋或东太平洋的风暴。飓风在世界其他海洋中有不同的名称。例如,它们在西北太平洋被称为台风。在世界其他大部分地区,它们被称为气旋。它们的风速大多超过每小时 75 英里。风以圆形模式移动。风暴移动的中心点称为风暴眼。这些风暴通常发生在温暖的热带海洋中。它们从蒸发的海水中获取能量。飓风在陆地上移动时会减弱,因为它们依靠温暖的海洋在风暴移动时继续提供能量。陆地的表面也比海洋粗糙得多。陆地的海拔和表面变化要大得多。当风遇到陆地表面并产生摩擦时,飓风会失去动力。飓风是一种强大的风暴,通常始于大西洋或太平洋。这些风暴依靠海洋获得力量和能量,登陆后速度会减慢。
联合学习允许分布式的医疗机构可以协作学习具有隐私保护的共享预测模型。在临床部署时,接受联邦学习的模型仍会在联邦外面完全看不见的霍斯群岛上使用时仍会遭受性能下降。在本文中,我们指出并解决了联合域的生成(FedDG)的新型问题设置,该设置旨在从多个分布式源域中学习联合模型,以便它可以直接概括为看不见的目标域。我们提出了一种新颖的方法,在持续频率空间(ELCF)中称为情节学习,通过启动每个客户端在数据分散率的挑战性约束下利用多源数据分布来利用多源数据分布。我们的方法通过有效的连续频率空间插值机制以隐私保护方式传输客户之间的分布信息。通过转移的多源分布,我们进一步仔细设计了面向边界的情节学习范式,以将本地学习暴露于域分布变化,尤其是在医学图像分割场景中尤其满足模型概括的挑战。在两个医学图像分割任务上,我们的方法的有效性优于最先进的表现和深入消融实验。可以在https://github.com/liuquande/feddg-elcfs上使用代码。