对于医学图像分割,想象一下如果一个模型仅使用源域中的 MRI 图像进行训练,那么它在目标域中直接分割 CT 图像的性能如何?这种设置,即具有临床潜力的通用跨模态分割,比其他相关设置(例如域自适应)更具挑战性。为了实现这一目标,我们在本文中提出了一种新颖的双重规范化模型,该模型在通用分割过程中利用增强的源相似和源不相似图像。具体而言,给定一个源域,旨在模拟看不见的目标域中可能的外观变化,我们首先利用非线性变换来增强源相似和源不相似图像。然后,为了充分利用这两种类型的增强,我们提出的基于双重规范化的模型采用共享主干但独立的批量规范化层进行单独规范化。随后,我们提出了一种基于风格的选择方案,在测试阶段自动选择合适的路径。在三个公开数据集(即 BraTS、跨模态心脏和腹部多器官数据集)上进行的大量实验表明,我们的方法优于其他最先进的领域泛化方法。代码可在 https://github.com/zzzqzhou/Dual-Normalization 获得。
摘要:运动想象作为自发性脑机接口的重要范式,被广泛应用于神经康复、机器人控制等领域。近年来,研究者提出了多种基于运动想象信号的特征提取和分类方法,其中基于深度神经网络(DNN)的解码模型在运动想象信号处理领域引起了广泛关注。由于对受试者和实验环境的严格要求,收集大规模高质量的脑电图(EEG)数据非常困难,而深度学习模型的性能直接取决于数据集的大小。因此,基于DNN的MI-EEG信号解码在实践中被证明是非常具有挑战性的。基于此,我们研究了不同的数据增强(DA)方法在使用DNN对运动想象数据进行分类的性能。首先,我们使用短时傅里叶变换(STFT)将时间序列信号转换为频谱图像。然后,我们评估并比较了不同 DA 方法对该频谱图数据的性能。接下来,我们开发了一个卷积神经网络(CNN)来对 MI 信号进行分类,并比较了 DA 后的分类性能。使用 Frechet 初始距离(FID)评估生成数据(GD)的质量和分类准确率,使用平均 kappa 值探索最佳的 CNN-DA 方法。此外,使用方差分析(ANOVA)和配对 t 检验来评估结果的显著性。结果表明,深度卷积生成对抗网络(DCGAN)比传统 DA 方法:几何变换(GT)、自动编码器(AE)和变分自动编码器(VAE)提供了更好的增强性能(p < 0.01)。使用 BCI 竞赛 IV(数据集 1 和 2b)的公共数据集来验证分类性能。经过 DA 后,两个数据集的分类准确率分别提高了 17% 和 21%(p < 0.01)。此外,混合网络 CNN-DCGAN 的表现优于其他分类方法,两个数据集的平均 kappa 值分别为 0.564 和 0.677。
语义文本相关性是语义相似性的更广泛的影响。它衡量了两个文本传达相似含义或主题或共享相关概念或上下文的范围。这种相关性概念可以在各种应用中(例如文档聚类和汇总)中提出。SEMREL-2024是Semeval-2024中的共享任务,旨在通过为包括阿拉伯语在内的14种语言和方言提供数据集来减少语义相关性任务中的差距。本文介绍了我们参与轨道A(阿尔及利亚和摩洛哥方言)和轨道B(现代标准阿拉伯语)的参与。在监督轨道(a)中对基于BERT的模型进行了精心调整,而基于BERT的CONINE相似性则用于无监督的轨道(B)。我们的系统在Semrel-2024中对MSA排名第1,Spearman相关得分为0.49。,我们为摩洛哥排名第5位,而阿尔及利亚的排名分别为0.83和0.53。
红外图像中的多级对象检测对于军事和平民使用很重要。深度学习方法可以获得高精度,但需要大规模数据集。我们提出了一个生成数据增强框架文档,用于使用有限数据的红外多级对象检测。本文的贡献是四倍。首先,Doci-Gan被设计为有条件的图像介绍框架,得出配对的红外多级对象图像和注释。其次,为文本到图像转换器配制了将文本格式对象注释转换为边界框掩码映像,从而导致增强是掩盖图像 - 图像 - 绘制图像图像翻译。第三,产生了基于多形态侵蚀的损失,以减轻对本地背景和全球背景的涂料不一致的不一致性。最后,为了生成各种图像,人工多级对象注释在增强过程中与真实的对象注释集成在一起。实验结果表明,具有高质量红外多级对象图像的文档增强数据集,从而提高了对象检测基准的准确性。
摘要 - 在社交网络广告的不断发展的景观中,数据的数量和准确性在预测模型的性能中起着至关重要的作用。然而,鲁棒预测算法的发展通常受到现实数据集中存在的有限尺寸和潜在偏差的阻碍。本研究介绍并探讨了社交网络广告数据的生成增强框架。我们的框架探索了三个用于数据增强的生成模型 - 生成对抗网络(GAN),变异自动编码器(VAE)和高斯混合模型(GMMS) - 以丰富社交网络广告分析有效性的上下文中的数据可用性和多样性。通过执行特征空间的合成扩展,我们发现通过数据增强,各种分类器的性能已被定量改进。此外,我们比较了每种数据增强技术带来的相对性能增长,从而为从业者提供了选择适当的技术以增强模型性能的见解。本文通过表明综合数据增加可以减轻社交网络广告领域中的小型或不平衡数据集施加的限制,从而有助于文学。同时,本文还提供了有关不同数据增强方法的实用性的比较观点,从而指导从业者选择适当的技术来增强模型性能。
摘要 — 数据增强是深度模型训练过程中帮助泛化的一种常见做法。在生理时间序列分类的背景下,以前的研究主要集中在标签不变的数据增强方法。然而,另一类出现在计算机视觉领域的增强技术(即 Mixup)尚未在时间序列领域得到充分探索。在本研究中,我们系统地回顾了六个生理数据集上的基于混合的增强,包括 mixup、cutmix 和流形 mixup,评估它们在不同感官数据和分类任务中的表现。我们的结果表明,三种基于混合的增强可以持续提高六个数据集的性能。更重要的是,这种改进不依赖于专家知识或广泛的参数调整。最后,我们概述了基于混合的增强方法的独特属性,并强调了在生理时间序列数据中使用基于混合的增强的潜在好处。我们的代码和结果可在 https://github.com/comp-well-org/Mix-Augmentation-for-Physiological-Time-Series-Classification 上找到。索引术语 — 数据增强、混合、生理时间序列
语音情感识别(SER)是任何人类机器相互作用的必不可少的组成部分,并启用构建善解人意的语音用户界面。在与基于语音的呼叫中心(基于语音的呼叫中心)一样,当一个人与机器或代理互动时,在嘈杂环境中准确识别情绪的能力在实践场景中很重要。在本文中,我们提出了基于加强学习(RL)的数据增强技术,以构建强大的SER系统。RL中使用的奖励函数启用选择性噪声分布在不同的频带上以进行数据增强。我们表明,所提出的基于RL的增强技术优于最近提出的基于随机选择的技术,用于噪声稳健的SER任务。我们将IEMOCAP数据集与四个情绪类别类别一起验证所提出的技术。更重要的是,我们在跨语料库和跨语言场景中测试SER系统的噪声稳健性。索引术语:语音情绪识别,稳健性,选择性数据增强,强化学习。
尖端技术构筑美好未来:先进宇宙应用技术 隼鸟2号离子发动机及其潜在应用 隼鸟2号——自主导航、制导和控制系统 支持龙宫小行星精确着陆 利用星载激光雷达遥感技术实现隼鸟2号航天器的自主着陆 隼鸟2号:系统设计和运行结果 用于高速、大容量数据通信的卫星间光学通信技术 为三朝深空站开发30kW级X波段固态功率放大器 开发世界最高性能薄膜太阳能电池阵列桨片
摘要:数字化是当前行业转型的新兴过程。了解数字化的作用和社会经济后果对于技术在每个领域的部署方式至关重要。受影响的行业之一是牙科。本研究重点介绍了牙科领域在整合和融合人工智能 (AI)、智能增强 (IA) 和机器学习 (ML) 方面的最新进展和挑战。我们进行了比较分析,以概述目前正在部署哪种技术以及 IA 和 AI 将在牙科中发挥什么作用,因为 AI 在提高人类能力方面发挥着辅助作用。我们发现挑战范围从 AI 进入常规医疗实践到检索足够数据输入的定性挑战。其他挑战在于如何降低新技术部署成本的责任问题尚未得到解答。鉴于这些挑战,我们展望了未来技术如何应用于日常牙科,以及鉴于当前的技术发展,机器人与人类将如何互动。本文旨在讨论牙科的未来,以及是人工智能还是 IA 征服了现代牙科时代。