摘要 — 最近,深度学习方法,特别是卷积神经网络 (CNN),在计算机视觉领域取得了巨大突破。此外,大规模注释数据集是成功训练过程的关键。然而,在医学领域获取这样的数据集是一个巨大的挑战。为此,我们提出了一种使用循环一致性生成对抗网络 (GAN) 生成合成医学图像的数据增强方法。我们添加半监督注意模块来生成具有令人信服的细节的图像。我们将肿瘤图像和正常图像视为两个领域。所提出的基于 GAN 的模型可以从正常图像生成肿瘤图像,反过来,它也可以从肿瘤图像生成正常图像。此外,我们表明生成的医学图像可用于提高 ResNet18 在医学图像分类中的性能。我们的模型应用于三个有限的肿瘤 MRI 图像数据集。我们首先在有限的数据集上生成 MRI 图像,然后训练三种流行的分类模型以获得最佳的肿瘤分类模型。最后,我们使用经典的数据增强方法使用真实图像训练分类模型,使用合成图像训练分类模型。这些训练模型之间的分类结果表明,与经典的数据增强方法相比,所提出的 SAG-GAN 数据增强方法可以提高准确率和 AUC。我们相信所提出的数据增强方法可以应用于其他医学图像领域,并提高计算机辅助诊断的准确性。索引词——生成对抗网络 (GAN)、数据增强、注意模块、医学图像处理
摘要。由于医师和外科医生的短缺,以及由于诸如COVID-19大流行等情况,全球需求的增加,人们对找到解决方案的兴趣日益增加,以帮助解决该问题。解决此问题的解决方案是使用神经技术来增强认知,感官和动作以进行最佳诊断和治疗。因此,这样做会对他们和其他人产生负面影响。我们认为,在医师和外科医生中应用神经技术来增强人类可能会造成不公正,并伤害他们和患者。在本文中,我们将首先描述可用于实现医师和外科医生相关的增强的增强和旋转技术。然后,我们将审查文献中讨论的选定的道德信息,讨论使用神经技术来增强目的的神经工程,然后在医学和外科实践中通过神经技术实施人类实施人类的成果和道德问题进行分析。
训练分割网络需要大量带注释的数据集,而这在医学成像中很难获得。尽管如此,我们认为数据增强尚未在脑肿瘤分割中得到充分探索。在本项目中,我们在训练标准 3D U-Net 时应用了不同类型的数据增强(翻转、旋转、缩放、亮度调整、弹性变形),并证明增强在许多情况下可显著提高网络性能。我们的结论是亮度增强和弹性变形效果最好,与仅使用一种增强技术相比,不同增强技术的组合并不能带来进一步的改进。我们的代码可在 https://github.com/mdciri/3D-augmentation-techniques 获得。
摘要 - 大脑 - 计算机界面(BCI)系统中分类器的性能高度取决于培训数据的质量和数量。通常,培训数据是在用户在受控环境中执行任务的实验室中收集的。但是,用户的注意力可能会在现实BCI应用中转移,这可能会降低分类器的性能。为了提高分类器的鲁棒性,可以在这种情况下获取其他数据,但是在几个长期校准过程中记录脑电图(EEG)数据是不切实际的。潜在的时间和成本效益的解决方案是人工数据生成。因此,在这项研究中,我们建立了一个基于深度卷积生成对抗网络(DCGAN)的框架,用于生成人工脑电图以增加训练集,以提高BCI分类的性能。为了进行比较研究,我们设计了一个运动任务实验,并具有转移和集中注意力的条件。我们使用14个受试者的数据使用了端到端深卷积神经网络进行运动意图与休息之间的分类。放出一个主题(LOO)分类的结果得出了分离注意力的基线精度为73.04%,而没有数据扩大的集中注意力为集中注意力为80.09%。使用拟议的基于DCGANS的框架进行增强,结果显着提高了7.32%的转移注意力(P <0。01)和5.45%的集中注意力(p <0。01)。提出的方法将精度提高了3.57%(p <0。02)。此外,我们在BCI竞争III的数据集III上提出了该方法,以区分不同的运动成像任务。这项研究表明,使用gans进行脑电图增强可以显着提高BCI的性能,尤其是在现实生活中,可以将用户的注意力转移。
摘要 - 大型和高质量的培训数据集对于深度学习至关重要。在无人机空中图像的语义分割挑战的背景下,我们提出了一种数据增强策略,该策略可以大大减少手动注释大量图像的努力。结果是一组语义,深度和RGB图像,可用于改善神经网络的性能。该方法的主要重点是生成语义图像,并且在整个过程中也生成了深度和纹理图像。提出的语义图像产生方法依赖于现实环境的3D语义网格表示。首先,我们将现有的语义信息从简化的手动标记图像集中传播到网格表示中。要处理手动标记的图像中的错误,我们为传播过程提出了一种特定的加权投票机制。第二,我们使用语义网络创建新图像。这两个步骤都使用透视投影机制和深度缓冲算法。可以使用不同的相机方向生成图像,从而允许新颖的视角。我们的方法在概念上是一般的,可用于改善各种现有数据集。对使用该方法进行增强的现有数据集(UAVID和WILDUAV)进行的实验是在HRNET上进行的。获得了推理结果的总体绩效提高高达5.5%(MIOU)。增强数据集在GitHub 1上公开可用。索引术语 - 语义图像,无人机,数据增强,图像生成,空中图像,Z-Buffer,深度缓冲区,透视投影,虚拟相机。
(U) IVAS 是一种军用护目镜,可在士兵的视线内叠加战术相关的全息信息,以提高杀伤力、机动性和态势感知能力。该系统目前正在开发中。IVAS 将下一代 24/7 态势感知工具和高分辨率数字传感器集成在一个平台上,旨在提高士兵的感知、决策、目标获取和目标交战能力。IVAS 项目经理官员(项目官员)表示,士兵将主要在夜间使用第一版 IVAS,尽管最初的开发是针对白天和夜间使用的。图 1 显示了一名佩戴 IVAS 的士兵。图 2 显示了 IVAS 的各个组件。
摘要 卫星全球导航卫星系统 (GNSS) 技术正在开发中,用于民航运营。GNSS 的一个主要特点是可以在全球范围内提供精确导航。例如,美国联邦航空管理局 (FAA) 开发了广域增强系统 (WAAS),该系统通过提高系统准确性、完整性和可用性来增强全球定位系统 (GPS),以满足精密进近导航的航路要求。为了为 WAAS 开发提供平台,FAA 建立了国家卫星试验台 (NSTB)。NSTB 是一个原型 WAAS,其地面基础设施遍布美国和国际。为了在中非和中南地区建立用于开发 WAAS 类型 SBAS 系统的试验平台,ICAO 和 FAA 之间签署了一份谅解备忘录 (MOU)。备忘录于 2001 年 6 月 2 日签署。由此,联合国开发计划署/国际民航组织技术合作项目 RLA/00/009 应运而生,以下国家和国际组织加入了该项目:阿根廷、玻利维亚、巴西、智利、哥伦比亚、厄瓜多尔、巴拿马、秘鲁、美国、委内瑞拉和 COCESNA。通过 RLA/00/009 项目实施的 CAR/SAM 卫星平台测试平台被命名为 CAR/SAM 测试平台 (CSTB)。它是在 NSTB 的基础上设计的。CSTB 和 NTSB 都通过专用通信电路连接。该通信电路最初在智利圣地亚哥 (CSTB) 和美国大西洋城 (FAA 技术中心 (NSTB)) 之间实施,包括里约热内卢 (CSTB) 和大西洋城 FAA 技术中心 (NSTB) 之间的链路。为展示该计划的目标,采取了区域性方法,以帮助说明该区域系统如何使整个区域受益,而不仅仅是使积极参与其中的人受益。CSTB 的成立是为了促进基于 GPS 和 WAAS 类型 SBAS 技术的空中导航操作系统的收集、开发、购买和实施。CSTB 的实施是为了支持在中非和中美洲/南美地区的标准化 GPS 实施,建立一支区域技术专家队伍,并包括初始广域增强系统测试平台,稍后将补充针对每个国家的增强区域容量。)。该测试平台旨在通过开发可应用于运营环境(即场地选择和准备、安全地面通信链路、运营程序开发、飞机认证、培训等)的试验基础设施来降低运营实施成本。
摘要 卫星全球导航卫星系统 (GNSS) 技术正在开发中,用于民航运营。GNSS 的一个主要特点是可以在全球范围内提供精确导航。例如,美国联邦航空管理局 (FAA) 开发了广域增强系统 (WAAS),该系统通过提高系统准确性、完整性和可用性来增强全球定位系统 (GPS),以满足精密进近导航的航路要求。为了为 WAAS 开发提供平台,FAA 建立了国家卫星试验台 (NSTB)。NSTB 是一个原型 WAAS,其地面基础设施遍布美国和国际。为了在中非和中南地区建立用于开发 WAAS 类型 SBAS 系统的试验平台,ICAO 和 FAA 之间签署了一份谅解备忘录 (MOU)。备忘录于 2001 年 6 月 2 日签署。由此,联合国开发计划署/国际民航组织技术合作项目 RLA/00/009 应运而生,以下国家和国际组织加入了该项目:阿根廷、玻利维亚、巴西、智利、哥伦比亚、厄瓜多尔、巴拿马、秘鲁、美国、委内瑞拉和 COCESNA。通过 RLA/00/009 项目实施的 CAR/SAM 卫星平台测试平台被命名为 CAR/SAM 测试平台 (CSTB)。它是在 NSTB 的基础上设计的。CSTB 和 NTSB 都通过专用通信电路连接。该通信电路最初在智利圣地亚哥 (CSTB) 和美国大西洋城 (FAA 技术中心 (NSTB)) 之间实施,包括里约热内卢 (CSTB) 和大西洋城 FAA 技术中心 (NSTB) 之间的链路。为展示该计划的目标,采取了区域性方法,以帮助说明该区域系统如何使整个区域受益,而不仅仅是使积极参与其中的人受益。CSTB 的成立是为了促进基于 GPS 和 WAAS 类型 SBAS 技术的空中导航操作系统的收集、开发、购买和实施。CSTB 的实施是为了支持在中非和中美洲/南美地区的标准化 GPS 实施,建立一支区域技术专家队伍,并包括初始广域增强系统测试平台,稍后将补充针对每个国家的增强区域容量。)。该测试平台旨在通过开发可应用于运营环境(即场地选择和准备、安全地面通信链路、运营程序开发、飞机认证、培训等)的试验基础设施来降低运营实施成本。
摘要 — 以时间序列形式出现的信号测量是医学机器学习应用中最常见的数据类型之一。此类数据集通常规模较小,收集和注释成本高昂,并且可能涉及隐私问题,这阻碍了我们为生物医学应用训练大型、最先进的深度学习模型的能力。对于时间序列数据,我们可以用来扩展数据集大小的数据增强策略套件受到需要维护信号基本属性的限制。生成对抗网络 (GAN) 可以用作另一种数据增强工具。在本文中,我们提出了 TTS-CGAN,这是一种基于 Transformer 的条件 GAN 模型,可以在现有的多类数据集上进行训练并生成任意长度的特定于类的合成时间序列序列。我们详细阐述了模型架构和设计策略。我们的模型生成的合成序列与真实序列没有区别,可以用来补充或替换相同类型的真实信号,从而实现数据增强的目标。为了评估生成数据的质量,我们修改了小波相干性度量,以便能够比较两组信号之间的相似性,并进行了一个案例研究,其中使用合成数据和真实数据的混合来训练用于序列分类的深度学习模型。结合其他可视化技术和定性评估方法,我们证明 TTS-CGAN 生成的合成数据与真实数据相似,并且我们的模型比其他为时间序列数据生成构建的最先进的 GAN 模型表现更好。TTS-CGAN 源代码:github.com/imics-lab/tts-cgan
在物理治疗,理解和分析患者运动(尤其是步态模式受损)方面的摘要对于有效的康复至关重要。传统上,实习治疗师通过与真实患者和教科书的动手经验获得这些技能。但是,这些方法受到患者的可用性以及治疗师可以观察到的动作的可变性的限制。为了解决这些局限性,我们提出了一个新型系统,该系统使治疗师可以从步态运动受损的广泛障碍中学习,而不会受到时间,位置或患者的可用性的限制。该系统利用HumanML3D数据集和组合Text2Length采样和Text2Motion生成的两步框架。在第一步中,分类模型根据输入文本描述预测运动长度。在第二步中,我们使用时间变异自动编码器(VAE)来生成各种且一致的3D运动序列。我们方法的关键组成部分是从Momask框架中利用残留矢量量化(RVQ),该框架可最大程度地减少误差并增强运动的精度。此外,蒙版的变压器确保合成的运动令牌在时间上是一致的,并且在上下文上是准确的。通过HumanML3D数据集进行了验证,我们的系统为物理治疗师提供了沉浸式和交互式工具,在混合现实环境中启用了动态的,特定于患者的运动模拟。通过弥合常规方法和MR辅助培训之间的差距,该方法使用交互式3D表示来改变治疗师的学习方式。它旨在彻底改变治疗培训,使康复策略更加有效和个性化。