摘要 本研究提出并评估了虚拟现实 (VR) 训练模拟器的评分和评估方法。VR 模拟器可捕获详细的 n 维人体运动数据,这些数据可用于性能分析。开发了定制的医疗触觉 VR 训练模拟器,并用于记录来自 271 名具有多种临床经验水平的受训者的数据。提出了 DTW 多元原型 (DTW-MP)。VR 数据被分为新手、中级或专家。用于时间序列分类的算法的准确率为:动态时间规整 1-最近邻 (DTW-1NN) 60%,最近质心 SoftDTW 分类 77.5%,深度学习:ResNet 85%,FCN 75%,CNN 72.5% 和 MCDCNN 28.5%。专家 VR 数据记录可用于指导新手。评估反馈可以帮助受训者提高技能和一致性。动作分析可以识别个人使用的不同技术。可以实时动态检测错误,发出警报以防止受伤。
摘要:创伤性脑损伤可能导致颅内出血 (ICH)。如果不能及时准确诊断和治疗,ICH 可能导致残疾或死亡。目前诊断 ICH 的临床方案是放射科医生检查计算机断层扫描 (CT) 扫描以检测 ICH 并定位其区域。然而,这个过程在很大程度上依赖于有经验的放射科医生。在本文中,我们设计了一个研究方案来收集 82 个创伤性脑损伤患者的 CT 扫描数据集。接下来,由两位放射科医生协商一致决定在每个切片中手动划定 ICH 区域。该数据集在 PhysioNet 存储库中公开在线,以供将来分析和比较。除了发布数据集(这是本文的主要目的)之外,我们还实施了一个深度全卷积网络 (FCN),称为 U-Net,以全自动方式从 CT 扫描中分割 ICH 区域。作为概念验证,该方法基于 5 倍交叉验证的 ICH 分割实现了 0.31 的 Dice 系数。
摘要 - 植物遗传疾病主要影响妇女,并成为一个公共卫生问题,尽管他们的病理生理学仍然知之甚少。作为主要的器官经历了针对病理学的运动和变形,动态MRI是现在的放射科医生的金标准。器官边界,器官形状的受试者间变异性和病理畸形使得段难以执行。为了开发一个朝着病理分级的成像软件,器官边界的MRI分割的准确性是一个关键标准。自动方法尚未足够准确,无法替代强制性的手动分割步骤。已经开发了使用完全卷积神经网络(FCN)的自动分割方法,但通常用于训练的损耗功能通常不足以适合器官边界检测。我们提出了一个专门用于器官边界检测的损失函数,以增强训练,从而提高结果准确性。使用基线U-NET体系结构[1]对Dynamic 2D MRI的膀胱分割进行了评估该方法。结果表明,与广泛使用的骰子损失相比,我们的边界损失函数以及骰子损失的使用优于现有方法,并提高了分割精度。索引项 - 图像分割,完全卷积的网络,混合损失,距离损失,动态MRI,骨盆
摘要 - 精确农业专注于自动杂草检测,以改善输入的使用并最大程度地减少除草剂的施用。提出的纸张概述了一个视觉变压器(VIT)模型,用于杂草检测,该模型应对农作物和杂草的相似之处,尤其是在复杂的,多样化的环境中,这是由于农作物和杂草的相似性而引起的。该模型是通过使用高分辨率无UAV图像在有机胡萝卜场上拍摄的具有农作物,杂草和背景的高分辨率的无UAV图像的图像进行训练的。由于包括自我注意力的VIT机制的性质,这使其能够捕获长期的空间依赖性,因此这种方法可以很好地将作物行与排间杂草间簇区分开。解决了类不平衡的问题并改善了斑块的通用性,使用了数据预处理技术(例如贴片提取和增强)。在分类中的精度为89.4%,超过了基本模型(例如u-Net和FCN)在实际应用条件下的效率,已证实了所提出的方法的有效性。这种提出的基于VIT的方法是作物管理的明显改善。并为选择性杂草控制提供了前景,以支持更可持续的农业。该模型也可以集成到基于AI的拖拉机中,以实现现场的实时杂草管理。
图像分割是计算机视觉中的一个基本问题,涉及将图像分为多个段或区域,以简化表示形式,并使其对分析更有意义。在对象识别,医学成像和自动驱动器之类的任务中至关重要,其中理解图像中不同对象的空间组织至关重要[3,4]。在图像分割的背景下经常引用的一项基础工作是Long等。的完全卷积网络(FCN)用于半分割[6]。本文通过对CNN进行适应Pixel的预测而无需任何完全连接的层,从而彻底改变了该领域,从而实现了端到端训练并了解任意大小的图像。这种方法为随后的分割方法中的许多后续发展奠定了基础。变压器模型的引入为处理图像分割任务带来了新的视角,该任务在传统上以卷积网络为主导。Xie等人的Seg-前论文。[7]集成了专门针对半分割需求量身定制的变压器体系结构。segformer在其层次变压器编码中脱颖而出,该编码器有效地处理多尺度特征,对于在准确的分割所需的可变分辨率下捕获详细上下文至关重要。
UAV图像采集和深度学习技术已被广泛用于水文监测中,以满足数据量需求不断提高和质量的增加。但是,手动参数培训需要反复试验成本(T&E),现有的自动培训适应简单的数据集和网络结构,这在非结构化环境中是低实用性的,例如干山谷环境(DTV)。因此,这项研究合并了转移学习(MTPI,最大转移电位指数法)和RL(MTSA强化学习,多汤普森采样算法)在数据集自动启动和网络中自动培训,以降低人类的经验和T&E。首先,为了最大程度地提高迭代速度并最大程度地减少数据集消耗,使用改进的MTPI方法得出了最佳的迭代条件(MTPI条件),这表明随后的迭代仅需要2.30%的数据集和6.31%的时间成本。然后,在MTPI条件(MTSA-MTPI)中提高了MTSA至自动提高数据集,结果显示准确性(人为误差)提高了16.0%,标准误差降低了20.9%(T&E成本)。最后,MTPI-MTSA用于四个自动训练的网络(例如FCN,SEG-NET,U-NET和SEG-RES-NET 50),并表明最佳的SEG-RES-NET 50获得了95.2%WPA(准确性)和90.9%的WIOU。本研究为复杂的植被信息收集提供了一种有效的自动培训方法,该方法提供了减少深度学习的手动干预的参考。
% 百分比 A 阿马戈萨变电站 AACE 工程造价促进协会 ACEC 关键环境问题区域 BIA 印第安人事务局 BLM 土地管理局 CFR 联邦法规 COM 规划建设、运营和维护计划 CR 保护区 DC 直流电 DoD 国防部 E 埃斯梅拉达变电站 EIS 环境影响声明 ESA 濒危物种法案 FCC 丘吉尔堡至康斯托克草地 FCM 丘吉尔堡至米拉洛马 FCN 丘吉尔堡至西北部 FEMA 联邦紧急事务管理局最终研究 最终路线和选址研究 FLPMA 联邦土地政策和管理法案 FO 实地办公室 HTNF 洪堡-托伊亚比国家森林 GIS 地理信息系统 IPaC 规划和咨询信息 kV 千伏 LRMP 土地和资源管理计划 M 百万 MP 英里标志 NAC 内华达州行政法规 NDEP 内华达州环境保护司 NDOW 内华达州野生动物管理局 NEPA 1969 年国家环境政策法案 NFMA 国家森林管理区 NH 西北至哈里艾伦NHD 国家水文数据集 NHT 国家历史步道编号 NOI 意向通知 NNIC 北内华达工业中心
摘要 - 关于基于相机和LIDAR的语义对象细分的批判性研究,用于自动驾驶的批判性研究显着受益于深度学习的发展。具体来说,视觉变压器是一种新型的突破性,将多头注意机制成功地带入了计算机视觉应用。因此,我们提出了一个基于视觉变压器的网络,以进行摄像机范围融合,以应用于自动驾驶的语义分割。我们的提案在双向网络上使用视觉变压器的新型渐进式策略,然后将结果集成到变压器解码器层上的交叉融合策略中。与文献中的其他作品不同,我们的摄像头融合变压器在诸如雨水和低照明之类的挑战性条件下进行了评估,表现出良好的性能。本文以不同的方式报告了对车辆和人类类别的分割结果:仅相机,仅LIDAR-和摄像头融合。我们对也用于语义分割的其他网络执行相机融合式传输(CLFT)的相干控制的基准实验。实验旨在从两个角度独立地评估CLFT的能力:多模态传感器融合和骨干架构。定量评估表明,与完全跨跨性神经网络网络(FCN)摄像头 - LIDAR-LIDAR融合神经网络相比,我们的CLFT网络可在具有挑战性的暗湿条件下获得高达10%的改善。我们的完整代码可在线提供交互式演示和应用程序1。与变压器主链与网络形成鲜明对比,但使用单一模态输入,全周围的改进为5-10%。
虽然神经胶质瘤已成为最常见的癌性脑肿瘤,但通过 3D MRI 进行手动诊断非常耗时,且不同的放射治疗师进行的诊断可能不一致,因此迫切需要自动分割脑肿瘤。最先进的方法采用 FCN 来自动分割 MRI 扫描。特别是 3D U-Net 已经取得了显著的表现,并激发了一系列后续研究。然而,它们巨大的规模和繁重的计算阻碍了它们的实际部署。尽管存在大量关于使用低精度表示压缩 CNN 的文献,但它们要么注重减少存储而没有计算改进,要么导致严重的性能下降。在本文中,我们提出了一种 CNN 训练算法,该算法使用非负整数以及训练过的仿射映射函数来近似权重和激活。此外,我们的方法允许以整数算术方式执行点积运算,并将浮点解码和编码阶段推迟到层的末尾。 BraTS 2018 上的实验结果表明,我们训练过的仿射映射方法在 8 位权重和激活的情况下实现了接近全精度的骰子精度。此外,在使用 4 位和 2 位精度时,我们分别实现了与全精度骰子精度相差 0.005 和 0.01 以内的骰子精度。
微分同胚图像配准能够提供平滑的变换和拓扑保存,在许多医学图像分析任务中是必需的。传统方法对可接受的变换空间施加某些建模约束,并使用优化来寻找两幅图像之间的最佳变换。指定正确的可接受的变换空间具有挑战性:如果空间过于严格,配准质量可能会很差,而如果空间过于笼统,则优化可能难以解决。最近基于学习的方法利用深度神经网络直接学习变换,实现了快速推理,但由于难以捕捉微小的局部变形和泛化能力,在准确性方面面临挑战。在这里,我们提出了一种新的基于优化的方法,称为 DNVF(带神经速度场的微分同胚图像配准),该方法利用深度神经网络来建模可接受的变换空间。具有正弦激活函数的多层感知器 (MLP) 用于表示连续速度场,并为空间中的每个点分配一个速度矢量,从而提供对复杂变形进行建模的灵活性以及优化的便利性。此外,我们提出了一种级联图像配准框架 (Cas-DNVF),结合了优化和基于学习的方法的优点,其中训练完全卷积神经网络 (FCN) 来预测初始变形,然后使用 DNVF 进行进一步细化。在两个大型 3D MR 脑部扫描数据集上进行的实验表明,我们提出的方法明显优于最先进的配准方法。