摘要。对象检测算法,特别是基于 YOLO 的算法,在平衡速度和准确性方面表现出了显著的效率。然而,它们在脑肿瘤检测中的应用仍未得到充分探索。本研究提出了 RepVGG-GELAN,这是一种新颖的 YOLO 架构,通过 RepVGG 进行了增强,RepVGG 是一种重新参数化的卷积方法,用于对象检测任务,特别侧重于医学图像中的脑肿瘤检测。RepVGG-GELAN 利用 RepVGG 架构来提高检测脑肿瘤的速度和准确性。将 RepVGG 集成到 YOLO 框架中旨在实现计算效率和检测性能之间的平衡。本研究包括基于空间金字塔池化的广义高效层聚合网络 (GELAN) 架构,进一步增强了 RepVGG 的能力。在脑肿瘤数据集上进行的实验评估表明,RepVGG-GELAN 在精度和速度方面超越了现有的 RCS-YOLO。具体而言,RepVGG-GELAN 在 240.7 GFLOPs 的运行速度下,与现有的最新方法相比,其精度提高了 4.91%,AP50 提高了 2.54%。提出的具有 GELAN 架构的 RepVGG-GELAN 取得了令人鼓舞的结果,成为医学图像中准确、高效地检测脑肿瘤的最先进的解决方案。实现代码已公开发布在 https://github.com/ThensiB/RepVGG-GELAN。
通过磁共振成像 (MRI) 数据自动识别阿尔茨海默病 (AD) 可以有效协助医生诊断和治疗阿尔茨海默病。当前的方法提高了 AD 识别的准确性,但它们不足以解决类间差异小、类内差异大的挑战。一些研究尝试在神经网络中嵌入块级结构以增强病理细节,但巨大的规模和时间复杂度使这些方法不利。此外,几种自注意机制无法提供上下文信息来表示判别区域,这限制了这些分类器的性能。另外,当前的损失函数受到类别不平衡异常值的不利影响,可能陷入局部最优值。因此,我们提出了一个 3D 残差 RepVGG 注意网络 (ResRepANet),该网络堆叠了几个轻量级块来识别脑部疾病的 MRI,这也可以权衡准确性和灵活性。具体来说,我们提出了一个非局部上下文空间注意块 (NCSA),并将其嵌入到我们提出的 ResRepANet 中,该 ResRepANet 聚合了空间特征中的全局上下文信息,以提高判别区域中的语义相关性。此外,为了减少异常值的影响,我们提出了一种梯度密度多重加权机制 (GDMM),通过标准化梯度范数自动调整每个 MRI 图像的权重。实验是在阿尔茨海默病神经影像学倡议 (ADNI) 和澳大利亚老龄化成像、生物标志物和生活方式旗舰研究 (AIBL) 的数据集上进行的。在这两个数据集上进行的实验表明,准确度、灵敏度、特异性和曲线下面积始终优于最先进的方法。