由于数据可用性呈指数级增长及其在诊断各种疾病方面的出色表现,深度学习 (DL) 在医疗保健领域越来越受欢迎。本文旨在设计一种新的可能的脑肿瘤诊断模型,以提高放射学的准确性和可靠性。在本文中,一种先进的深度学习算法用于检测和分类磁共振 (MR) 图像中的脑肿瘤。在放射学中诊断脑肿瘤是一个重要的问题,但它是放射科医生必须经历的一个困难且耗时的过程。他们评估的可靠性完全依赖于他们的知识和个人判断,而这些在大多数情况下是不准确的。作为对准确诊断脑肿瘤日益增长的担忧的一种可能的补救措施,在这项工作中,一种深度学习方法被用于对脑肿瘤 MR 图像进行分类,具有非常高的性能准确性。该研究利用一种称为 AlexNet 卷积神经网络 (CNN) 的迁移学习模型来执行此操作。我们的方法有助于提高医疗保健领域的稳健性、效率和准确性,能够实现整个诊断过程的自动化,总体准确率达到 99.62%。此外,我们的模型能够检测和分类不同阶段和程度的肿瘤。
摘要 — 癫痫是一种以反复发作、无诱因癫痫发作为特征的神经系统疾病,早期诊断对于有效的管理和治疗至关重要。然而,由于癫痫发作的微妙性质和大脑活动模式的复杂性,癫痫的诊断,特别是在早期阶段,仍然具有挑战性。在本研究中,我们引入了医学信息视觉转换器 (MIVT),这是一种深度学习架构,专门设计用于从多模态神经影像数据中改善早期癫痫诊断。我们的模型整合了医学知识和最先进的视觉转换器 (ViT) 的见解,以提高癫痫发作检测和定位的准确性和可解释性。MIVT 利用脑电图 (EEG) 丰富的空间和时间特征,使系统能够学习与早期癫痫发作前兆和生物标志物相对应的判别特征。我们在大型多模态癫痫数据集上证明了 MIVT 的有效性,其性能优于传统深度学习模型,即 Inception V3、ResNet-50、VGG-16 和 AlexNet,优势高达 17%。我们的结果表明,MIVT 模型的表现优于现有技术,诊断准确率为 93.55%,特异性为 88.89%,AUC 为 98.72%,精确率为 86.67%,召回率为 100%。它显示出弥合机器学习模型与临床实践之间差距的潜力。
摘要。在研究发现中,1p/19q基因的共同缺失与低级神经胶质瘤中的临床结局相关。预测1P19Q状态的能力对于治疗计划和患者随访至关重要。本研究旨在利用特殊的基于MRI的卷积神经网络进行脑癌检测。尽管Restnet和Alexnet等公共网络可以使用Transfer学习有效地诊断脑癌,但该模型包含了许多与医学图像无关的权重。因此,转移学习模型无法可靠诊断结果。要处理可信赖性问题,我们从头开始创建模型,而不是依赖于预训练的模型。为了启用灵活性,我们将卷积堆叠与辍学和完全连接操作相结合,可以通过减少过度拟合来证明性能。在模型训练期间,我们还补充了给定的数据集并注入高斯噪声。我们使用三倍的交叉验证来训练最佳选择模型。比较InceptionV3,VGG16和MobilenetV2对预训练的模型进行了微调,我们的模型会产生更好的结果。在验证集125个编码和31个未代码图像的验证集中,提议的网络可实现96.37%的F1分数,97.46%的精度,而96.34%的召回在分类1P/19Q Codeletion和Not Codeletion Image时。
摘要 - 深度神经网络在大多数计算机视觉问题中一直始终代表最新技术。在这些情况下,较大且更复杂的模型表现出优于较小架构的性能,尤其是在接受大量代表性数据培训时。随着视觉变压器(VIT)架构的最新采用和广告卷积神经网络(CNN),领先的主链体系结构的参数总数从2012年的6200万参数增加到ALEXNET的6200万参数,到2024年AIM-7B的2024年参数。因此,部署这样的深度体系结构在处理和运行时限制的环境中面临挑战,尤其是在嵌入式系统中。本文涵盖了用于计算机视觉任务的主要模型压缩技术,使现代模型可以用于嵌入式系统中。我们介绍了压缩亚地区的特征,比较不同的方法,并讨论如何在各种嵌入式设备上分析它时选择最佳技术和预期变化。我们还共享代码,以协助研究人员和新从业人员克服每个子区域的初始实施挑战,并为模型压缩带来现有趋势。压缩模型的案例研究可在https://github.com/venturusbr/cv-model-compression上获得。索引术语 - 安装系统,模型压缩,知识蒸馏,网络修剪,网络量化
摘要:青光眼是一种高度危险的眼部疾病,可显着影响人类视力。这是一种视网膜状况,会损害视神经头(ONH),如果在后期发现,可能会导致永久失明。预防永久性失明取决于青光眼在其初始阶段的及时识别和干预。本文介绍了卷积神经网络(CNN)模型,该模型利用特定的建筑设计来通过分析底面图像来识别早期青光眼。这项研究利用了公开访问的数据集,包括用于青光眼分析和研究的在线视网膜底面图像数据库(ORIGA),视网膜的结构化分析(凝视)和视网膜眼底青光眼挑战(避难所)。为了对青光眼进行分类,视网膜底面图像被送入Alexnet,VGG16,Resnet50和InceptionV3模型中。RESNET50和InceptionV3模型都证明了出色的性能,以创建混合模型。ORIGA数据集以97.4%的F1得分达到了高精度,而凝视数据集则获得了更高的精度,而F1分数为99.1%。避难数据集也表现出色,F1得分为99.2%。所提出的方法已经建立了可靠的青光眼诊断系统,帮助眼科医生和医生进行准确的质量筛查和诊断青光眼。
本研究探索了 YOLO v10 模型在 CT 图像中检测和分类脑肿瘤的应用。YOLO 以其实时物体检测功能而闻名,为解决医学成像挑战提供了一种有前途的方法。该研究利用 Kaggle 的脑肿瘤数据集,结合 437 张阴性图像和 488 张阳性图像进行训练,并使用其他数据集进行验证。与 AlexNet、VGG16、ResNet101V2 和 MobileNetV3-Large 等传统模型相比,YOLO v10 模型表现出了卓越的性能。它实现了 0.920 的精度、0.890 的召回率、0.900 的 F1 分数和 0.910 的准确率。这些结果凸显了它在准确识别和分类肿瘤方面的有效性,为临床应用提供了巨大的潜力。该模型的架构允许高效处理高分辨率 CT 扫描,并能很好地适应各种肿瘤大小和形状。该研究还讨论了提高不同数据集的计算效率和泛化能力所面临的挑战和未来方向。这些令人鼓舞的发现表明,YOLO v10 可以成为医学诊断的有力工具,提高肿瘤检测的准确性和速度,并有助于改善患者的治疗效果。这项研究为进一步探索和开发基于 YOLO 的医疗保健模型奠定了基础。关键词:YOLO v10、脑肿瘤检测、CT 成像、医学诊断、实时物体检测。1. 简介
随着 AI 模型越来越多地部署在关键应用中,确保模型在暴露于分布不均 (OOD) 或扰动数据等异常情况时保持一致的性能非常重要。因此,本文研究了各种深度神经网络(包括 ResNet-50、VGG16、DenseNet121、AlexNet 和 GoogleNet)在处理此类数据时的不确定性。我们的方法包括三个实验。首先,我们使用预训练模型对通过 DALL-E 生成的 OOD 图像进行分类,以评估其性能。其次,我们使用概率平均从模型的预测中构建了一个集合,以达成共识,因为它比多数或多数投票更具优势。使用平均概率、方差和熵指标量化集合的不确定性。我们的结果表明,虽然 ResNet-50 是 OOD 图像最准确的单一模型,但该模型组合的表现更佳,可以正确分类所有图像。第三,我们通过向来自 DALL-E 或真实世界捕获的新认知图像添加扰动(过滤器、旋转等)来测试模型的稳健性。选择 ResNet-50 是因为它是性能最佳的模型。虽然它可以正确分类 5 张未受干扰的图像中的 4 张,但在扰动后它对所有图像都进行了错误分类,这表明存在很大的漏洞。这些错误分类对人类观察者来说很明显,凸显了 AI 模型的局限性。使用显着性图,我们确定了模型认为对其决策很重要的图像区域。
简介:这项工作的目的是使用计算智能技术对磁共振成像(MRI)图像进行检测和分类。材料和方法:3264个MRI脑图像的数据集包含4类:未指定的神经胶质瘤,脑膜瘤,垂体和健康的大脑,在本研究中使用。Twelve convolutional neural networks (GoogleNet, MobileNetV2, Xception, DesNet-BC, ResNet 50, SqueezeNet, ShuffleNet, VGG-16, AlexNet, Enet, EfficientB0, and MobileNetV2 with meta pseudo-labels) were used to clas- sify gliomas, meningiomas, pituitary tumours, and healthy brains找到最合适的模型。典范包括图像预处理和超参数调整。根据每种类型的脑肿瘤的准确性,精度,召回和F量表来评估每个神经网络的性能。结果:实验结果表明,MobilenetV2循环神经网络(CNN)模型能够以99%的精度,98%的召回率和99%的F1得分来诊断脑肿瘤。另一方面,验证数据分析表明,CNN模型Googlenet在CNN中的精度最高(97%),并且似乎是脑肿瘤分类的最佳选择。结论:这项工作的结果强调了人工智能和机器学习对脑肿瘤预测的重要性。此外,这项研究达到了迄今为止脑肿瘤分类中最高的确定性,这也是唯一一项同时比较许多神经网络的性能的研究。
摘要:脑瘤是一种致命疾病,导致全球死亡。现有的用于检测脑瘤的神经影像学方法是侵入性的,并且存在观察者偏见。使用复杂人工智能技术的自动 CAD 框架减少了人为干预,可以有效处理大量数据。使用机器学习技术的自动 CAD 框架需要使用耗时且容易出错的手动特征提取程序。深度学习技术涉及自动特征提取;因此,可以快速获得可观的分类结果。然而,从头开始训练 DL 模型需要投入大量的时间、金钱和大量数据集,这在医学领域很难实现。因此,权衡是利用 VGG16、VGG19、AlexNet 等经过充分学习的模型来设计一种用于脑瘤分类的新框架。本文旨在通过迁移学习对预训练的 VGG16 架构进行微调,以开发基于 CNN 的深度学习框架,用于脑瘤检测。采用迁移学习技术的设计框架可以在更短的时间内以更少的数据获得更好的结果。使用迁移学习对脑 MRI 图像进行脑肿瘤二元分类,准确率达到 97%。训练和验证准确率分别为 100% 和 97%,共 30 个时期。分类损失低至 0.0059%,运行时间为 32ms/步,远低于现有模型。关键词:- 卷积神经网络、深度学习、计算机辅助诊断、分类、超参数调整、磁共振成像。
摘要:脑肿瘤是细胞发育不正常的结果。它是全球成年人死亡的主要原因。早期发现脑肿瘤可以避免许多死亡。用于早期脑肿瘤诊断的磁共振成像(MRI)可以提高患者的生存机会。诊断脑肿瘤的最常用方法是 MRI。MRI 中恶性肿瘤的可见性提高使治疗更容易。脑癌的诊断和治疗取决于其识别和治疗。过去十年中提出了许多深度学习模型,包括 Alexnet、VGG、Inception、ResNet、DenseNet 等。所有这些模型都是在庞大的数据集 ImageNet 上训练的。这些通用模型具有许多参数,在针对特定问题实施这些模型时,这些参数变得无关紧要。本研究使用自定义深度学习模型对脑部 MRI 进行分类。提出的疾病和空间注意力模型(DaSAM)有两个模块; (a) 疾病注意模块 (DAM),用于区分图像的疾病区域和非疾病区域;(b) 空间注意模块 (SAM),用于提取重要特征。所提出的模型的实验在两个公开的多类数据集 Figshare 和 Kaggle 数据集上进行,分别达到了 99% 和 96% 的准确率。所提出的模型还使用跨数据集验证进行了测试,在 Figshare 数据集上训练并在 Kaggle 数据集上验证时达到了 85% 的准确率。DAM 和 SAM 模块的结合实现了特征映射功能,这对于在模型的决策过程中突出显示重要特征非常有用。