磁共振成像 (MRI) 在识别潜在组织病理方面存在局限性,这与多发性硬化症、中风或脑肿瘤等神经系统疾病有关。然而,目前还没有将 MRI 特征与组织病理学相关联的标准化方法。因此,我们旨在开发和验证一种可以促进脑 MRI 特征与相应组织病理学相关联的工具。为此,我们设计了 Brainbox,这是一种防水且与 MRI 兼容的 3D 打印容器,带有集成的 3D 坐标系。我们使用 Brainbox 对八个人类大脑(新鲜和马林固定)进行死后离体 MRI,并使用内置的 3D 坐标系将局部成像特征与组织病理学相关联。凭借其内置的 3D 坐标系,Brainbox 可以将 MRI 特征与相应的组织基质相关联。 Brainbox 用于将不同的 MR 图像特征与相应的组织基质关联起来,包括正常的解剖结构,例如海马或血管周围空间,以及腔隙性中风。固定后脑体积减少了 7%(P = 0.01)。Brainbox 能够在扫描前对标本进行脱气,减少磁化伪影并最大限度地减少扫描过程中的体积运动。总之,我们的原理验证实验证明了 Brainbox 的可用性,它有助于提高 MRI 的特异性以及标准化死后离体人脑 MRI 与组织病理学之间的相关性。我们的机构可应要求提供 Brainbox。
摘要 - 感谢任务驱动的图像质量增强(IQE)模型等最新成就,例如ESTR [1],图像增强模型和视觉识别模型可以相互增强彼此的定量,同时产生我们人类视觉系统可感知的高质量处理的图像。但是,现有的任务驱动的IQE模型倾向于忽略一个基本的事实 - 不同级别的视力任务具有不同的图像特征要求,有时甚至相互矛盾。为了解决这个问题,本文提出了针对医疗图像的任务驱动IQE的广义梯度促进(GradProm)培训策略。具体来说,我们将任务驱动的IQE系统分为两个子模型i。e。,一种用于图像增强的主流模型,也是视觉识别的辅助模型。在训练期间,GradProm仅使用视觉识别模型和图像增强模型的梯度更新图像增强模型的参数,但是只有当这两个子模型的梯度以相同的方向对齐时,这是通过其余弦相似性来衡量的。如果这两个子模型的梯度不在同一方向上,则GradProm仅使用图像增强模型的梯度来更新其参数。从理论上讲,我们已经证明了图像增强模型的优化方向不会被GradProm的实现下的辅助视觉识别模型偏差。从经验上讲,对四个公开但具有挑战性的医学图像数据集的广泛实验结果证明了Gradprom的表现优于现有最新方法。
摘要 目的在产科超声 (US) 扫描中,学习者根据二维 (2D) US 图像在脑海中构建胎儿的三维 (3D) 地图的能力代表了技能习得中的重大挑战。我们的目标是构建一个 US 平面定位系统,用于 3D 可视化、训练和引导,而无需集成额外的传感器。方法我们提出了一个回归卷积神经网络 (CNN),使用图像特征来估计任意方向的 US 平面相对于胎儿大脑中心的六维姿势。该网络在从幻影 3D US 体积获取的合成图像上进行训练,并在真实扫描上进行微调。训练数据是通过将 US 体积在 Unity 中以随机坐标切成成像平面并在标准经脑室 (TV) 平面周围更密集地切片来生成的。结果使用幻影数据,随机平面和靠近 TV 平面的平面的中位误差分别为 0.90 mm/1.17 ◦ 和 0.44 mm/1.21 ◦。对于真实数据,使用具有相同胎龄 (GA) 的不同胎儿,这些误差为 11.84 mm/25.17 ◦。平均推理时间为每平面 2.97 毫秒。结论所提出的网络可靠地定位了幻影数据中胎儿大脑内的超声平面,并成功地从与训练中类似的 GA 中推广了看不见的胎儿大脑的姿势回归。未来的发展将扩大预测范围,以预测整个胎儿的体积,并评估其在获取标准胎儿平面时基于视觉的徒手超声辅助导航的潜力。
摘要。运动图像分类是一项具有挑战性的任务,涉及多种类型的运动,在功能识别和次优检测结果方面遇到困难。这项研究采用了四个验证的模型,即残留网络50(Resnet-50),EfficityNet B7,密集连接的卷积网络121(Densenet-121),您只能查看一次版本8(Yolov8),以解决对100个不同运动图像类别进行分类的问题。数据集包含12200张体育图像,这是这项研究的强大实验基础。通过比较他们的表现,可以发现Resnet-50在训练集中表现出出色的性能,在验证集中的准确度为90.80%,88.75%的精度为88.75%。有效网络B7模型的训练精度为37.45%,推理的精度为62.42%。令人印象深刻的性能可能是由于其在处理特定的运动图像分类任务时的表示功能有限。densenet-121在培训中获得了71.791%的准确性,验证集获得了86.211%。与EfficityNet B7相比,其性能更好,这表明密集的连通性雅更适合提取图像特征。此外,Yolov8n模型在训练集的平均准确度中提供了出色的性能,验证集的平均精度为96.60%。这些结果展示了在运动图像分类和检测中yolov8n的圆润性能。总而言之,这项研究通过比较运动图像分类中不同算法的性能来解决解决复杂图像分类问题的宝贵见解。了解这些各种算法的优势和缺点对于更深入地理解图像分类任务和指导未来的研究努力至关重要。
摘要:水下图像遭受颜色失真和细节的损失,这严重影响了水下机器人的视觉感知能力。为了提高检测准确性,提出了一个多任务学习框架,以基于对比度学习的水下图像增强和对象检测提出了多任务学习框架,这不仅会产生视觉上友好的图像,还可以提高对象检测精度,从而实现对象检测任务的图像增强图像。为了解决不清楚目标纹理特征的问题,用于检测任务的区域生成模块用于构建用于对比性学习的正面和负面图像块,以确保目标区域更接近特征空间中的原始图像。此外,检测到的梯度信息用于指导图像增强方向,有益于目标检测。此外,提出了一种基于循环生成对抗网络的图像翻译方法来学习和保留图像增强的清晰图像特征,从而消除了对配对的水下图像的需求并减少了数据要求。最后,在EUVP,U45和UIEB数据集上对增强算法进行了验证,并且在RUOD,URPC2020和RUIE数据集上验证了检测算法。实验结果表明,所提出的算法可以在主观视觉中有效纠正颜色失真,同时保留原始图像和目标的结构纹理。就客观指标而言,峰值信噪比达到24.57 dB,结构相似性达到0.88。在更快的R-CNN(基于区域的卷积神经网络)和Yolov7(您只看一次,版本7)算法后,检测精度平均提高了2%。关键字:水下图像增强;对比学习;循环生成对抗网络;对象检测
我们饶有兴趣地阅读了 Hassan 等人 [1] 撰写的社论,题为“人工智能在内窥镜检查中的无处不在,不只用于检测和表征”,该社论受到 Hansen 等人最近的论文“新型人工智能 (AI) 驱动的软件显著缩短了计算机视觉项目中注释所需的时间” [2] 的启发。正如 Hassan 等人指出的那样,与经典的机器学习方法 (MLM) 不同,这个新兴领域(即深度学习 [DL])的主要优势在于它能够自动提取图像特征,以便计算机可以使用它们来表征其内容 [3]。从本质上讲,这意味着这种无监督方法的准确性主要取决于所提供的训练数据的适当性和质量。特别是在胶囊内窥镜 (CE) 领域,图像数据随处可见,但谁来仔细研究图像、描绘/注释和评论感兴趣的区域,并确保使用高质量的材料进行 DL 训练,这还有待确定。考虑到这一点,我们投入了大量的人力(包括个人)[1],着手创建一系列相应的 CE 数据库,即 KID、CAD-CAP 和 Kvasir Capsule [4 – 6],以造福计算机科学家,而这却花费了我们自己和同事的努力。尽管它们通过来自不同制造商的 CE 图像得到丰富和扩大,但不同的数据库包含以各种方式准备的多种类别的胃肠道正常和异常发现。因此,数据库的清洁程度各不相同,它们为 AI 软件开发人员提供了独特的机会和各自的参考点。这种方法为结构化交付一系列急需的解决方案奠定了基础,这些解决方案可以准确检测和表征异常 CE 发现。这些包括可靠地生成解剖学缩略图
阿尔茨海默病 (AD) 是一种不可逆的中枢神经退行性疾病,而轻度认知障碍 (MCI) 是 AD 的前兆。准确的早期诊断 AD 有利于 AD 的预防和早期干预治疗。尽管已经开发了一些用于 AD 诊断的计算方法,但大多数方法仅采用神经影像学,忽略了可能包含潜在疾病信息的其他数据(例如遗传、临床)。此外,一些方法的结果缺乏可解释性。在这项工作中,我们提出了一种新方法(称为 DANMLP),通过整合结构磁共振成像 (sMRI) 的多模态数据、临床数据(即人口统计学、神经心理学)和 APOE 遗传数据,将双注意卷积神经网络 (CNN) 和多层感知器 (MLP) 结合在一起进行计算机辅助 AD 诊断。我们的 DANMLP 由四个主要组件组成:(1)Patch-CNN,用于从每个局部块中提取图像特征,(2)位置自注意块,用于捕获块内特征之间的依赖关系,(3)通道自注意块,用于捕获块间特征的依赖关系,(4)两个 MLP 网络,分别用于提取临床特征和输出 AD 分类结果。与 5CV 测试中的其他最先进方法相比,DANMLP 在 ADNI 数据库上的 AD vs. MCI 和 MCI vs. NC 任务中实现了 93% 和 82.4% 的分类准确率,分别比其他五种方法高 0.2% ∼ 15.2% 和 3.4% ∼ 26.8%。局部区域的个性化可视化还可以帮助临床医生进行 AD 的早期诊断。这些结果表明,DANMLP 可有效用于诊断 AD 和 MCI 患者。
放射成像技术,包括磁共振成像 (MRI) 和正电子发射断层扫描 (PET),是广泛应用于神经肿瘤学的标准非侵入性诊断方法。不幸的是,由于与肿瘤进展和/或各种治疗干预相关的不同病理变化具有难以区分的放射图像特征,放射成像数据的准确解释不断受到挑战。近年来,基于机器学习 (ML) 的人工智能 (AI) 技术因其在隐式图像特征提取和综合数据分析方面的优势,已广泛应用于医学图像处理和生物信息学。尽管 ML 技术最近发展迅速,但它在神经肿瘤放射组学分析中的更广泛应用仍面临许多障碍,例如缺乏各种可访问的大型标准化真实患者放射组学脑肿瘤数据以及对各种治疗对肿瘤反应的可靠预测。因此,了解基于 ML 的 AI 技术对于帮助我们满足神经肿瘤临床部署的激增需求至关重要。本文概述了脑肿瘤放射组学分析的 ML 技术的最新进展,重点介绍了专有和公共数据集准备以及用于脑肿瘤诊断、分类(例如原发性和继发性肿瘤)、治疗效果(假进展、放射性坏死)和真实进展之间的区分、生存预测、炎症以及脑肿瘤生物标志物的识别的最新 ML 模型。我们还将神经放射学领域的 ML 模型与其他医学成像领域使用的 ML 模型的主要特征进行了比较,并讨论了这一新兴精准医学领域面临的开放研究挑战和未来工作方向。
摘要——阿尔茨海默病是一种致命的进行性神经系统脑部疾病。及早发现阿尔茨海默病有助于正确治疗并防止脑组织损伤。在这项工作中,我们提出了两种方法。首先,提出使用 PSO 从 MRI 图像中提取特征的连接中值滤波器,并使用基于 3D-CNN 的 SE-Net 分析阿尔茨海默病状态。在第一阶段,该算法首先对 MRI 图像进行规范化并去除头骨。使用粒子群优化算法的连接中值滤波器将图像划分为白质 (WM)、灰质 (GM) 和黑洞 (BH)。从分割的图像成分中提取相关的诊断特征。分类器由训练数据训练以预测测试数据。定义特征以使用带有挤压激励块的支持向量机构建分类模型。在这里,数据库总共包含 1000 张图像,这些图像被调整为 350 × 350 而不会丢失信息。深度学习需要大量的图像,并且其强度根据增强技术的要求得到了提高。在该方法的第一阶段,选取 1000 张具有不同特征的图像来训练 SVM 分类器,获得的准确率为 98.37%,这项工作的贡献是将图像分类为阿尔茨海默病 (AD) 和正常等类别。第一阶段的工作强调使用特定程序来提取特征。在第二阶段,CNN 有多个层,从较低级别到较高级别研究图像特征。关键词 - 3D-CNN、压缩和激励网络、优化
课程目标1。为计算机视觉引入图像处理技术的各种组成部分。2。了解过滤器和计算图像梯度。3。了解细分,模型拟合和跟踪4。传授有关对象注册和对象匹配的知识5。实施可用于对象识别的各种技术。单元I图像形成:几何摄像头模型,内在和外部参数,几何相机校准 - 线性和非线性接近,线性接近,光和阴影 - 推理,对建模间反射,人类颜色感知。单元-II早期视觉:线性过滤器 - 卷积,傅立叶变换,采样和混叠,作为模板的过滤器,相关性,本地图像特征 - 计算图像梯度,基于梯度的边缘检测器,方向,方向,纹理 - 本地纹理形式使用滤镜,形状。UNIT-III MID-LEVEL VISION: Segmentation by Clustering - Basic Clustering Methods, The Watershed Algorithm, Segmentation Using K-means, Grouping and Model Fitting - Fitting Lines with the Hough Transform, Fitting Curved Structures, Tracking - Tracking by Detection, Tracking Translations by Matching, Tracking Linear Dynamical Models with Kalman Filters.单元IV高级视觉:注册,注册刚性和可变形的物体,光滑的表面及其轮廓 - 轮廓几何,Koenderink定理,bitangent射线歧管,使用解释树和旋转图像,分类,错误,错误和损失的对象匹配。教科书:单位V对象检测和识别:图像中检测对象 - 滑动窗口方法,面部检测,检测人,边界和可变形对象,对象识别 - 分类,选择,应用程序,应用程序 - 跟踪人员,活动识别。