编码器-解码器网络在分层特征融合方面表现优异,常用于医学图像分割。然而,特征解码和空间恢复的扩展路径在融合不同层的特征图时没有考虑长期依赖性,并且通用编码器-解码器网络没有充分利用多模态信息来提高网络鲁棒性,尤其是对于医学MRI的分割。在本文中,我们提出了一种称为循环解码单元(RDC)的新型特征融合单元,它利用卷积RNN在解码阶段记忆来自前几层的长期上下文信息。我们还基于RDC提出了一种用于分割多模态医学MRI的编码器-解码器网络,称为卷积循环解码网络(CRDN)。CRDN采用CNN主干对图像特征进行编码,并通过一系列RDC对其进行分层解码以获得最终的高分辨率分数图。在 BrainWeb、MRBrainS 和 HVSMR 数据集上的评估实验表明,RDC 的引入有效地提高了分割精度并减小了模型尺寸,并且提出的 CRDN 对医学 MRI 中的图像噪声和强度非均匀性具有很强的鲁棒性。
近年来,随着当前分类系统在数字内容识别中的快速发展,图像的自动分类已成为计算机视觉领域中最具挑战性的任务。可以看出,与人类的愿景相比,系统对于系统自动理解和分析图像的视力非常具有挑战性。已经完成了一些研究论文来解决低级当前分类系统中的问题,但输出仅限于基本图像特征。类似地,这些方法无法准确对图像进行分类。对于此领域的预期结果,例如计算机视觉,本研究提出了一种使用深度学习算法的深度学习方法。在这项研究中,一个基于卷积神经网络(CNN)的建议模型,该模型是一种机器学习工具,可用于图像的自动分类。该模型与图像的分类有关,为此,它采用Corel Image Dataset(Corel Gallery Image DataSet)作为参考。用于培训的数据集中的图像要比图像的分类更难,因为它们需要更多的计算资源。在实验部件中,使用CNN网络训练图像的精度为98.52%,证明该模型在图像的分类中具有很高的精度。
摘要:识别和分类胶质瘤脑肿瘤是医学领域的一项艰巨任务,为了延长患者的寿命,尽早识别恶性肿瘤至关重要。已经进行了医学图像分析研究以帮助检测恶性脑肿瘤。为了实现高分类性能,提取的特征必须既具有描述性又具有判别性。机器学习在分类中至关重要,因为它具有灵活性和对不同问题的适应性。我们提出了一种聚类图像和特征支持分类器 (CIFC) 以及一个深度卷积神经网络框架来对脑肿瘤图像进行分类。所提出的模型由各种分类器组成,例如:(i) 原始和分段图像特征支持的分类器;(ii) 原始和分段图像支持的分类器和 (iii) 聚类图像和特征支持的分类器。免费和开放访问的图像数据集 BRATS 2021 用于训练和测试所提出的肿瘤检测系统框架。 CFIC 的表现优于迄今为止提出的几乎所有分类器。所提出的系统的性能指标结果为灵敏度 99.76%、特异性 98.04% 和准确度 99.87%。因此,与其他现有技术相比,所提出的系统结果在肿瘤检测方面表现良好。
通常用于肝肿瘤诊断。然而,由于需要对病变进行实时识别,因此需要丰富的超声经验才能做出准确诊断 [ 3 ]。从这个角度来看,超声缺乏专家是医疗领域需要解决的一个紧迫问题,因为非专家的漏诊和误诊将产生严重后果。人工智能 (AI) 正在成为医学和医疗保健领域的主要工具,特别是在图像诊断方面 [ 4 , 5 ]。它很容易应用于成像数据,因为 AI 擅长识别独特和复杂的图像特征并有助于定量评估 [ 6 ]。AI 的这一独特特性非常适合受限的临床环境,在这种环境中,医疗专业人员需要使用视觉感知来评估大量图像,并且存在一些不确定性和不可避免的人为错误。因此,AI 已应用于医学成像的许多方面,例如计算机断层扫描 (CT)、磁共振成像 (MRI)、结肠镜检查、乳房 X 线摄影和病理评估 [5-10]。已经发表了几篇关于机器学习评估肝脏肿瘤诊断的报告。最近,深度神经网络已在影像诊断领域投入使用。在此背景下,AI 支持的超声将成为筛查肝脏病变的理想设备,特别是用于肝癌的早期诊断 [11]。然而,在
课程:CSCI3330课程ID:014446 AFF日期:2024-07-01 CRSE状态:主动批准。状态:批准的[课程Rev]应用计算机视觉的基础知识应用计算机视觉基础本课程提供了全面的介绍和应用计算机视觉的基础。计算机视觉是可以从3D场景中感知和提取信息的建筑机器的企业。这是当今学术界和行业中增长最快,最令人兴奋的学科之一,在机器人技术,视频监视,导航,消费电子,人类计算机互动,医学成像,遥感,太空探索等方面有各种各样的应用。本课程旨在为有兴趣了解计算机视觉的基本原理和重要应用的学生打开大门。将涵盖以下主题:相机和图像形成,图像过滤,边缘和角落检测,图像特征和匹配,图像对齐,几何相机模型,双筒望远镜立体声,光学流,放射线,光度法,光度法立体声,结构性光,结构化的光以及其他在机器视觉中的应用。我们将使学生接触到许多对我们日常生活重要的现实应用程序。学生将学习计算机视觉的核心概念以及动手实践的经验,以解决计算机视觉的现实世界问题。
由于人类情绪的复杂性,不同的情绪特征之间存在一定的相似性,现有的情绪识别方法存在特征提取困难、准确率不高的问题,为此提出一种基于双向长短期记忆和注意机制的表情脑电多模态情绪识别方法。首先基于双线性卷积网络(BCN)提取面部表情特征,将脑电信号变换为三组频带图像序列,利用BCN对图像特征进行融合,得到表情脑电多模态情绪特征。然后通过带有注意机制的长短期记忆在时序建模过程中提取重要数据,有效避免采样方法的随机性或盲目性。最后,设计一种具有三层双向长短期记忆结构的特征融合网络,将表情与脑电特征进行融合,有助于提高情绪识别的准确率。在MAHNOB-HCI和DEAP数据集上,基于MATLAB仿真平台对所提方法进行测试。实验结果表明,注意机制可以增强图像的视觉效果;且与其他方法相比,所提方法可以更有效地从表情和脑电信号中提取情感特征,情绪识别的准确率更高。
摘要 - 对称检测是一种从脑磁共振(MR)图像中提取理想的中型平面(MSP)的方法,可以显着提高脑部疾病的诊断准确性。在本文中,我们提出了一种基于2通道卷积神经网络(CNN)的2D切片中脑MR图像的自动符号检测方法。不同于主要依赖本地图像特征(渐变,边缘等)的现有检测方法为了确定MSP,我们使用基于CNN的模型来实现大脑对称性检测,该检测不需要任何局部特征检测和功能匹配。通过训练以学习大脑图像中的各种基准测试,我们可以进一步使用2通道CNN来评估脑斑块对之间的相似性,这些相似性是根据泊松采样从整个大脑切片中随机提取的。最后,使用评分和排名方案来识别每个输入脑MR SLICE的最佳对称轴。在2166个人工合成脑图像和3064中收集的体内MR图像中评估了我们的方法,其中包括健康和病理病例。实验结果表明,我们的方法在对称性检测中实现了出色的性能。与最先进方法的比较还证明了与以前的竞争对手相比,我们在获得更高准确性方面的有效性和优势。
Tadesse Hailu Ayane A,Satyasis Mishra B,Davinder Singh Rathee C,Harish Kalla d a Dept.,ECE,SEEEC,SIGNAL和IMAGE PROCESTING SIG,ADAMA科学技术大学,Adama,埃塞俄比亚文章历史:收到:2021年1月10日;修订:2021年2月12日;接受:2021年3月27日;在线发布:2021年6月4日摘要:这项研究工作提出了一种新颖的快速且坚固的模糊C表示基础(FRFCM)分割技术,用于从MR(磁共振)图像中检测脑肿瘤,该技术可以告知放射线医生和医生脑肿瘤的细节。 这种分割技术已用于消除里奇亚的噪声和形态重建的图像。 MR(磁共振)图像特征已通过流行的灰度共发生矩阵(GLCM)和离散小波变换特征提取技术提取。 提取的特征应用于基于拟议的PSO(粒子群优化)的极限学习机(ELM),以分类恶性和良性脑肿瘤的类型,以进行视觉定位。 此外,将将分类结果与现有支持向量机和相关向量机模型进行比较。 在这项研究工作中,PSO算法已更新了拟议的新型多类极限学习机分类器模型的权重,以提高分类器的性能。 为了展示研究的独特性,此外,研究工作提出了通过嵌入式系统平台实施检测和分类的,这可能是研究工作的产品结果。 关键字:,ECE,SEEEC,SIGNAL和IMAGE PROCESTING SIG,ADAMA科学技术大学,Adama,埃塞俄比亚文章历史:收到:2021年1月10日;修订:2021年2月12日;接受:2021年3月27日;在线发布:2021年6月4日摘要:这项研究工作提出了一种新颖的快速且坚固的模糊C表示基础(FRFCM)分割技术,用于从MR(磁共振)图像中检测脑肿瘤,该技术可以告知放射线医生和医生脑肿瘤的细节。这种分割技术已用于消除里奇亚的噪声和形态重建的图像。MR(磁共振)图像特征已通过流行的灰度共发生矩阵(GLCM)和离散小波变换特征提取技术提取。提取的特征应用于基于拟议的PSO(粒子群优化)的极限学习机(ELM),以分类恶性和良性脑肿瘤的类型,以进行视觉定位。此外,将将分类结果与现有支持向量机和相关向量机模型进行比较。在这项研究工作中,PSO算法已更新了拟议的新型多类极限学习机分类器模型的权重,以提高分类器的性能。为了展示研究的独特性,此外,研究工作提出了通过嵌入式系统平台实施检测和分类的,这可能是研究工作的产品结果。关键字:这将帮助医务人员,特别是让放射线医生和医生了解肿瘤的严重性。此外,嵌入式系统平台已用于通过GUI(图形用户界面)显示分类,分割和功能。
摘要 目的:本研究旨在利用X射线和深度学习算法构建正常人和尘肺病的计算机辅助诊断系统。材料与方法:实验收集了2017年1月至2020年6月期间1760张真实患者的匿名数字X射线图像。为了使模型的特征提取能力更加集中在肺部区域,抑制外界背景因素的影响,建立了由粗到细的两阶段流水线。首先,使用U-Net模型提取采集图像两侧的肺部区域;然后,采用结合迁移学习策略的ResNet-34模型对提取出的肺部区域的图像特征进行学习,实现尘肺病患者和正常人的准确分类。结果:在收集的1760例病例中,分类模型的准确率为92.46%,曲线下面积为89%。结论:深度学习在尘肺病诊断中的成功应用进一步证明了医疗人工智能的潜力,并证明了我们提出的算法的有效性。然而,当我们进一步将尘肺病患者和正常人分为四类时,我们发现整体准确率下降到70.1%。我们将在未来的研究中使用CT模态来提供更多肺部区域的细节。关键词:尘肺病诊断,X射线,深度学习,U-Net,ResNet
单眼3D检测(M3D)的目的是从单视图像中进行精确的3D观察定位,该图像通常涉及3D检测框的劳动密集型注释。最近已经研究了弱监督的M3D通过利用许多存在的2D注释来遵循3D注释过程,但通常需要额外的培训数据,例如LiDAR Point Clouds或多视图图像,这些数据会大大降低其在各种应用中的适用性和可用性。我们提出了SKD-WM3D,这是一个弱监督的单眼3D检测框架,利用深度插入以实现M3D,并具有单一视图图像,而无需任何3D注释或其他培训数据。SKD-WM3D中的一个关键设计是一个自我知识的蒸馏框架,它通过融合深度信息并有效地减轻单核场景中固有的深度模棱两可,从而将图像特征转换为3D类似的表示形式,而无需计算上的计算层面。此外,我们设计了不确定性感知的分离损失和梯度定位的转移调制策略,分别促进了知识获取和知识转移。广泛的实验表明,SKD-WM3D明显超过了最新的实验,甚至与许多完全监督的方法相当。