皮肤癌检测是临床决策支持的一个常见应用 [7]。由于皮肤癌患者数量的增加和早期检测的良好治疗效果,过去几年来,人们在该领域进行了大量研究。在此背景下,DNN 已成为开发皮肤图像分类模型的可行方法 [2、8、12、30]。社区的高度关注导致出现了各种不同方法,其性能水平也参差不齐。1 所有方法的共同点都是训练一个可用于诊断并从而用于临床决策支持的模型。因此,新方法的评估标准通常是它们是否能够使模型在各种皮肤病诊断任务中取得更好的性能结果 [21]。同时,其他 AI 研究领域也越来越多地考虑对模型预测的解释。相比之下,这些技术在皮肤图像分类中的应用几乎没有得到解决,尽管最近的一些研究已经认识到
摘要 —卷积神经网络(CNN)在高光谱图像表示方面表现出色,并在高光谱图像分类中取得了良好的效果。然而,传统的 CNN 模型只能对具有固定大小和权重的规则方形图像区域进行卷积,因此,它们不能普遍适应具有各种对象分布和几何外观的不同局部区域。因此,它们的分类性能还有待提高,特别是在类边界方面。为了弥补这一缺点,我们考虑采用最近提出的图卷积网络(GCN)进行高光谱图像分类,因为它可以对任意结构的非欧几里得数据进行卷积,适用于由图拓扑信息表示的不规则图像区域。与常用的在固定图上工作的 GCN 模型不同,我们使图能够动态更新
机器学习 (ML) 算法已应用于医学成像,其在医学领域的使用日益增多。尤其是深度学习 (DL),已证明在图像评估和处理方面更为有效。深度学习算法可能有助于并简化其在泌尿科成像中的使用。本文介绍了如何创建用于泌尿科图像分析的卷积神经网络 (CNN) 算法。深度学习是 ML 的一个分支,包括多层神经网络。卷积神经网络已广泛应用于图像分类和数据处理。1 它首先由 Krizhevsky 等人应用于图像分类。2 他们在 2012 年 ImageNet 大规模视觉识别挑战赛 (ILSVRC) 中凭借名为 AlexNet 的深度 CNN 赢得了比赛,该比赛由 120 万张日常彩色图像组成。3 在另一个 CNN 模型中,Lakhani 等人 4 证明他们
随着人们的物质生活水平继续提高,房屋的类型和数量 - 持有垃圾的类型和数量迅速增加。因此,迫切需要开发一种合理有效的垃圾分类方法。这对于资源回收和环境改进非常重要,并有助于生产和经济的可持续发展。但是,由于大量模型参数,现有的基于深度学习的垃圾图像分类模型通常会遭受低分类精度,鲁棒性不足和慢速检测速度的影响。为此,提出了一个新的垃圾图像分类模型,并以Resnet-50网络为核心架构。特别是,首先提出了一个冗余特征融合模块,使该模型能够充分利用有价值的功能信息,从而提高其性能。同时,该模块从多尺度功能中滤除了冗余信息,从而减少了模型参数的数量。第二,Resnet-50中的标准3×3卷积被替换为深度分离的卷积,从而显着提高了模式的计算效率,同时保留了原始卷积结构的特征提取能力。最后,为了解决阶级不平衡问题,加权因素被添加到焦点损失中,旨在减轻类不平衡对模型性能的负面影响并增强模型的鲁棒性。trashnet数据集的实验结果表明,所提出的模型有效地减少了大小的数量,提高检测速度并达到94.13%的准确性,超过了现有的基于深度学习的废物图像分类模型的绝大多数,表明其固定实用值。
摘要使用MATLAB的脑肿瘤分类非常需要改善MATLAB中的图像处理技术。尽管对该领域非常关注,但是对图像处理的极大兴趣的领域是图像过滤,图像分割和检测图像中的特征。matlab可以使用图像的平滑,有效的图像分割,从图像中提取不同特征以及图像的分类来改进它。用于图像分割的两种知名方法是K-均值簇和形态学分类的操作。两个最常用和有效的过滤器用于此过程,即中值和植物滤波器。要诊断疾病,尤其是身体任何部位的肿瘤,都必须使用最有效的图像分割方法。对图像分割的研究在图像分段中彻底改变了这一过程。检测脑肿瘤,每个人都采用的技术是磁共振图像。从图像中提取脑肿瘤特征时,研究重点是肿瘤位置,肿瘤的质地,肿瘤的颜色,肿瘤的边缘和脑肿瘤的特定区域。根据上述标准提取图像特征,并找到患者是否患有肿瘤,将图像分类。关键字:MATLAB,医学图像处理,脑肿瘤,特征提取,分类,K-均值群集,形态学分类。MRI方法和图像处理技术可以改善这一点。收到:18.02.2022修订:28.03.2022接受:24.04.2022在本文中引入,主要重点是现代图像处理技术,这些技术将有助于检测人体某些部位的大脑和癌症。作为脑肿瘤和癌症是致命的疾病,至少需要有最有效的优化技术来帮助科学家发现癌症状况的致命程度。图像分类也是重要的一步。在这里,将注意力集中在图像上,分类为不同的类。本研究中使用的最常见的图像分类技术是Boltzmann,随机森林,K群集和支持向量机。在本文中,重点是结合各种图像分割方法,许多图像分类方法将提供最优化的结果。此处使用的分割技术是灰色的标准,它是深度学习和深度神经网络的基本方法之一。使用前面提到的技术和方法,对于图像分割和图像过滤和分类而获得的结果将更加有效。他们将帮助我们以更少的时间来诊断疾病。图1显示了检测脑肿瘤的步骤。
•视觉:图像分类,单视3D建模和自主驾驶(SLAM)•语言:语言生成和零拍的大型语言建模•科学的AI:用于物理模拟的数据驱动方法(替代模型,操作员学习,操作员学习),时间序列学习(时间序列学习)
摘要:在现实捕捉技术和人工智能(AI)的进步驱动的驱动到施工站点上,图像分类越来越多地用于自动化项目监视。部署实时应用程序仍然是一个挑战,尤其是在远程施工站点上,由于建筑物内的高信号衰减,电信支持或访问有限。为了解决此问题,本研究提出了一个有效的启用边缘计算的图像分类框架,以支持实时构造AI应用程序。使用Mobilenet转移学习开发了轻量级的二进制图像分类器,然后进行量化过程,以降低模型大小,同时保持准确性。组装了一个完整的Edge计算硬件模块,包括Raspberry Pi,Edge TPU和电池等组件,并将多模式软件模块(包含视觉,文本和音频数据)集成到边缘计算环境中以启用智能图像分类系统。部署了两项涉及材料分类和安全检测的实际案例研究,以证明拟议框架的有效性。结果证明了开发的原型成功同步多模式机制,并在分化材料中达到了零延迟,并识别危险的指甲而没有任何Internet连接。建筑经理可以利用开发的原型来促进集中的管理工作,而不会损害准确性或计算资源的额外投资。这项研究为未来的建筑工作站点启用边缘的“智能”铺平了道路,并促进实时的人类技术互动,而无需高速互联网。
到目前为止,卷积神经网络 (CNN) 一直是视觉数据的实际模型。最近的研究表明,(Vision) Transformer 模型 (ViT) 可以在图像分类任务上实现相当甚至更优异的性能。这就提出了一个核心问题:Vision Transformer 如何解决这些任务?它们是像卷积网络一样工作,还是学习完全不同的视觉表示?通过分析图像分类基准测试中 ViT 和 CNN 的内部表示结构,我们发现这两种架构之间存在显著差异,例如 ViT 在所有层上都有更统一的表示。我们探索了这些差异是如何产生的,发现了自注意力机制发挥的关键作用,它可以实现全局信息的早期聚合,而 ViT 残差连接则可以将特征从较低层强烈传播到较高层。我们研究了对空间定位的影响,证明 ViT 成功地保留了输入的空间信息,并且不同分类方法的效果显著。最后,我们研究(预训练)数据集规模对中间特征和迁移学习的影响,并最后讨论与 MLP-Mixer 等新架构的连接。
自2010年代以来,机器学习2的快速进步2已实现了许多新的数字技术 - 从日益高级的自然语言处理系统和机器人到高度准确的图像分类算法和大数据分析。随着这些新技术的可能性,医疗保健和医学研究已成为实际应用的重要重点。例如,自然语言处理系统IBM Watson在2013年因在测验节目《 Jeopardy》中赢得了备受瞩目的胜利而闻名!随后,IBM开发了Watson的肿瘤学 - 该系统的一种旨在分析大量医学文献的系统,并向癌症护理中的医生提出治疗选择。3同样,Google DeepMind利用其在医疗应用中的开拓机器学习研究中享有声誉,例如图像分类以检测眼睛扫描中的糖尿病性视网膜病的早期迹象,4和Alphafold,该系统可以预测具有高准确性的蛋白质3D结构,并因此,可能会加快药物发现过程。5更普遍地,将机器学习应用于医疗问题的新研究通常会发表,报告的绩效与人类医疗保健专业人员相当或超过。6
摘要:神经网络的方法(又名深度学习)为在气象学中使用了许多新的机会来利用远程感知的图像。常见应用包括图像分类,例如,确定图像是否包含热带旋风,以及图像 - 图像翻译,例如,为仅具有被动通道的卫星效仿雷达图像。然而,关于使用神经网络来处理气象图像,例如用于评估,调整和解释的最佳实践,还有许多公开问题。本文重点介绍了神经网络发展的几种策略和实际考虑因素,这些策略和实际考虑因素尚未在气象界受到很多关注,例如接收领域的概念,未充分利用的气象性能指标以及神经网络解释的方法,例如合成实验和层次相关性传播。我们还将神经网络解释的过程视为一个整体,将其视为基于实验设计和假设的产生和测试的Itera tive tive the triben驱动的发现过程。最后,尽管气象学中的大多数关于神经网络解释的工作迄今已集中在用于图像分类任务的网络上,但我们将重点扩展到包括图像到图像翻译的网络。