摘要:由于人脑的敏感性,从图像中正确分割脑肿瘤对于患者和医务人员都非常重要。手术干预需要医生非常谨慎和精确地瞄准大脑所需的部位。此外,分割过程对于多类肿瘤分类也很重要。这项工作主要集中在脑磁共振图像处理的三个主要领域进行分类和分割,即:脑磁共振图像分类、肿瘤区域分割和肿瘤分类。提出了一个名为DeepTumor的框架,用于将多阶段多类胶质瘤肿瘤分类为四类;水肿、坏死、增强和非增强。对于脑磁共振图像二元分类(肿瘤和非肿瘤),提出了两个深度卷积神经网络 (CNN) 模型用于脑磁共振图像分类; 9层模型,共有217,954个可训练参数,以及一个改进的10层模型,共有80,243个可训练参数。在第二阶段,提出了一种基于增强模糊C均值(FCM)的技术用于脑MRI图像中的肿瘤分割。在最后阶段,提出了一个增强的CNN模型3,该模型具有11个隐藏层,共有241,624个可训练参数,用于将分割后的肿瘤区域分为四个胶质瘤肿瘤类。实验使用BraTS MRI数据集进行。将提出的CNN模型用于二分类和多类肿瘤分类的实验结果与现有的CNN模型(如LeNet,AlexNet和GoogleNet)以及最新文献进行了比较。
本研究旨在使用混合溶液方法诊断出视网膜底面图像的糖尿病性视网膜病。更具体,混合方法依赖于结合深度学习和图像处理以获得更好的结果。可靠的糖尿病性视网膜病变(DR)从数字眼底图像中检测被认为是医疗图像处理中的一个开放问题,需要开发替代溶液。失明和视觉丧失可能来自DR。本研究采用径向基函数(RBF)神经网络分类器来自动识别视网膜图像是与疾病相关或非药物相关的。糖尿病性视网膜病(DR)会导致视觉损害的视网膜病变,通常与糖尿病有关。如果未及时检测到它,则可能导致失明。早期诊断和治疗DR可以帮助防止视力丧失。深度学习已成为最近最受欢迎的方法之一,显示了各种应用程序的性能提高,尤其是在医学图像的分析和分类中。由于其出色的有效性,卷积神经网络越来越多地用作医学图像分析中的深度学习技术。图像处理在研究的建议的解决方案方法中使用。然后将卷积神经网络分类以进行诊断。使用Eyepacs数据库的33000个视网膜底面图像来验证该技术。深度学习模型使用彻底的方法来训练和评估Alexnet检测糖尿病性视网膜病的模型。模型精度为0.7349,结果表明了值得注意的性能指标和成功的准确分类。
摘要:为了诊断阿尔茨海默病 (AD),人们采用了磁共振成像等神经成像方法。深度学习 (DL) 在计算机视觉方面的最新进展进一步激发了对机器学习算法的研究。然而,这些算法的一些局限性,例如需要大量的训练图像和强大的计算机,仍然阻碍了基于机器学习的 AD 诊断的广泛使用。此外,大量的训练参数和繁重的计算使得 DL 系统难以与移动嵌入式设备(例如手机)集成。对于使用 DL 进行 AD 检测,目前大多数研究仅侧重于提高分类性能,而很少有研究获得更紧凑、复杂度更低、识别准确率相对较高的模型。为了解决这个问题并提高 DL 算法的效率,本文提出了一种用于 AD 分类的深度可分离卷积神经网络模型。本文使用深度可分离卷积 (DSC) 来代替传统的卷积。与传统神经网络相比,所提出的神经网络的参数和计算成本大大降低。与传统神经网络相比,所提出的神经网络的参数和计算成本显著降低。由于其低功耗,所提出的模型特别适合嵌入移动设备。实验结果表明,基于 OASIS 磁共振成像数据集的 DSC 算法在 AD 检测方面非常成功。此外,本文还采用了迁移学习来提高模型性能。使用两个训练有素的复杂网络模型 AlexNet 和 GoogLeNet 进行迁移学习,平均分类率分别为 91.40%、93.02%,功耗更低。
MRI(磁共振成像)的分类过程经常用于对垂体、神经胶质瘤、脑膜瘤和非肿瘤等疾病进行医学诊断。因此,确定 MRI 的类型及其数量是揭示大脑健康状况的重要且有价值的测量。为了对大脑分析进行分割和分类,实验室人员通过屏幕进行手动检查;这需要大量的劳动力和时间。另一方面,专家使用的设备对于每个医生或机构来说并不实用或便宜。近年来,已经开发了各种用于分割和分类的计算算法,并改进了结果以解决这个问题。人工神经网络(ANN)在这方面具有分类的能力和前景。本文的目的是创建并实施一个系统,用于对不同类型的脑肿瘤样本 MRI 图像进行分类。因此,本文集中研究了使用各种机器学习算法进行分割、特征提取、分类器构建和分类为四类的任务。作者使用基于三种模型的迁移学习算法的 VGG-16、ResNet-50 和 AlexNet 模型作为集成模型对图像进行分类。因此,MRI 脑肿瘤分割更加精确,因为现在每个空间特征点都可以参考所有其他上下文数据。具体来说,我们的模型在官方深度学习挑战赛中优于所有其他已发布的现代集成模型,无需任何后处理。集成模型的准确率为 99.16%,灵敏度为 98.47%,特异性为 98.57%,精确率为 98.74%,召回率为 98.49%,F 1 分数为 98.18%。这些结果明显超过了朴素贝叶斯、决策树分类器、随机森林和 DNN 模型等其他方法的准确率。
摘要。传统上,用于检测感兴趣要素的计算机视觉解决方案(例如,缺陷)是基于严格的上下文敏感的实现,以解决包含一组明确条件的问题。另一方面,几种机器学习方法证明了它们的概括能力,不仅是为了不断地改善分类,而且还基于基本方面从新示例中学习:从算法设置中分离数据。有关向后传播的发现以及基于图形卡技术建立的进步,可以提高机器学习的进步,这是一个被称为深度学习的子领域的进步,由于人类通常由人类处理的地图和交易知识,它在许多工业领域都变得非常流行,并具有令人难以置信的可伸缩性。织物缺陷检测是已逐渐自动化的手动过程之一,它是上述方法,因为它是质量控制的重要过程。目标是多种多样的:减少人体错误,疲劳,人体工程学问题和相关成本,同时改善所涉及任务的迅速性和准确性,并直接影响利润。遵循纺织行业的特定重点之后,这项工作旨在简要审查缺陷类型和自动化光学检查(AOI)(AOI),主要基于机器学习技术,这些技术已经证明了它们在识别纺织品材料分析中识别异常方面的有效性。基于已知体系结构(例如Alexnet或视觉几何组)(VGG16)等卷积神经网络(CNN),允许在98%以上的精确度上达到准确性。还提供了简短的讨论,并分析了当前表征这一干预领域的状态以及一些未来的挑战。
自从深度学习在计算机视觉领域出现用于图像分类以来,卷积神经网络 (CNN) 已成为强大而流行的工具。为了更好地识别,人们探索了深度和宽度的维度,从而产生了具有更多层和通道的卷积神经网络。除了这些因素之外,神经生物学还表明横向抑制(横向拮抗,例如马赫带效应),这是一种广泛存在的视觉现象,它增加了横向附近神经元激发的对比度和清晰度,以帮助识别。然而,这种机制在卷积神经网络的设计中还没有得到很好的探索。在本文中,我们明确探索了横向方向上的滤波器维度,并提出了我们的横向抑制启发 (LI) 结构。我们的简单设计使用低通滤波器来模拟来自邻居的横向相互作用的强度衰减。每个通道应用一个可学习的参数来通过乘法设置低通滤波器的幅度,这可以灵活地模拟各种横向相互作用(包括横向抑制)。然后从输入中减去卷积结果,这可以增加对比度和清晰度,从而更好地识别。此外,应用可学习的缩放因子和移位来调整减法后的值。我们的横向抑制启发 (LI) 结构适用于普通卷积和具有残差连接的卷积块,同时与现有模块兼容。初步结果表明,AlexNet (7.58%) 和 ResNet-18 (0.81%) 在 ImageNet 数据集上分别有明显的改进,而参数几乎没有增加,这表明我们的类似大脑的设计从不同角度有效地帮助了图像分类的特征学习。
近年来,自动驾驶汽车的发展迅速发展,这是由于人工智能和深度学习的进步所推动。这些技术正在彻底改变车辆如何感知和与周围环境相互作用,从而为更安全,更有效的运输系统奠定了基础。自动驾驶汽车依靠传感器,相机和计算模型的复杂相互作用来实时解释其环境。在这些组件中,对象检测起着关键作用,充当车辆的“眼睛”,以识别和应对障碍,交通状况和道路信号。这些系统的安全性和效率的关键组成部分是实时对象检测,它可以准确地识别和定位必需物体,例如行人,车辆,车辆,车辆,交通范围,以及动态驾驶的环境,以及动态的环境,以及一个动态驾驶。但是,挑战在于在高度动态和不可预测的道路条件下达到速度和准确性。传统的计算机视觉技术通常很难满足实时处理的需求,从而导致延迟或错过的检测,这可能会危及乘客安全性。这项研究通过引入基于Yolov8的深度学习模型来解决这些问题,专门针对对象检测的速度和准确性进行了优化。Yolov8代表“您只看一次”(Yolo)系列的下一代,该系列以其效率和实时性能而闻名。在各种城市和农村场景中进行的广泛模拟表明,Yolov8的表现优于Alexnet,Densenet,Vggnet,Igcnet和Resnet等建筑。具体来说,它的精度为81.98%(至少比其他模型高1.94%),同时还显示了更快的处理时间。这项研究强调了YOLOV8提供的检测效率和可靠性的实质性提高,增强了其适合于增强自动驾驶汽车系统安全性和可靠性的可靠性。通过解决实时对象检测中的关键挑战,这项研究促进了使自动驾驶汽车成为更安全,更实用的替代方案的更广泛目标。
使用不同的迁移学习模型在 MRI 图像中检测阿尔茨海默病并提高分类准确性 M. Rajendiran 研究学者,印度奇丹巴兰安纳马莱大学计算机与信息科学系 电子邮件:rajendiranmaha@gmail.com KP Sanal Kumar 博士 助理教授,印度切格阿尔帕图 RV 政府艺术学院计算机科学系 PG 电子邮件:sanalprabha@yahoo.co.in S. Anu H. Nair 博士 印度奇丹巴兰安纳马莱大学 CSE 系助理教授[委派到 WPT,钦奈] 电子邮件:anu_jul@yahoo.co.in 摘要 --- 阿尔茨海默病 (AD) 是一种神经退行性疾病,会损害脑细胞并随着时间的推移削弱患者的记忆力。如果及早发现,患者可以避免永久性记忆丧失和脑细胞的进一步损害。近年来,已经开发出各种用于检测阿尔茨海默病 (AD) 的自动化技术和技术。有多种方法可以快速、准确、尽早识别病情,以减少对患者心理健康的负面影响。机器学习模型大大提高了医学成像系统对阿尔茨海默病 (AD) 的诊断性能。然而,多类分类存在一个主要困难,即存在极其密切相关的大脑结构特征。通过增加层数并在分类层次结构的所有级别包含特征和分类器,可以改进深度学习。然而,绝大多数深度学习模型(如传统的 CNN 模型)在现实世界中都无法提供可接受的结果。本研究中提出的不同迁移学习模型(如 AlexNet、VGG-16 Net、ResNet-50 和 Google Net)分类模型旨在提高稳健性。我们已经建立并比较了各种迁移学习模型。基于 OASIS 数据集,我们收集了 8,980 张 MRI 图像来测试我们建议的
[1] Jimmy Lei BA,Jamie Ryan Kiros和Geoffrey E. Hinton。层归一化。2016。Arxiv:1607.06450 [Stat.ml]。[2] Nanxin Chen等。Wavegrad:估计波形产生的梯度。2020。Arxiv:2009.00713 [Eess.as]。[3]凯瑟琳·克罗森(Katherine Crowson)。在CIFAR-10上训练扩散模型。在线。2024。URL:https://colab.research.google.com/drive/1ijkrrv-d7bosclvkhi7t5docryqortm3。[4]凯瑟琳·克罗森(Katherine Crowson)。v-diffusion。在线。2024。URL:https: / / github。com/crowsonkb/v-diffusion-pytorch/blob/master/diffusion/utils.py。[5] Ekin D. Cubuk等。randaugment:实用的自动化数据增强,并减少了搜索空间。2019。Arxiv:1909.13719 [CS.CV]。 [6] Yann N. Dauphin等。 通过封闭式卷积网络进行语言建模。 2017。Arxiv:1612.08083 [CS.CL]。 [7] Mostafa Dehghani等。 通用变压器。 2019。Arxiv:1807.03819 [CS.CL]。 [8] Yilun Du和Igor Mordatch。 基于能量的模型中的隐性产生和概括。 2020。Arxiv:1903.08689 [CS.LG]。 [9] Ian J. Goodfellow等。 生成对抗网络。 2014。Arxiv:1406.2661 [Stat.ml]。 [10] Dan Hendrycks和Kevin Gimpel。 高斯错误线性单元(Gelus)。 2023。Arxiv:1606.08415 [CS.LG]。 [11] Jonathan Ho,Ajay Jain和Pieter Abbeel。 剥离扩散概率模型。 2020。Arxiv:2006.11239 [CS.LG]。2019。Arxiv:1909.13719 [CS.CV]。[6] Yann N. Dauphin等。通过封闭式卷积网络进行语言建模。2017。Arxiv:1612.08083 [CS.CL]。[7] Mostafa Dehghani等。通用变压器。2019。Arxiv:1807.03819 [CS.CL]。 [8] Yilun Du和Igor Mordatch。 基于能量的模型中的隐性产生和概括。 2020。Arxiv:1903.08689 [CS.LG]。 [9] Ian J. Goodfellow等。 生成对抗网络。 2014。Arxiv:1406.2661 [Stat.ml]。 [10] Dan Hendrycks和Kevin Gimpel。 高斯错误线性单元(Gelus)。 2023。Arxiv:1606.08415 [CS.LG]。 [11] Jonathan Ho,Ajay Jain和Pieter Abbeel。 剥离扩散概率模型。 2020。Arxiv:2006.11239 [CS.LG]。2019。Arxiv:1807.03819 [CS.CL]。[8] Yilun Du和Igor Mordatch。基于能量的模型中的隐性产生和概括。2020。Arxiv:1903.08689 [CS.LG]。[9] Ian J. Goodfellow等。生成对抗网络。2014。Arxiv:1406.2661 [Stat.ml]。[10] Dan Hendrycks和Kevin Gimpel。高斯错误线性单元(Gelus)。2023。Arxiv:1606.08415 [CS.LG]。[11] Jonathan Ho,Ajay Jain和Pieter Abbeel。剥离扩散概率模型。2020。Arxiv:2006.11239 [CS.LG]。[12] Jonathan Ho和Tim Salimans。无分类器扩散指南。2022。ARXIV:2207.12598 [CS.LG]。[13]安德鲁·霍华德(Andrew Howard)等人。搜索MobilenetV3。2019。Arxiv:1905.02244 [CS.CV]。[14] Andrew G. Howard等。 Mobilenets:用于移动视觉应用的有效卷积神经网络。 2017。Arxiv:1704.04861 [CS.CV]。 [15] Forrest N. Iandola等。 squeezenet:较小的参数和€0.5MB型号的Alexnet级准确性。 2016。Arxiv:1602.07360 [CS.CV]。 [16] Imagenet 64x64基准(图像生成)。 用代码的论文,2024。URL:https://paperswithcode.com/sota/image-generation-generation-en-on-imagenet-64x64。 [17] Sergey Ioffe和Christian Szegedy。 批次归一化:通过减少内部协变性转移来加速深层网络训练。 2015。Arxiv:1502.03167 [CS.LG]。 [18] Diederik P. Kingma和Jimmy Ba。 亚当:一种随机优化的方法。 2017。Arxiv:1412.6980 [CS.LG]。 [19] Diederik P. Kingma和Ruiqi Gao。 将扩散目标理解为具有简单数据增强的ELBO。 2023。Arxiv:2303.00848 [CS.LG]。 [20] Diederik P. Kingma等。 变化扩散模型。 2023。Arxiv:2107.00630 [CS.LG]。 [21] Zhenzhong Lan等。 albert:一个精简版的语言表示学习。 2020。Arxiv:1909.11942 [CS.CL]。 [22] Ilya Loshchilov和Frank Hutter。 重量衰减正则化。[14] Andrew G. Howard等。Mobilenets:用于移动视觉应用的有效卷积神经网络。2017。Arxiv:1704.04861 [CS.CV]。 [15] Forrest N. Iandola等。 squeezenet:较小的参数和€0.5MB型号的Alexnet级准确性。 2016。Arxiv:1602.07360 [CS.CV]。 [16] Imagenet 64x64基准(图像生成)。 用代码的论文,2024。URL:https://paperswithcode.com/sota/image-generation-generation-en-on-imagenet-64x64。 [17] Sergey Ioffe和Christian Szegedy。 批次归一化:通过减少内部协变性转移来加速深层网络训练。 2015。Arxiv:1502.03167 [CS.LG]。 [18] Diederik P. Kingma和Jimmy Ba。 亚当:一种随机优化的方法。 2017。Arxiv:1412.6980 [CS.LG]。 [19] Diederik P. Kingma和Ruiqi Gao。 将扩散目标理解为具有简单数据增强的ELBO。 2023。Arxiv:2303.00848 [CS.LG]。 [20] Diederik P. Kingma等。 变化扩散模型。 2023。Arxiv:2107.00630 [CS.LG]。 [21] Zhenzhong Lan等。 albert:一个精简版的语言表示学习。 2020。Arxiv:1909.11942 [CS.CL]。 [22] Ilya Loshchilov和Frank Hutter。 重量衰减正则化。2017。Arxiv:1704.04861 [CS.CV]。[15] Forrest N. Iandola等。squeezenet:较小的参数和€0.5MB型号的Alexnet级准确性。2016。Arxiv:1602.07360 [CS.CV]。[16] Imagenet 64x64基准(图像生成)。用代码的论文,2024。URL:https://paperswithcode.com/sota/image-generation-generation-en-on-imagenet-64x64。[17] Sergey Ioffe和Christian Szegedy。批次归一化:通过减少内部协变性转移来加速深层网络训练。2015。Arxiv:1502.03167 [CS.LG]。[18] Diederik P. Kingma和Jimmy Ba。亚当:一种随机优化的方法。2017。Arxiv:1412.6980 [CS.LG]。[19] Diederik P. Kingma和Ruiqi Gao。将扩散目标理解为具有简单数据增强的ELBO。2023。Arxiv:2303.00848 [CS.LG]。[20] Diederik P. Kingma等。变化扩散模型。2023。Arxiv:2107.00630 [CS.LG]。[21] Zhenzhong Lan等。albert:一个精简版的语言表示学习。2020。Arxiv:1909.11942 [CS.CL]。[22] Ilya Loshchilov和Frank Hutter。重量衰减正则化。2019。Arxiv:1711.05101 [CS.LG]。[23] Preetum Nakkiran等。深度下降:更大的模型和更多数据损害。2019。Arxiv:1912.02292 [CS.LG]。[24] Alex Nichol和Prafulla Dhariwal。改进了扩散概率模型。2021。Arxiv:2102.09672 [CS.LG]。[25] Aaron van den Oord,Nal Kalchbrenner和Koray Kavukcuoglu。像素复发性神经网络。2016。Arxiv:1601.06759 [CS.CV]。[26] Prajit Ramachandran,Barret Zoph和Quoc V. Le。搜索激活功能。2017。Arxiv:1710.05941 [CS.NE]。 [27] Danilo Jimenez Rezende和Shakir Mohamed。 差异推断与归一化流量。 2016。Arxiv:1505.05770 [Stat.ml]。2017。Arxiv:1710.05941 [CS.NE]。[27] Danilo Jimenez Rezende和Shakir Mohamed。差异推断与归一化流量。2016。Arxiv:1505.05770 [Stat.ml]。
Merdan OZKAHRAMAN*、Haydar LIVATYALI 摘要:使用机器人机械手的生产系统在过去几十年中变得很普遍,而且趋势是朝着节省空间的无围栏单元发展。因此,这些系统的安全性和灵活性变得更加关键。安全系统基于传感器数据或摄像机图像。虽然基于摄像头的系统的灵活性更好,但传统的图像处理方法对工作环境很敏感。人工智能可能是他们快速适应变化需求并提高准确性和稳定性的有力工具。在本研究中,设计了一种低成本的基于 2-D 摄像头的安全系统,并将其安装在实验性的无围栏机器人工作单元中。系统控制器与三种替代深度学习(ResNet-152、AlexNet、SqueezeNet)和三种机器学习模块(支持向量机、随机森林和决策树)相结合。这些模块使用十个不同异物穿透警报区的照片图像进行训练。为了涵盖不断变化的工业环境条件,我们通过使用每个类别最多 550 张图像来涵盖相机振动、阴影、反射、照度变化等破坏性影响。使用用于训练和测试这六个系统的受限数据,SqueezeNet 深度学习模型的最佳准确率为 95%,且没有过度拟合。尽管如此,基于机器学习的模型的预测时间比基于深度学习的模型快 100 倍。因此,安全系统可以快速适应任何可能的变化,并防止工作条件可能产生的噪音,并可以防止工业生产中可能发生的时间损失。 关键词:人工智能;图像分类;机器人与自动化 1 引言 几十年来,机器人技术一直用于工业生产和许多其他领域。各种产品的生产需求变化要求生产线和机器人单元频繁变化。生产线的变化会导致时间和劳动力的损失 [1]。这些损失的一个重要部分来自生产线中工作单元的安全要求。工业中不仅使用围栏,还使用基于传感器和摄像头的安全系统。基于摄像头的安全系统可以被认为是最先进的技术。在这种系统中,由于工作单元的变化,必须重新调整结构。可重构结构中使用的安全系统、基于人机互操作性的系统以及无围栏系统的图像处理也应适应这种灵活性 [2-4]。为了实现安全系统对工作灵活性的适应性,并避免环境条件引起的噪音,在传统的图像处理方法中加入人工智能算法是不可避免的。当目标是识别和区分进入工作单元的异物时,使用基于人工智能的图像处理的系统可能会提高安全系统的性能。传统的基于图像处理的安全系统无法可靠地识别友好物体。这些友好物体可能是工件或允许进入单元区域内的操作员。传统系统需要一些额外的设备来识别这些物体而不停止机器人手臂的工作。基于人工智能的安全系统在这方面更为成功。系统的可靠性将随着系统以期望和不期望的方式识别物体而提高。然而,众所周知,传统系统会受到工作环境中的振动、阴影和照度等噪声源的影响。可以建立一个能够快速响应未来变化并提高可靠性的安全系统。通过