深神经网络(DNN)中所谓的“注意机制”表示DNN的自动适应,以捕获具有特定分类任务和相关数据的代表性特征。这种注意机制通过加强特征通道和本地强调每个特征图中的特征来在全球范围内发挥作用。渠道和特征重要性是在全球端到端DNS培训过程中学习的。在本文中,我们提出了一项研究,并提出了一种具有不同方法的方法,并在训练图像旁边添加了补充视觉数据。我们使用人类的视觉注意图在任务驱动或自由观看条件下独立于心理视觉实验获得的人类视觉注意图,或者在自由观看条件下或预测视觉注意图的强大模型。我们在图像旁边添加了视觉注意图作为新数据,从而将人类的视觉注意力引入DNNS培训中,并将其与全球和局部自动注意机制进行比较。实验结果表明,DNN中的已知注意力机制几乎与人类的视觉关注在一起,但提出的方法仍然可以更快地收敛和在图像分类任务中更好地表现。
摘要:本研究研究了描绘变速箱,森林,农田和山脉的航空图像的分类。要完成分类工作,使用卷积神经网络(CNN)体系结构从输入照片中提取功能。然后,使用SoftMax对图像进行分类。要测试模型,我们使用90批量的ADAM优化器和0.001的学习率将其运行了十个时期。培训和评估都是使用数据集进行的,该数据集将Google卫星图像与MLRNET数据集融合在一起的图片。综合数据集包含10,400张图像。我们的研究表明,转移学习模型和MobilenetV2,对于景观分类非常有效。这些模型是实际使用的好选择,因为它们在精度和效率之间很好地结合在一起。我们的方法在内置的CNN模型上以87%的总体准确度获得了结果。此外,我们通过利用验证的VGG16和MobilenEtV2模型作为传输学习的起点,达到更高的精度。具体来说,VGG16的精度为90%,测试损失为0.298,而MobileNetV2的精度优于两个模型,其精度为96%,测试损失为0.119;结果表明,使用Mobilenetv2进行转移学习的有效性来对传输塔,森林,农田和山脉进行分类。关键字:航空图像,图像分类,卷积神经网络(CNN),转移学习
低频率振荡是人脑活动的重要属性,低频频率(ALFF)的幅度是一种反映低频振荡特征的方法,该方法已广泛用于治疗脑部疾病和其他领域。然而,由于当前分析方法的低频率信号提取ALFF的准确性较低,我们提出了基于傅立叶的同步脉冲转换(FSST),该转换(FSST)经常用于信号处理范围中,以提取整个时间尺寸的低频功率谱的ALFF。将提取信号的低频特性与通过静止状态数据的FS StandS快速傅立叶变换(FFT)进行比较。很明显,FSST提取的信号具有更低的频率特征,这与FFT显着不同。
摘要。运动图像分类是一项具有挑战性的任务,涉及多种类型的运动,在功能识别和次优检测结果方面遇到困难。这项研究采用了四个验证的模型,即残留网络50(Resnet-50),EfficityNet B7,密集连接的卷积网络121(Densenet-121),您只能查看一次版本8(Yolov8),以解决对100个不同运动图像类别进行分类的问题。数据集包含12200张体育图像,这是这项研究的强大实验基础。通过比较他们的表现,可以发现Resnet-50在训练集中表现出出色的性能,在验证集中的准确度为90.80%,88.75%的精度为88.75%。有效网络B7模型的训练精度为37.45%,推理的精度为62.42%。令人印象深刻的性能可能是由于其在处理特定的运动图像分类任务时的表示功能有限。densenet-121在培训中获得了71.791%的准确性,验证集获得了86.211%。与EfficityNet B7相比,其性能更好,这表明密集的连通性雅更适合提取图像特征。此外,Yolov8n模型在训练集的平均准确度中提供了出色的性能,验证集的平均精度为96.60%。这些结果展示了在运动图像分类和检测中yolov8n的圆润性能。总而言之,这项研究通过比较运动图像分类中不同算法的性能来解决解决复杂图像分类问题的宝贵见解。了解这些各种算法的优势和缺点对于更深入地理解图像分类任务和指导未来的研究努力至关重要。
摘要:KITSUNE 卫星是一个由 6 个单元组成的立方体卫星平台,主要任务是在低地球轨道 (LEO) 上进行 5 米级地球观测,有效载荷采用 31.4 MP 商用现成传感器、定制光学器件和相机控制板开发。尽管有效载荷是为地球观测而设计的,并以捕捉地面上的人造图案为主要任务,但计划通过卷积神经网络 (CNN) 方法对野火图像进行分类作为次要任务。因此,KITSUNE 将成为第一颗使用 CNN 对 LEO 野火图像进行分类的立方体卫星。在本研究中,卫星上采用了深度学习方法,通过预处理而不是在地面站执行图像处理的传统方法,以减少下行链路数据。 Colab 中生成的预训练 CNN 模型保存在 RPi CM3+ 中,其中,上行链路命令将执行图像分类算法并将结果附加到捕获的图像数据上。地面测试表明,在使用 MiniVGGNet 网络对卫星系统上运行的野火事件进行分类时,它可以实现 98% 的总体准确率和 97% 的 F1 得分成功率。同时,还比较了 LeNet 和 ShallowNet 模型,并在 CubeSat 上实施,F1 得分分别为 95% 和 92%。总体而言,这项研究展示了小型卫星在轨道上执行 CNN 的能力。最后,KITSUNE 卫星将于 2022 年 3 月从国际空间站部署。
1 ZARIA AHMADU BELLO大学计算机科学系2计算机科学系,联邦教育学院,Zaria *通讯作者电子邮件地址:shuwajunior@gmail.com摘要在过去几十年中,机器逐渐接管了人类的日常活动,例如在线购物和服装。 必须开发人工智能技术,以帮助人们相应地检测和对服装设计进行分类。 早期解决服装图像分类问题的努力需要仔细选择和从服装图像数据集中提取某些功能,以使数据集的功能高度表示。 但是,这些方法在定义和捕获广泛的图像特征方面很难。 研究表明,卷积神经网络(CNN)模型可以比传统的机器学习(ML)方法更好地解决图像分类问题。 但是,他们面临着诸如过度拟合,高参数调整,嘈杂数据和培训数据不足之类的问题。 这项工作解决了过度拟合的问题,该问题降低了服装图像分类模型的分类/概括性能。 我们提出了四(4)个CNN模型,其中将称为辍学的正则化方法添加到每个层以处理过度的问题。 在四个模型中以最佳结果作为拟议模型采用了最佳结果。 与使用相同数据集和最先进的建筑设计训练的其他模型记录的结果相比,准确性提高了1.77%。 这是一个1 ZARIA AHMADU BELLO大学计算机科学系2计算机科学系,联邦教育学院,Zaria *通讯作者电子邮件地址:shuwajunior@gmail.com摘要在过去几十年中,机器逐渐接管了人类的日常活动,例如在线购物和服装。必须开发人工智能技术,以帮助人们相应地检测和对服装设计进行分类。早期解决服装图像分类问题的努力需要仔细选择和从服装图像数据集中提取某些功能,以使数据集的功能高度表示。但是,这些方法在定义和捕获广泛的图像特征方面很难。研究表明,卷积神经网络(CNN)模型可以比传统的机器学习(ML)方法更好地解决图像分类问题。但是,他们面临着诸如过度拟合,高参数调整,嘈杂数据和培训数据不足之类的问题。这项工作解决了过度拟合的问题,该问题降低了服装图像分类模型的分类/概括性能。我们提出了四(4)个CNN模型,其中将称为辍学的正则化方法添加到每个层以处理过度的问题。在四个模型中以最佳结果作为拟议模型采用了最佳结果。与使用相同数据集和最先进的建筑设计训练的其他模型记录的结果相比,准确性提高了1.77%。这是一个关键字:正规化,神经网络,分类,人工智能,计算机视觉,过度拟合,辍学的介绍在过去几十年中,机器正在逐渐接管人类的日常活动,例如在线购物和衣服操纵。在线购物和衣服操纵需要某些功能,例如颜色,设计和衣服的形状,以便能够相应地识别和分组它们。必须开发人工智能技术,可以适当地检测和对服装设计进行分类,以使机器执行在线购买的任务,并帮助他们有效地决定人类的衣服类型。这可以帮助用户更好地了解产品,并吸引来自不同位置的更多客户,从而提高销售额。对客户的口味,文化和社会经济地位的更深入了解也可以通过这种信息来帮助(Henrique等,2021)。服装时装设计的分类属于称为图像分类的计算机视觉中更广泛的群体。将对象分类为各种类别的任务可以被视为人类简单的任务,但对于机器来说是复杂的。
摘要 — 医学图像分类是医疗保健领域的一个重要关注领域,它涉及准确分类图像中的异常或异常。它需要快速准确的分类以确保对患者进行适当和及时的治疗。本文介绍了一种基于卷积神经网络 (CNN) 的模型,该模型利用 VGG16 架构进行医学图像分类,特别是在脑肿瘤和阿尔茨海默氏症数据集中。VGG16 架构以其提取重要特征的卓越能力而闻名,这对医学图像分类至关重要。为了提高诊断的准确性,进行了详细的实验设置,其中包括精心选择和组织涵盖数据集中不同疾病和异常的医学图像集合。然后调整模型的架构以实现图像分类的最佳性能。结果显示该模型在识别医学图像中的异常方面的效率,尤其是对于脑肿瘤数据集。给出了灵敏度、特异性和 F1 分数评估指标,强调了该模型准确区分各种医学图像疾病的能力。关键词——深度学习、卷积神经网络 (CNN)、VGG-16、医学图像分类。
脑瘤是世界上最致命的疾病之一。这种疾病可以攻击任何人,无论性别或特定年龄段。脑瘤的诊断是通过手动识别计算机断层扫描或磁共振成像的图像进行的,因此可能会发生诊断错误。此外,可以使用活检技术进行诊断。这种技术非常准确,但需要很长时间,大约 10 到 15 天,并且需要大量设备和医务人员。基于此,需要能够根据 MRI 生成的图像进行分类的机器学习技术。这项研究旨在提高以前研究对脑瘤分类的准确性,从而避免在脑瘤诊断中出现错误。本研究使用的方法是使用 AlexNet 和 Google Net 架构的卷积神经网络。这项研究的结果显示,AlexNet 架构的准确率为 98%,GoogleNet 的准确率为 96%。与以前的研究相比,这个结果更高。这一发现可以减少模型训练期间的计算负担。该研究成果可以帮助医生快速准确地诊断脑肿瘤。
CUB200-2011 [ 177 ] 图像对象定位 [ 4 , 16 , 96 , 100 , 110 , 210 ] 细粒度图像分类 [ 61 , 109 , 110 , 209 ] iNaturalist [ 168 ] 图像不平衡图像分类 [ 32 , 100 , 110 ] FGVC-Aircraft [ 116 ] 图像细粒度图像分类 [ 61 , 96 , 100 , 109 , 110 ] UCI [ 3 ] 图像表格数据分类 [ 44 , 209 , 212 ] MR [ 113 ] 图像句子分类 [ 46 , 47 , 103 ] TREC [ 129 ]图像句子分类 [ 46 , 47 , 67 , 82 , 103 , 147 , 207 ] SST [ 153 ] 文本句子分类 [ 46 , 47 , 67 , 82 , 103 , 147 ] Subj [ 128 ] 文本句子分类 [ 46 , 47 , 67 , 82 , 103 ] GLUE [ 179 ] 文本自然语言理解 [ 159 , 204 , 207 , 216 ] Google 命令 [ 183 ] 音频分类 [ 52 , 71 , 94 , 212 ]