摘要 - 在过去的十年中,编码器二十字架框架的图像字幕显示出巨大的进步,在过去的十年中,CNN主要用作编码器,LSTM用作解码器。尽管在简单图像中的准确性方面取得了令人印象深刻的成就,但它在时间复杂性和空间复杂性效率方面缺乏。除此之外,如果具有许多信息和对象的复杂图像,则该CNN-LSTM对的性能由于缺乏对图像中显示的场景的语义理解而呈指数降级。因此,要考虑这些问题,我们提出了CNN-GRU编码器解码框架,用于字幕到图像重建器,以考虑到语义上下文以及时间复杂性。通过考虑解码器的隐藏状态,将输入图像及其相似的语义表示是重建的,并且在模型训练过程中使用了语义重建器的重建分数与可能的可能性使用,以评估生成的字幕的质量。结果,解码器会收到改进的语义信息,从而增强了字幕生产过程。在模型测试期间,选择最合适的标题也可行。建议的模型优于最先进的LSTM-A5模型,用于图片的图片字幕,以时间复杂性和准确性。
非盲反卷积的目的是从鉴定获得的内核中恢复其模糊的图像。iS iSTING TEEP神经体系结构通常是基于大型地面真相图像的大型数据集建立的,并接受了监督训练。并不总是可用的,尤其是针对生物化应用,敏锐的高质量地面真相图像并不总是可用的。这严重阻碍了当前方法在实践中的适用性。在本文中,我们提出了一种新型的非盲卷曲方法,该方法利用了深度学习和经典迭代反卷积算法的力量。我们的方法结合了一个预先训练的网络,从输入图像中提取深度特征以及Itera的Richardson-Lucy反卷积步骤。随后,采用零射击优化过程来集成反浏览特征,从而产生高质量的重建图像。通过使用经典的迭代反卷积方法进行初步重构,我们可以有效地利用较小的网络来产生最终图像,从而加速重建,同时减少需求量,以减少有价值的计算资源。我们的方法证明了各种现实世界应用程序中的显着改进。
摘要。合成的多光谱卫星图像的产生尚未达到其他领域中可达到的质量水平,例如面部图像的产生和操纵。难度的一部分源于需要在此类图像覆盖的整个电磁频谱上生成一致的数据,该图像的辐射分辨率高于多媒体应用中通常使用的图像。与不同波长相对应的图像带的不同空间分辨率提出了其他问题,其主要效果是相对于原始图像,在合成图像中缺乏空间细节。我们建议通过将样式传输应用于13波段Sentinel-2 Level1-C图像,明确认为基于生成的对抗网络的建筑可以生成合成卫星图像。为避免丢失更细的空间细节并改善生成的图像的清晰度,我们引入了一种类似Pansharpening的方法,从而将输入图像的空间结构转移到了样式转移的图像的情况下,而无需引入可见的文物。我们通过应用所提出的架构将贫瘠的图像转化为植被图像,反之亦然,从而得到的结果(res。冬季)图像进入冬季(res。夏季图像,确认了提出的解决方案的有效性。
学生,计算机科学与工程系2,3,4,5 Anjalai Ammal Mahalingam工程学院,蒂鲁瓦拉尔,蒂鲁瓦拉尔,印度泰米尔纳德邦,摘要:由于其特性,药用植物在传统和现代医学中起着至关重要的作用。在这项研究中,我们建议使用机器学习鉴定药用植物。所提出的系统包括几个关键组件:数据收集,特征提取,模型培训和预测。最初,从数据库中收集了全面的药用植物图像数据集。接下来,使用图像处理技术从图像中提取相关功能,例如叶状形状,纹理和颜色。随后,采用ML算法(例如卷积神经网络(CNN))来培训有关提取特征的分类模型。然后,受过训练的模型能够准确地从输入图像中识别出药用植物。为了促进用户交互,可以开发一个用户友好的接口,从而使用户可以上传图像并接收即时标识结果。此外,在现实世界中评估了系统的性能,以评估其实际实用性和可靠性。总的来说,提议的自动药物植物识别系统代表了利用ML技术简化识别过程的重大进步。关键字:机器学习,卷积神经网络
在这项研究中,作者提出了一种对黑色素瘤皮肤癌(MSC)进行分类的深度学习方法。他们引入了一个由27层组成的卷积神经网络(CNN)模型,该模型经过精心设计,旨在从皮肤病变图像中提取特征并将其分类为黑色素瘤和非黑色素瘤类别。提出的CNN模型包括多个卷积层,这些卷积层将过滤器应用于输入图像以提取诸如边缘,形状和图案之类的特征。批发层将卷积层的输出归一化以加速学习过程并防止过度拟合遵循这些卷积层。在皮肤病变图像的公开数据集上评估了所提出的CNN模型的性能,并且发现表明,它的表现优于黑色素瘤分类的几种最新方法。作者还进行了消融研究,以分析每层对模型整体性能的贡献。所提出的DL方法有可能协助皮肤科医生早期检测MSC,这可能导致更有效的治疗并改善患者的预后。它还证明了DL技术在医学图像分析中的有效性,并突出了仔细设计和优化CNN模型以进行高性能的重要性。提议的系统的准确性为99.99%。
近年来,人工智能已用于生成大量高质量数据,如图像、音乐和视频。由于不同机器学习技术(如人工神经网络)性能的提高,如此大量的合成数据得以生成。考虑到人们对这一领域的兴趣日益浓厚,最近提出了用于自动数据生成和增强的新技术。例如,生成对抗网络 (GAN) 及其变体是当今该研究领域的流行技术。合成数据的创建也是通过基于进化的技术实现的,例如在多媒体工件创建的背景下。本社论总结了在特刊 (SI)“人工智能中的生成模型及其应用”背景下发表的研究论文。本期特刊由两位客座编辑负责:来自里斯本新大学(葡萄牙)的 Mauro Castelli 和来自的里雅斯特大学(意大利)的 Luca Manzoni。该特刊旨在收集人工智能生成模型领域的新贡献,重点关注它们在解决不同领域复杂的现实问题中的应用。在第一篇论文“Daydriex:将夜间场景转化为夜间日间驾驶体验” [ 1 ] 中,作者提出了一种处理流程,以生成专注于道路视图的增强型日间转换。关键思想是使用与街景服务输入图像相对应的现有日间图像来补充输入图像帧中暗区的缺失信息。第二篇论文“Fake It Till You Make It:有效合成数据生成指南” [ 2 ] 涉及对各种合成数据生成方法的评估。更详细地讲,作者研究了 (i) 数据预处理对生成的合成数据效用的影响,(ii) 在生成监督机器学习模型时是否应对合成数据集进行调整,(iii) 共享初步机器学习结果是否可以改进合成数据模型,以及 (iv) 一种效用度量(倾向得分)是否可以预测在现实生活中使用合成数据生成的机器学习模型的准确性。作者进行的分析有助于定义一些在生成和使用合成数据时应遵循的最佳策略指南。在第三篇投稿“使用多重插补集成和生成对抗网络生成济州传统饮料 Shindari 的合成发酵数据” [ 3 ] 中,作者提出了一个模型,该模型以 Shindari(一种传统的韩国饮料)的不完整表格发酵数据作为输入,并使用多重归纳集成 (MIE) 和生成对抗网络 (GAN) 来生成合成发酵数据,这些数据以后可用于预测和微生物腐败控制。为了生成合成数据,作者使用跳过连接重新建模了表格 GAN,并使用梯度惩罚调整了 Wasserstein GAN 的架构。最后,他们将所提模型的性能与其他归纳和集成模型进行了比较,证明了所提模型适合当前任务。在第四篇投稿“使用形式语法
近年来,卷积神经网络(CNN)表明了它们在MR图像超级分辨率(SR)任务上的优势。但是,许多当前的SR模型对计算和内存都有很大的要求,这些模型通常对磁共振成像(MRI)不友好,在这些磁共振成像(MRI)通常会受到限制。另一方面,大多数MRI实验中的一个基本考虑是如何减少扫描时间以改善患者舒适性并减少运动伪像。在这项工作中,我们通过提出一个有效且轻巧的模型来缓解问题,该模型支持快速培训和准确的SR推理。提出的网络的灵感来自横向抑制机制,该机制假设相邻神经元之间存在抑制作用。我们网络的骨干由几个横向抑制块组成,其中抑制作用由一堆级联的局部抑制单元明确实现。当模型量表很小时,明确抑制特征激活将进一步探索模型代表能力。为了更有效的特征提取,还使用了几种平行的扩张卷积直接从输入图像中提取浅特征。对典型MR图像进行的广泛实验表明,我们的横向抑制网络(LIN)比具有类似模型量表的其他轻量级模型的SR性能更好。
摘要 — 扩散加权磁共振成像 (DW-MRI) 可用于表征神经组织的微观结构,例如通过纤维追踪以非侵入性方式描绘脑白质连接。高空间分辨率的磁共振成像 (MRI) 将在以更好的方式可视化此类纤维束方面发挥重要作用。然而,获得这种分辨率的图像是以更长的扫描时间为代价的。由于患者的心理和身体状况,较长的扫描时间可能与运动伪影的增加有关。单图像超分辨率 (SISR) 是一种旨在从单个低分辨率 (LR) 输入图像中获得高分辨率 (HR) 细节的技术,通过深度学习实现,是本研究的重点。与插值技术或稀疏编码算法相比,深度学习从大数据集中提取先验知识并从低分辨率对应物中生成优质的 MRI 图像。在这项研究中,提出了一种基于深度学习的超分辨率技术,并已应用于 DW-MRI。 IXI 数据集中的图像已被用作地面实况,并被人工下采样以模拟低分辨率图像。所提出的方法在统计上比基线有显著的改进,并实现了 0.913±0.045 的 SSIM。索引术语 — 超分辨率、深度学习、DWI、DTI、MRI
摘要。胸肌分割是乳腺磁共振成像(MRI)的各种计算机辅助应用中的关键步骤。由于胸部和乳房区域之间的伪影和同质性,胸肌边界估计并不是一项琐碎的任务。在本文中,提出了一种基于深度学习的全自动分割方法,以准确描述轴向乳房MR图像中的胸肌边界。提出的方法涉及两个主要步骤:胸肌分割和边界估计。对于胸肌分割,基于U-NET结构的模型用于从输入图像中分离胸肌。接下来,通过候选点检测和轮廓分割来估计胸肌边界。使用两个Real-World数据集,我们自己的私人数据集和一个公开可用的数据集对所提出的方法进行了定量评估。第一个数据集包括12名患者乳房MR图像,第二个数据集由80名患者乳房MR图像组成。所提出的方法在第一个数据集中达到了95%的骰子得分,第二个数据集的骰子得分为89%。在大规模定量乳房MR图像上评估该方法的高分割性能表达了其在将来的乳腺癌临床应用中的潜在适用性。
Methods: This paper aims at the problem of target detection of Yunnan Xiaomila under complex background environment, in order to reduce the impact caused by the small color gradient changes between xiaomila and background and the unclear feature information, an improved PAE-YOLO model is proposed, which combines the EMA attention mechanism and DCNv3 deformable convolution is integrated into the YOLOv8 model, which improves the model ' s feature extraction capability and小米在复杂环境中的推理速度,并实现了轻巧的模型。首先,EMA注意机制与Yolov8网络中的C2F模块结合使用。C2F模块可以很好地从输入图像中提取本地特征,而EMA注意机制可以控制全局关系。两者相互补充,从而增强了模型的表达能力;同时,在骨干网络和头网络中,引入了DCNV3卷积模块,该模块可以根据输入特征映射自适应地调整采样位置,从而有助于针对不同尺度和轻量级网络的目标目标更强的功能捕获功能。它还使用深度摄像头来估计小米的姿势,同时分析和优化不同的遮挡情况。通过消融实验,模型比较实验和态度估计实验验证了所提出的方法的有效性。