摘要:表面裂纹是高速导轨(HSR)平板轨道中的典型缺陷,可以导致结构性恶化并降低轨道系统的服务可靠性。但是,如何有效检测和量化表面裂纹的问题目前尚未解决。在本文中,采用了一种基于红外热成像的新型裂纹检测方法来量化轨道板板上的表面裂纹。在这种方法中,首次使用非缩放的Contourlet变换(NSCT)基于图像 - 增强算法处理的红外摄像头的轨道平板的热合器,并且裂缝是通过边缘检测算法的。接下来,为了定量检测表面裂纹,提出了一种像素安排方法,从而可以获得裂纹宽度,长度和面积。最后,在实验室测试中验证了所提出方法在不同温度下的检测准确性,在该测试中,倒入平板的比例模型,并使用温度控制的柜子来控制温度变化过程。结果表明,所提出的方法可以有效地增强图像中表面裂纹的边缘细节,并且可以有效地提取裂纹区域。裂纹宽度的量化的准确性可以达到99%,而裂纹长度和面积的量化的准确性为85%,这基本上满足了HSR-SLAB-TRACK-TRACK-TRACK检查的要求。这项研究可以打开基于IRT的轨道板检查在HSR操作中的可能性,以提高缺陷检测的效率。
人工智能是在我们的生活中互动、理解和使用的许多不同技术之一 [1-4]。机器学习和自然语言处理等技术都是人工智能领域的一部分。每一种技术都在沿着自己的道路发展,当与数据、分析和自动化结合使用时,可以帮助企业实现目标,无论是改善客户服务还是优化供应链(Afraa Z. Attiah、Enas F. Khairullah[1])。人机交互是人工智能的一部分,人工智能是一个新兴技术领域,专注于设计和增强人机交互过程。人机交互广泛应用于许多领域,如医疗技术、机器人技术、城市设计、游戏和辅助技术,如巴西 Chambayil、Rajesh Singla、R Jha [2] 所示。人工智能在图像处理和面部识别方面发挥着重要作用,能够检测和识别图像和视频中的物体和图案。眼动追踪系统可以采用不同类型的图像处理 [1]。图像或图像序列包括输入数据,这些数据首先被获取并转换为数字形式。要执行下一个操作,必须增强图像,这可以通过应用不同的数学运算来实现。有许多系统,包括基于人类眼球运动和眨眼的应用程序。对眼球追踪系统的需求巨大,尤其是对于因受伤、生病或疾病而导致严重运动障碍的人[4]。该系统致力于缓解他们的残疾症状并创建自我表达工具。这项技术旨在减轻
放射疗法对于癌症治疗至关重要,但是由于基础设施和劳动力短缺,通道仍然有限。在放射学工作流程中人工智能(AI)的整合具有提高效率并提高患者结果的潜力。本综述分析了AI应用在放射肿瘤学中的当前格局,重点是治疗过程的各个阶段,包括决策,治疗计划和质量保护和质量评估。我们评估了AI技术的功能,尤其是深度学习算法,在自动化任务(例如图像分割和剂量优化)中。调查结果表明,通过促进自动肿瘤描述并增强图像注册过程,AI可以显着提高治疗计划的准确性和一致性。此外,AI驱动的预测模型在预测治疗反应和优化针对单个患者解剖学的辐射剂量方面显示出了希望。然而,这些技术的临床采用受到挑战的阻碍,包括AI算法的黑盒性质,对广泛验证的需求以及对数据隐私的担忧。当AI革新辐射肿瘤学的潜力是显而易见的,但在发生广泛实施之前,必须解决重大的障碍。未来的努力应着重于开发可解释的AI系统,建立强大的验证框架,并将AI工具集成到现有的临床工作流程中,以提高全球癌症护理的质量。
夜间摄影经常在低光和模糊之类的挑战中挣扎,源于黑暗的环境和长时间的暴露。当前方法要么无视Pri-ors,直接拟合端到端网络,导致不稳定的照明,要么依靠不可靠的手工制作的先验来限制网络,从而为最终结果带来了更大的错误。我们相信,数据驱动的高质量先验的力量,并努力在事先提供可靠和同意的情况下,规避了手动先验的限制。在本文中,我们提出了使用矢量量化的代码书(VQCNIR)更清晰的夜间图像修复,以实现对现实世界和合成基准测试的重新恢复结果。为了确保忠实地恢复细节和照明,我们提出了两个基本模块的合并:自适应照明增强仪(AIEM)和可变形的双向交叉注意(DBCA)模块。AIEM利用了功能与动态照明功能和高质量代码簿功能之间的一致性的通道间相关性。同时,DBCA模拟通过双向交叉注意和可变形的会议有效地整合了纹理和结构信息,从而增强了平行解码器之间的细粒细节和结构性保真度。广泛的实验验证了VQCNIR在弱光条件下增强图像质量的显着好处,展示了其在合成和实际数据集中的最新性能。该代码可在https://github.com/alexzou14/vqcnir上找到。
摘要:数据增强对于像素的注释任务(如语义分割)至关重要,在语义分段中,标签会重大努力和大量劳动。传统方法,涉及简单的转换,例如旋转和翻转,创建新图像,但通常沿关键语义维度缺乏多样性,并且无法改变高级语义属性。为了解决这个问题,生成模型已成为通过生成合成图像来增强数据的有效解决方案。可控的生成模型通过使用提示和来自原始图像的视觉引用为语义分割任务提供数据增强方法。但是,这些模型在生成合成图像时面临挑战,这些图像由于难以创建有效的提示和视觉参考而准确地反映原始图像的内容和结构。在这项工作中,我们引入了使用可控差异模型进行语义分割的有效数据增强管道。我们提出的方法包括使用类别附加和视觉事先融合的类别添加的有效及时生成,以增强对真实图像中标记的类的关注,从而使管道能够生成精确数量的增强图像,同时保留分割标记的类的结构。此外,我们在合成和原始图像合并时实现了平衡算法的类平衡算法。对Pascal VOC数据集的评估,我们的管道证明了其在生成语义分割的高质量合成图像方面的有效性。我们的代码可在此HTTPS URL上找到。
Santosh Kumar Hcltech,美国公司,摘要:小儿肺炎是全球发病率和死亡率的主要原因,需要准确及时诊断。 本研究探讨了使用胸部X光片对生成AI的应用对小儿肺炎进行分类。 利用深度学习技术,包括生成对抗网络(GAN)和变异自动编码器(VAE),我们增强了图像质量,生成合成训练数据并提高模型的通用性。 所提出的框架集成了AI驱动的特征提取,卷积神经网络(CNN)和注意机制,以提高诊断精度。 与传统方法相比,结果表现出分类性能的显着改善,重点是解释性和临床可用性。 关键字:生成AI,小儿肺炎,胸部X光片,卷积神经网络(CNN),生成对抗网络(GAN),数据增强,医学图像分类,肺炎诊断,深度学习,合成数据。 引言肺炎仍然是全球儿童死亡率的主要原因,并且必须通过胸部X光片进行准确的诊断。 但是,放射线解释的可变性和对专家放射科医生的访问有限的挑战。 生成的AI通过生成高质量的合成图像来提供一种变革性的方法,以用于模型训练和增强图像清晰度。 本研究研究了AI在肺炎分类中的作用,解决数据稀缺,改善模型概括并降低误诊率。Santosh Kumar Hcltech,美国公司,摘要:小儿肺炎是全球发病率和死亡率的主要原因,需要准确及时诊断。本研究探讨了使用胸部X光片对生成AI的应用对小儿肺炎进行分类。利用深度学习技术,包括生成对抗网络(GAN)和变异自动编码器(VAE),我们增强了图像质量,生成合成训练数据并提高模型的通用性。所提出的框架集成了AI驱动的特征提取,卷积神经网络(CNN)和注意机制,以提高诊断精度。与传统方法相比,结果表现出分类性能的显着改善,重点是解释性和临床可用性。关键字:生成AI,小儿肺炎,胸部X光片,卷积神经网络(CNN),生成对抗网络(GAN),数据增强,医学图像分类,肺炎诊断,深度学习,合成数据。引言肺炎仍然是全球儿童死亡率的主要原因,并且必须通过胸部X光片进行准确的诊断。但是,放射线解释的可变性和对专家放射科医生的访问有限的挑战。生成的AI通过生成高质量的合成图像来提供一种变革性的方法,以用于模型训练和增强图像清晰度。本研究研究了AI在肺炎分类中的作用,解决数据稀缺,改善模型概括并降低误诊率。生成模型与深度学习分类器的整合确保了小儿肺炎检测的稳健性和可靠性。方法论,本研究采用了混合AI框架,该框架结合了生成的对抗网络(GAN)和变异自动编码器(VAE),以进行数据增强,然后进行卷积神经网络(CNN)和基于变压器的分类器进行肺炎分类。
脑瘤是组织异常生长,其生长不受控制,不受控制细胞正常生长的检查点的制约。脑瘤可以是原发性的,也可以是转移性的。从身体其他部位扩散到大脑的肿瘤被称为转移性肿瘤。脑瘤是儿童和成人死亡的可能原因之一。在儿童中,脑瘤是所有癌症死亡的四分之一的原因。英国每年诊断出大约 200 种不同类型的肿瘤。医学共振成像是一种先进的成像技术,用于获取身体不同部位的高质量图像。MRI 用于大脑发育和大脑异常的解剖分析(Logeswari 和 Karnan 2009)。这些 MRI 图像经过预处理,以便可以对这些图像执行进一步的形态学操作,以检测肿瘤的大小、形状和位置。MRI 图像的预处理是为了去除噪音和增强图像,而形态学操作则使用 MATLA B 算法来分离和检测脑中的肿瘤(Murugavalli 和 Rajamani 2007)。分割的最终目的是从图像数据中提取重要特征。从脑部 MRI 图像中分割肿瘤是一个耗时的过程(Toure、Beiji 等,2010 年)。MATLAB 是一种快速算法,用于在很短的时间内从 MRI 图像中检测肿瘤。最后,将肿瘤映射到原始灰度图像上,强度为 255,使肿瘤在图像中可见。收到(2017 年 8 月 10 日),审核结果(2017 年 11 月 5 日),接受(2017 年 11 月 20 日)
摘要:水下图像遭受颜色失真和细节的损失,这严重影响了水下机器人的视觉感知能力。为了提高检测准确性,提出了一个多任务学习框架,以基于对比度学习的水下图像增强和对象检测提出了多任务学习框架,这不仅会产生视觉上友好的图像,还可以提高对象检测精度,从而实现对象检测任务的图像增强图像。为了解决不清楚目标纹理特征的问题,用于检测任务的区域生成模块用于构建用于对比性学习的正面和负面图像块,以确保目标区域更接近特征空间中的原始图像。此外,检测到的梯度信息用于指导图像增强方向,有益于目标检测。此外,提出了一种基于循环生成对抗网络的图像翻译方法来学习和保留图像增强的清晰图像特征,从而消除了对配对的水下图像的需求并减少了数据要求。最后,在EUVP,U45和UIEB数据集上对增强算法进行了验证,并且在RUOD,URPC2020和RUIE数据集上验证了检测算法。实验结果表明,所提出的算法可以在主观视觉中有效纠正颜色失真,同时保留原始图像和目标的结构纹理。就客观指标而言,峰值信噪比达到24.57 dB,结构相似性达到0.88。在更快的R-CNN(基于区域的卷积神经网络)和Yolov7(您只看一次,版本7)算法后,检测精度平均提高了2%。关键字:水下图像增强;对比学习;循环生成对抗网络;对象检测
摘要。本文研究了无源域的自适应基础分段,旨在使用未标记的图像将经过预告片的眼底分割模型调整为目标域。这是一项具有挑战性的任务,因为仅使用未标记数据调整模型是高度风险的。大多数现有方法主要是通过设计技术来仔细生成模型预测的伪标签并使用伪标签来训练模型来解决此任务。在经常获得正适应作用的同时,这些方法与两个主要问题有关。首先,它们往往相当不稳定 - 不正确的伪标签突然出现可能会对模型产生灾难性影响。第二,他们无法考虑前景(例如,杯子)区域通常很小的眼底图像的严重阶级失衡。本文旨在通过提出级别平衡的平均教师(CBMT)模型来解决这两个问题。CBMT通过提出一个弱小的卑鄙的教师学习计划来解决不稳定的问题,在该计划中,只有教师模型才能从弱增强的图像中生成伪标签,以训练学生模型以强烈的增强图像作为输入。教师被更新为训练有素的学生的平均值,这可能很吵。这阻止了教师模型突然受到伪标签的突然影响。对于类不平衡问题,CBMT提出了一种新型的损失校准方法,以根据全球统计数据突出前景类别。实验表明,CBMT很好地解决了这两个问题,并且在多个基准测试中的现有方法优于现有方法。
摘要。目的:这项工作旨在应用量子希尔伯特(Hilbert)争夺,以增强图像水印的安全性和完整性,而不会影响视觉质量退化。对被调查方法的进一步概念可能会为传统的水印方法提供一个很好的解决方案,以通过新的量子计算概念解决数字图像安全性和完整性的一些问题。方法:本文回顾了量子希尔伯特(Hilbert)争夺,其计算复杂性为𝑂(𝑛22 2)。该过程涉及将图像编码为量子状态,并用希尔伯特曲线置换量子,并使用量子门嵌入水印。结果:定量性能评估指标,例如峰信号与噪声比(PSNR)和结构相似性指数(SSIM),显示出高峰信号与噪声比(PSNR)值的高峰值信号(PSNR)值,从56.13 dB到57.87 db至57.87 db,结构相似性指数(SIM)(SSIM)(SIM)(SIM)(SIM)(SIM)(SIM)来自0.9985至0.985至0.999990,相应地愿意。这证明了质量降解非常小,结构的细节得到很好的维护。新颖性:所提出的方法将量子计算与传统水印步骤集成在一起,以在数字水印中采用安全有效的方法。进一步的开发应集中于改善有关计算效率的量子电路,将方法的适用性扩展到广泛的图像上,以及在水印中的各种情况,并通过结合量子和经典方法来提高性能和可伸缩性,以找到混合方法。关键字:希尔伯特(Hilbert)争夺,图像水印,量子希尔伯特(Hilbert)争夺,2024年7月收到的绩效测量 / 2024年10月修订 / 2024年11月接受的这项工作已在创意共享4.0国际许可下获得许可。