摘要 —随着半导体设计和制造工艺的全球化,集成电路制造阶段的缺陷检测需求变得越来越重要,在提高半导体产品的产量方面发挥着重要作用。传统的晶圆图缺陷模式检测方法涉及使用电子显微镜进行手动检查以收集样本图像,然后由专家评估缺陷。这种方法劳动密集且效率低下。因此,迫切需要开发一种能够自动检测缺陷的模型来替代手动操作。在本文中,我们提出了一种方法,该方法首先采用预先训练的 VAE 模型来获取晶圆图的故障分布信息。该信息作为指导,结合原始图像集进行半监督模型训练。在半监督训练期间,我们利用师生网络进行迭代学习。本文提出的模型在基准数据集 WM-811K 晶圆数据集上进行了验证。实验结果表明,与最先进的模型相比,该模型具有更高的分类精度和检测性能,满足了工业应用的要求。与原始架构相比,我们取得了显着的性能提升。索引术语——缺陷检测;半监督学习;无监督学习;变异自动编码器
摘要。过程自动化的主要目标是提高过程执行的质量和生产率。与手动执行的过程相比,自动化过程具有更稳定的特性。自动化工具之一是人工智能,尤其是计算机视觉。计算机视觉(也称为机器视觉)是人工智能和相关技术领域的科学趋势,用于获取现实世界对象的图像,处理它们并使用所获得的数据来求解各种无(全部或部分)人参与的应用程序。从工程的角度来看,计算机视觉试图自动化人类视觉系统可以执行的任务。计算机视觉任务包括获取,处理,分析和理解数字图像的方式,并从现实世界中提取数据以产生数值或符号信息。在作物耕作的背景下,自动化主要能够通过更好地控制环境条件并及时检测植物和成果的任何异常,通过替换各种更准确和响应式自动化系统(例如,例如在论文中,设计信息系统的主要目标是植物果实的数字图像中的识别,并根据已知的颜色范围提前进行分类。为了实现此目标,应解决以下任务:最小化原始图像扭曲的可能负面影响;分析图像以查找上面的番茄水果。
摘要:计算机技术的最新开发可能导致量子图像算法成为热点。量子信息和计算给出了我们的量子图像算法的一些优势,这些算法处理了原始经典图像算法无法解决的有限问题。图像处理为量子图像的应用而哭泣。量子图像上的大多数作品都是理论上的,有时甚至是未抛光的,尽管量子计算机中的现实世界实验已经开始并正在繁殖。但是,正如计算机技术的开发有助于推动技术革命一样,从量子力学,量子信息和极其强大的计算机上提出了一种新的量子图像算法。引入了量子图像表示模型来构建图像模型,然后将其用于图像处理。为了重建或估计点扩散函数,采用了先验知识,并根据相反的处理获得非分类估计。使用最佳的平滑度度量来解决噪声的模糊功能。在约束条件上,确定最小标准函数并估计原始图像函数。对于某些运动模糊和某些噪声污染(例如高斯声音),所提出的算法能够产生更好的恢复结果。另外,应该注意的是,当存在噪声强度非常低的噪声攻击时,基于约束最小二乘过滤的模型仍然可以带来良好的恢复结果,并且具有很强的鲁棒性。随后,讨论实现量子电路和图像过滤的复杂性的仿真分析,并证明当噪声密度较小时,该算法对模糊恢复具有良好的影响。
摘要。珊瑚礁是重要的生态系统,由于当地人类的影响和气候变化,其威胁越来越大。对珊瑚礁的有效,准确的监测对于它们的保护和管理至关重要。在本文中,我们提出了一个自动珊瑚检测系统,该系统只能使用一次(YOLO)深度学习模型,该模型是专门针对水下进化分析量身定制的。要训练和评估我们的系统,我们采用了一个由400个原始水下图像组成的数据集。,我们使用数据增强技术通过图像操纵将带注释的图像的数量增加到580,这可以通过提供更多样化的训练示例来改善模型的性能。数据集是从捕获各种珊瑚礁环境,物种和照明条件的水下视频中仔细收集的。我们的系统可以实现Yolov5算法的实时对象检测功能,从而实现有效而准确的珊瑚检测。我们使用Yolov5从带注释的数据集中提取区分特征,从而使系统能够概括,包括以前看不见的水下图像。在我们的原始图像数据集上,使用Yolov5成功实施了自动珊瑚检测系统,突出了先进的计算机视觉技术在珊瑚礁研究和保护中的潜力。进一步的研究将着重于完善算法以处理具有挑战性的水下图像条件,并扩展数据集以结合更广泛的珊瑚种类和时空变化。
摘要:当前的图像生成模型已经实现了非常现实的图像质量,提供了许多学术和工业应用。但是,为了确保这些模型用于良性目的,必须开发最终检测图像是否已合成生成的工具。因此,已经开发了几个在计算机视觉应用中表现出色的检测器。但是,这些检测器不能直接应用,因为它们是多光谱卫星图像,因此需要对新模型进行训练。虽然两类分类器通常达到高检测精度,但它们努力将图像域和与训练过程中遇到的形象不同的生成体系结构推广。在本文中,我们提出了一个基于量化量化的变异自动编码器2(VQ-VAE 2)功能的单级分类器,以克服两类分类器的局限性。我们首先要突出二进制分类器所面临的概括问题。通过在多个多光谱数据集中训练和测试有效网络架构来证明这一点。然后,我们说明,基于VQ-VAE 2的分类器,该分类器仅在原始图像上进行了培训,可以检测来自不同领域的图像,并由训练过程中未遇到的体系结构生成。最后,我们在同一生成的数据集上的两个分类器之间进行了面对面的比较,强调了基于VQ-VAE 2的检测器的出色概括能力,在使用vQ-ve-vae 2的探测器时,我们在使用蓝色和红色通道的0.05误报率为1时以1.05的误报率进行了检测。
脑肿瘤对大多数患者来说是致命的,肿瘤细胞的不同性质需要使用综合医疗措施,对此类肿瘤进行分类对放射科医生来说是一项艰巨的任务。基于 PC 的诊断结构已被用于辅助使用磁共振成像 (MRI) 诊断脑肿瘤。从神经网络的最低层检索一般功能,这些最低层负责捕获原始输入数据中的低级特征和模式,这些特征和模式对于原始图像来说可能是特别独特的。为了验证这一点,EfficientNetB3 预训练模型用于对三种类型的脑肿瘤进行分类:神经胶质瘤、脑膜瘤和垂体瘤。首先,从预训练的 EfficientNetB3 版本中获取几个 EfficientNet 模块的特征来定位脑肿瘤。使用三种类型的脑肿瘤数据集来评估每种方法。与现有的深度学习模型相比,EfficientNetB3 和遗传算法的连接函数具有更高的准确性。还采用了 Tensor Flow 2 和 Nesterov 加速自适应矩估计 (Nadam) 来改进模型训练过程,使其更快、更好。所提出的使用 CNN 的技术达到了 99.56% 的准确率、98.9% 的灵敏度、98.6% 的特异性、98.9% 的 F 分数、98.9% 的精确度和 99.54% 的召回率。
我们提出了 MindEye,一种新颖的 fMRI 到图像方法,用于从大脑活动中检索和重建所看到的图像。我们的模型包含两个并行子模块,专门用于检索(使用对比学习)和重建(使用扩散先验)。MindEye 可以将 fMRI 大脑活动映射到任何高维多模态潜在空间,如 CLIP 图像空间,从而能够使用接受来自该潜在空间的嵌入的生成模型进行图像重建。我们使用定性的并排比较和定量评估,将我们的方法与其他现有方法进行了全面比较,并表明 MindEye 在重建和检索任务中都达到了最先进的性能。特别是,即使在高度相似的候选图像中,MindEye 也可以检索出精确的原始图像,这表明它的大脑嵌入保留了细粒度的图像特定信息。这使我们能够准确地从 LAION-5B 等大型数据库中检索图像。我们通过消融证明,Mind-Eye 的性能优于以前的方法,这得益于专门用于检索和重建的子模块、改进的训练技术以及具有更多数量级参数的训练模型。此外,我们还表明,通过使用 img2img,MindEye 可以更好地保留重建中的低级图像特征,并使用单独的自动编码器进行输出。所有代码均可在 GitHub 上找到。
可变形图像注册对于临床诊断,治疗计划和手术导航至关重要。但是,大多数现有的注册解决方案都需要在可变形注册之前单独的刚性对准,并且可能无法满足较大的变形情况。我们提出了一个新型的边缘感知金字塔变形网络(称为EPREG),用于无监督的体积登记。特别是,我们建议从多级特征金字塔中充分利用有用的互补信息,以预测多尺度的位移场。这样的粗到细节估计促进了预测的注册场的进行性重新确定,这使我们的网络能够处理体积数据之间的大变形。此外,我们将边缘信息与原始图像作为双输入集成在一起,从而增强了图像内容的纹理结构,以促使所提出的网络额外注意以进行结构对齐的边缘感知信息。在包括MindBoggle101,LPBA40和IXI30在内的三个公共大脑MRI数据集上对我们的EPREG的效率进行了广泛的评估。实验证明,相对于骰子指数(DSC),Hausdorff距离(HD)和平均对称的表面距离(ASSD)的指标,我们的EPREG始终优于几种尖端方法。提出的EPREG是解决可变形体积登记问题的一般解决方案。
摘要 人类神经系统的主要器官是位于头部并被头骨覆盖的大脑。人脑的功能是控制人体的各个部位。它是一种可以协调其他器官并为它们分配职责的附属物。图 1.1 显示了人脑的一般部分,而人脑的主要部分是脑干和大脑。大脑是大脑的最大部分。大脑可以负责情绪。大脑有两个半球,控制身体的另一侧。每个半球都包含四个脑叶。小脑占据小脑旁边的主要部分。近年来,脑肿瘤检测和分割引起了研究领域的兴趣。由于人体体格具有自然的解剖结构,因此识别和分割脑肿瘤的过程是一项非常繁琐且耗时的任务。该项目的主要目标是检测脑肿瘤,本研究提出了一种使用卷积神经网络对脑肿瘤进行分割和识别的计算机化方法。使用文件路径从本地设备读取输入的 MRI 图像并将其转换为灰度图像。使用自适应双边滤波技术对这些图像进行预处理,以消除原始图像中的噪声。对去噪图像应用二值阈值,并应用卷积神经网络分割,这有助于找出 MRI 图像中的肿瘤区域。所提出的模型获得了 84% 的准确率,并产生了令人满意的结果,没有任何错误,而且计算时间要少得多。
摘要 - 在这项研究中,一种新方法正在引起编码2D和3D颜色图像。将DNA链构造用作结构该方法的基础。此方法由两个主要阶段组成,即加密和解密阶段。每个阶段都包含多个操作,以达到所需的目标。在编码阶段,准备了一张特别的表格,以显示工作的机构。首先将DNA碱基编码为两个二进制订单,然后将两个零添加到字符串中,最终由四个二进制位组成,它们的大小与在二进制中表示的一组十六进制数字平行,然后在其中进行XOR操作,然后在两个值之间完成两个值,以使结果与原始代码完全不同。然后将我们获得的二进制值转换为十进制值,该值放置在阵列中,其大小与要编码的图像相同。最后,最后一个数组是用指数函数因子处理的,因此最终结果是100%编码图像。在解码阶段,构建了另一种算法,该算法反映了在加密阶段之前的工作,其中结果是原始图像的确切副本。值得注意的是,不同大小的标准图像被用作测试图像。该方法的性能评估是基于几个因素来计算的:MSE,峰值PSNR以及执行编码和解码过程所需的时间。在质量和时间方面与其他方法的结果相比,该方法获得了良好的结果。