持续学习(CL)构成了深层神经网络(DNN)的重大挑战,这是由于灾难性的忘记在引入新的任务时对先前获得的任务的灾难性忘记。人类在学习和适应新任务的情况下擅长而无需忘记,这是通过大脑中的融合学习系统归因于抽象体验的彩排的能力。这项研究旨在复制和验证Birt的发现,Birt的发现是一种新型方法,利用视觉变压器来增强表示练习的代表性,以进行持续学习。birt在视觉变压器的各个阶段引入了建设性噪声,并与工作模型的指数移动平均值(以减轻过度拟合并增强鲁棒性)相加。通过复制Birt的方法,我们试图验证其声称的改善,比传统的原始图像排练和香草代表对几个具有挑战性的CLENCHM分析进行排练。此外,这项研究还研究了Birt对自然和对抗性腐败的记忆效率和稳健性,旨在增强其实际适用性。复制将提供对原始论文中介绍的思想的可这种可总合性和普遍性的关键见解。
摘要:本文收集了两种类型的医学图像,它们来自 CT 扫描和超声系统,目的是在保持图像质量的情况下减少表示医学图像所需的位数。医学成像对疾病诊断和手术准备有很大影响。另一方面,由于医学图像数据量巨大,存储和传输是一个重要问题。例如,每张 CT 图像切片为 512 x 512,数据集由 200 到 400 张图像组成,平均数据量为 150 MB。对医学数据进行有效压缩可以解决存储和传输问题。医学图像使用提出的算法进行压缩,该算法包括两种技术,即离散余弦变换 DCT 和矢量量化 VQ。本文从收集医学图像开始,使用 MATLAB 通过 DCT-QV 开发压缩算法,并通过使用峰值信噪比 PSNR、均方误差 MSE、压缩比 CR 和每像素比特 BPP 测量原始图像和压缩图像之间的差异来评估这些技术的性能。实验结果表明,所提算法压缩后的图像质量较高,量化水平达到30%以上,压缩率达到可接受水平。
摘要。朦胧的图像带来了一个具有挑战性的问题,由于信息丢失和颜色失真而遭受。当前的基于深度学习的去悬式方法通过增加网络深度来增强性能,但会导致大量参数开销。同时,标准卷积层集中在低频细节上,通常会说出高频信息,这阻碍了模糊图像中提出的先前信息的有效利用。在本文中,我们提出了TCL-NET,这是一个轻巧的飞行网络,该网络强调了频域特征。我们的网络首先包含一个用于提取高频和低频内形式的所谓层,该层是针对原始模糊图像的快速变压器专门设计的。同时,我们设计了一个频率域信息融合模块,该模块将高频和低频信息与后续卷积层的卷积网络作品集成在一起。此外,为了更好地利用原始图像的空间信息,我们引入了一个多角度注意模块。使用上述设计,我们的网络以仅0.48MB的总参数大小实现了出色的性能,与其他最先进的轻量级网络相比,参数的数量级降低了。
参赛者必须是任何图像及其所有零件的作者。作者必须“拍摄”图像或图像的所有部分。“内容意识填充”或完全基于原始图像中像素的类似修改,并且不会将图像扩展到其原始边界之外的图像是“可接受的”。“生成填充”或使用由书面提示或其他人开发的软件生成的内容的其他过程是“不可接受的”。问题:“我可以在图像中使用生成填充或类似物来创建或删除对象(人,动植物,建筑物,风景效果等)吗?” •如果您使用从书面提示中生成的软件或从他人的工作中开发的内容,则不允许。例如: - 可以允许删除被现有相关图像替换的“不必要的”树。- 不允许删除一个人并用“狗上的狗”代替他们。删除现有的灌木场景的背景并使用要求添加“海滩背景场景”的文本是不允许的。- 使用生成填充以“将瀑布添加到瀑布不属于摄影师拍摄的图像的一部分的场景中。- 将夏季的场景变成一个冬季场景,该场景引入了摄影师拍摄的一部分的雪,这是不允许的。
我们解决了在应用程序中捕获的图像(相机)捕获到云的应用程序中的隐私问题,以推断出诸如分类之类的实用程序任务。将原始图像发送到云中,使它们暴露于数据嗅探,并被不受信任的第三方服务提供商滥用,超出了用户的预期任务。我们提出了一个编码方案,该方案不仅可以直接远程视觉检查到图像或图像重建,还可以防止确定敏感信息。与常用的对抗性学习方法不同,所提出的方法是两个方面:首先,它使用衍射光学神经网络将与光学域中传感器平面上不同任务相对应的空间分开。然后只读取与实用程序任务区域相对应的像素。此编码可确保绝不会将私人功能存储在边缘设备上,从而防止隐私泄漏。所提出的方法成功地减少了二进制任务中的隐私检索,其准确性损失最小(约2%),同时将私人任务准确性降低了约35%,并防止SSIM得分为0的重建攻击。43。
艺术图像的抽象风格转换是当前图像处理字段的重要组成部分。为了访问样式图像的美学艺术表达,最近的研究将注意机制应用于样式转移领域。这种方法通过计算注意力然后通过解码器迁移图像的艺术风格来将样式图像转换为令牌。由于原始图像和样式图像之间的语义相似性非常低,因此导致许多细粒度的样式特征被丢弃。这可能导致不一致的人工制品或明显的文物。为了解决这个问题,我们提出了MCCSTN,这是一种新型样式表示和转移框架,可以适应现有的任意图像样式转移。具体来说,我们首先将功能融合模块(MCCFORMER)引入样式图像中的美学特征,并在内容图像中具有细粒度的特征。特征地图是通过MCCFORMER获得的。然后将功能图馈入解码器以获取我们想要的图像。为了减轻模型并迅速训练,我们考虑了特定样式与整体样式分布之间的关系。我们引入了一个多尺度的增强对比模块,该模块从大量图像对中学习了样式代表。代码将发布在https://github.com/haizhu12/mccstn
摘要。合成的多光谱卫星图像的产生尚未达到其他领域中可达到的质量水平,例如面部图像的产生和操纵。难度的一部分源于需要在此类图像覆盖的整个电磁频谱上生成一致的数据,该图像的辐射分辨率高于多媒体应用中通常使用的图像。与不同波长相对应的图像带的不同空间分辨率提出了其他问题,其主要效果是相对于原始图像,在合成图像中缺乏空间细节。我们建议通过将样式传输应用于13波段Sentinel-2 Level1-C图像,明确认为基于生成的对抗网络的建筑可以生成合成卫星图像。为避免丢失更细的空间细节并改善生成的图像的清晰度,我们引入了一种类似Pansharpening的方法,从而将输入图像的空间结构转移到了样式转移的图像的情况下,而无需引入可见的文物。我们通过应用所提出的架构将贫瘠的图像转化为植被图像,反之亦然,从而得到的结果(res。冬季)图像进入冬季(res。夏季图像,确认了提出的解决方案的有效性。
摘要 偏置场作为一种低频平滑信号,对磁共振(MRI)图像具有一定的破坏作用,是医生诊断和图像处理(如分割、纹理分析、配准等)的主要障碍。在分析受损的MRI图像之前,需要一个预处理步骤来校正图像中的偏置场。与传统基于信号模型和先验假设的偏置场去除算法不同,深度学习方法不需要对信号和偏置场进行精确建模,也不需要调整参数。经过深度神经网络训练大训练集后,输入带有偏置场的MRI图像,输出校正后的MRI图像。本文提出以log-Gabor滤波器组获得的多个频带上的偏置场局部特征图像和原始图像作为输入,通过深度可分离卷积神经网络对脑MRI图像的偏置场进行校正,并使用残差学习和批量归一化来加速训练过程并提高偏置场校正性能。我们的训练模型在 BrainWeb 模拟数据库和 HCP 真实数据集上进行了测试,定性分析的结果表明我们的训练模型取得了比传统最先进的 N4 和 NIMS(非迭代多尺度)方法更好的性能。关键词:磁共振成像;强度不均匀性校正;偏置场;Log-Gabor 滤波器;深度学习
我致力于医疗应用的机器学习,重点是神经科学和神经病学应用程序。我梦想着有一天,机器人和算法将能够理解,预防和解决人类疾病,从而为所有人提供最高质量的医疗保健。AI和机器学习(ML)算法已经被证明用于放射学,药物设计,测试和重新定位,蛋白质预测,图像引导的干预措施,例如放射治疗,健康监测系统以及通过图像分析模型支持的人群研究的疾病理解。然而,由于这些医疗问题构成的独特挑战,结合了医疗系统的复杂性,此类ML系统尚未准备好以更广泛的范围采用。我的工作[1-12]专注于新颖的ML模型以及此类模型来解决重要的医疗问题,最终导致了它们在世界各地的医疗保健系统中的采用。在理论方面,我专注于生成模型,基于(i)贝叶斯时间序列框架,这些框架估算了结构化数据的连续疾病演变,以及(ii)在原始图像上运行的深度学习方法。这些理论模型是通过对阿尔茨海默氏病进展的估计来激发的,阿尔茨海默氏病的进展是一种关键的神经退行性疾病,影响了全球5000万人。在我的研究中,我试图找到以下问题的答案:
摘要:最近,人工智能生成图像质量评估(AIGCIQA)已成为计算机视觉领域的一个新课题,旨在从人类感知的角度评估人工智能生成的图像(AIGI)的质量。与常见的图像质量评估任务(其中图像来自受噪声、模糊和压缩等扭曲的原始图像)不同,在 AIGCIQA 任务中,图像通常由使用文本提示的生成模型生成。过去几年,人们做出了相当大的努力来推进 AIGCIQA。然而,大多数现有的 AIGCIQA 方法直接从单个生成的图像中回归预测分数,忽略了这些图像的文本提示中包含的信息。这种疏忽部分限制了这些 AIG-CIQA 方法的性能。为了解决这个问题,我们提出了一个基于文本图像编码器的回归(TIER)框架。具体而言,我们将生成的图像及其相应的文本提示作为输入,利用文本编码器和图像编码器分别从这些文本提示和生成的图像中提取特征。为了证明我们提出的 TIER 方法的有效性,我们在几个主流 AIGCIQA 数据库上进行了广泛的实验,包括 AGIQA-1K、AGIQA-3K 和 AIGCIQA2023。实验结果表明,我们提出的 TIER 方法在大多数情况下通常比基线表现出更好的性能。代码将在 https://github.com/jiquan123/TIER 上提供。