退化现象。使用去噪技术去除图像中的噪声和使用去模糊技术去除图像中的模糊都属于图像恢复。 • 彩色图像处理:这基本上有两种类型——全彩色和伪彩色处理。在前一种情况下,图像是通过全彩色传感器(如彩色扫描仪)捕获的。全彩色处理进一步分为两类:在第一类中,每个组件被单独处理,然后形成复合处理后的彩色图像;在第二类中,我们直接操作彩色像素。伪彩色或假彩色处理涉及根据规定的标准将颜色分配给特定的灰度值或值范围。强度切片和颜色编码是伪彩色处理的技术。颜色用于图像处理是因为人类能够区分不同色调和强度与不同灰度。此外,图像中的颜色使得从场景中提取和识别物体变得容易。 • 图像压缩:这意味着通过消除重复数据来减少表达数字图像所需的信息量。压缩是为了减少图像的存储要求或减少传输期间的带宽要求。压缩是在存储或传输图像之前完成的。压缩有两种类型——有损和无损。在无损压缩中,图像的压缩方式不会丢失任何信息。但是在有损压缩中,为了实现高水平的压缩,可以接受一定量的信息丢失。前者适用于图像存档,例如存储医疗或法律记录,而后者适用于视频会议、传真传输和广播电视。无损压缩技术包括可变长度编码、算术编码、霍夫曼编码、位平面编码、LZW 编码、游程编码和无损预测编码。有损压缩技术包括有损预测编码、小波编码和变换编码。• 形态图像处理:它是一种绘制图像中可用于表示和描述图像形态、大小和形状的部分的技术。常见的形态学算子有膨胀、腐蚀、闭运算和开运算。形态学图像处理的主要应用包括边界提取、区域填充、凸包、骨架、细化、连通分量提取、加厚和剪枝。• 图像分割:这是使用自动和半自动方法从图像中提取所需区域的过程。分割方法大致分为边缘检测方法、基于区域的方法(包括阈值和区域增长方法)、分类方法(包括 K 近邻、最大似然法)、聚类方法(K 均值、模糊 C 均值、期望最大化方法)和分水岭分割 [3]。• 表示和描述:分割过程的结果是像素形式的原始数据,需要进一步压缩才能表示和描述,以便进行额外的计算机处理。区域可以用其外部特征(如边界)来表示
与从 LiDAR 数据和多视图影像重建相比,倾斜影像重建是大规模城市建模的重要研究问题和经济解决方案。然而,建筑物足迹和立面的部分不可见性、严重的阴影效应以及大范围区域内建筑物高度的极端变化等若干挑战将现有的基于单目影像的建筑物重建研究限制在某些应用场景中,即从近地面影像建模简单的低层建筑物。在本研究中,我们提出了一种新颖的单目遥感影像 3D 建筑物重建方法,解决了上述困难,从而为更复杂的场景提供了一种有吸引力的解决方案。我们设计了一个多任务建筑物重建网络 MTBR-Net,通过四个语义相关任务和三个偏移相关任务来学习倾斜影像的几何属性、3D 建筑物模型的关键组件及其关系。网络输出通过基于先验知识的 3D 模型优化方法进一步集成,以生成最终的 3D 建筑模型。在公共 3D 重建数据集和新发布的数据集上的结果表明,与目前最先进的方法相比,我们的方法将高度估计性能提高了 40% 以上,将分割 F1 分数提高了 2% - 4%。
虽然扩散模型已显着提高了图像生成的质量,但它们在这些图像中准确且相干渲染文本的能力仍然是一个重大挑战。场景文本生成的常规基于扩散的方法通常受到对中间布局输出的依赖的限制。这种依赖性通常会导致文本样式和字体的多样性限制,这是布局生成阶段的确定性质所引起的固有限制。为了应对这些挑战,本文介绍了SceneTeTgen,这是一种基于新颖的扩散模型,专门设计用于规避预定义布局阶段的需求。这样做,场景 - 文本促进了文本的更自然和多样化的代表。SceneTextGen的新颖性在于其三个关键组成部分的整体:一个字符级编码器,用于捕获详细的印刷属性,并与字符级实例分割模型和Word-
超分辨率医学图像可帮助医生提供更准确的诊断。在许多情况下,计算机断层扫描 (CT) 或磁共振成像 (MRI) 技术在一次检查期间会捕获多个扫描 (模式),这些扫描 (模式) 可以联合使用 (以多模态方式) 来进一步提高超分辨率结果的质量。为此,我们提出了一种新颖的多模态多头卷积注意模块来超分辨率 CT 和 MRI 扫描。我们的注意模块使用卷积运算对多个连接的输入张量执行联合空间通道注意,其中核 (感受野) 大小控制空间注意的减少率,卷积滤波器的数量控制通道注意的减少率。我们引入了多个注意头,每个头具有不同的感受野大小,对应于空间注意的特定减少率。我们将多模态多头卷积注意力 (MMHCA) 集成到两个深度神经架构中以实现超分辨率,并对三个数据集进行了实验。我们的实证结果表明,我们的注意力模块优于超分辨率中使用的最先进的注意力机制。此外,我们进行了一项消融研究,以评估注意力模块中涉及的组件的影响,例如输入的数量或头部的数量。我们的代码可在 https://github.com/lilygeorgescu/MHCA 免费获取。
摘要 我们计划使用 NIRSpec 积分场单元 (IFU) 拍摄真正的太阳系气态巨行星类似物、标志性的 eps Eridani b 的第一张图像和光谱。Eps Eri b 是一颗已知的径向速度行星,围绕附近的类太阳恒星 (K2V) 运行,轨道距离约为 3.5 au(周期为 7.3 年),其动态质量介于土星和木星之间(0.57-0.78 MJup),这意味着它可以直接与太阳系气态巨行星进行比较。这颗青少年(4 亿至 8 亿年)亚木星是独一无二的,因为就半长轴、质量和年龄而言,它位于凌日和直接成像的系外行星之间。到目前为止,该参数空间区域无法进行光谱表征。此外,第 3 周期是观察该行星的最佳时间,因为它处于最远的投影分离状态,这种情况每 4 年才发生一次。我们将针对这颗冷亚木星的峰值通量(~140-215 K)获得 3-5 微米的 R~2,700 光谱,并首次测量其亮度、有效温度和成分(C/H、O/H、N/S)。由于第 1 周期数据证明 NIRSpec IFU 可以达到优于 JWST 日冕仪的对比度(35 分钟内 1'' 处 1e-6),因此可以直接探测到 eps Eri b。观察描述我们建议使用 NIRSpec 积分场单元(IFU;G395H/F290LP;2.87 - 5.27 微米)拍摄 eps Eridani b 的第一张图像和高分辨率光谱(R=2,700)。
图像去雾是一种减少图像中雾霾、灰尘或雾气影响的方法,以便清晰地查看观察到的场景。文献中存在大量传统和基于机器学习的方法。然而,这些方法大多考虑可见光光谱中的彩色图像。显然,由于热红外光谱的波长较长,受雾霾的影响要小得多。但远距离观测期间的大气扰动也会导致热红外 (TIR) 光谱中的图像质量下降。在本文中,我们提出了一种为 TIR 图像生成合成雾的方法。然后,我们分析了现有的盲图像质量评估措施雾感知密度评估器 (FADE) 对 TIR 光谱的适用性。我们进一步全面概述了当前图像去雾的最新技术,并通过经验表明,许多最初为可见光图像设计的方法在应用于 TIR 光谱时表现得出奇的好。这在最近发布的 M3FD 数据集上进行的实验中得到了证实。
卫星图像处理是管理我们星球资源的强大工具之一。最近,它在应对全球挑战(例如资源管理,可持续性,气候变化,灾难管理和响应,作物监测等)等全球挑战方面非常重要。图像处理中AI技术的演变已成为处理卫星图像的动力。通过提供高级工具进行分析。FDP旨在深入了解AI在卫星图像处理及其应用中的范围和影响。
高光谱图像 (HSI) 分类旨在为每个像素分配一个唯一标签,以识别不同土地覆盖的类别。现有的 HSI 深度学习模型通常采用传统学习范式。作为新兴机器,量子计算机在嘈杂的中尺度量子 (NISQ) 时代受到限制。量子理论为设计深度学习模型提供了一种新的范式。受量子电路 (QC) 模型的启发,我们提出了一种受量子启发的光谱空间网络 (QSSN) 用于 HSI 特征提取。所提出的 QSSN 由相位预测模块 (PPM) 和受量子理论启发的类测量融合模块 (MFM) 组成,以动态融合光谱和空间信息。具体而言,QSSN 使用量子表示来表示 HSI 长方体,并使用 MFM 提取联合光谱空间特征。量子表示中使用了 HSI 长方体及其由 PPM 预测的相位。使用 QSSN 作为构建块,我们进一步提出了一种端到端的量子启发式光谱空间金字塔网络 (QSSPN),用于 HSI 特征提取和分类。在这个金字塔框架中,QSSPN 通过级联 QSSN 块逐步学习特征表示,并使用 softmax 分类器进行分类。这是首次尝试将量子理论引入 HSI 处理模型设计。在三个 HSI 数据集上进行了大量实验,以验证所提出的 QSSPN 框架相对于最新方法的优越性。
联合学习允许分布式的医疗机构可以协作学习具有隐私保护的共享预测模型。在临床部署时,接受联邦学习的模型仍会在联邦外面完全看不见的霍斯群岛上使用时仍会遭受性能下降。在本文中,我们指出并解决了联合域的生成(FedDG)的新型问题设置,该设置旨在从多个分布式源域中学习联合模型,以便它可以直接概括为看不见的目标域。我们提出了一种新颖的方法,在持续频率空间(ELCF)中称为情节学习,通过启动每个客户端在数据分散率的挑战性约束下利用多源数据分布来利用多源数据分布。我们的方法通过有效的连续频率空间插值机制以隐私保护方式传输客户之间的分布信息。通过转移的多源分布,我们进一步仔细设计了面向边界的情节学习范式,以将本地学习暴露于域分布变化,尤其是在医学图像分割场景中尤其满足模型概括的挑战。在两个医学图像分割任务上,我们的方法的有效性优于最先进的表现和深入消融实验。可以在https://github.com/liuquande/feddg-elcfs上使用代码。