- 奥地利航天局(ASA)/奥地利。- 比利时科学政策办公室(BELSPO)/比利时。- 机器建筑中央研究所(TSNIIMASH)/俄罗斯联合会。- 北京跟踪与电信技术研究所(CLTC/BITTT)/中国/中国卫星卫星发射和跟踪控制将军/中国。- 中国科学院(CAS)/中国。- 中国太空技术学院(CAST)/中国。- 英联邦科学与工业研究组织(CSIRO)/澳大利亚。- 丹麦国家航天中心(DNSC)/丹麦。- deciênciae tecnologia Aerospacial(DCTA)/巴西。- 电子和电信研究所(ETRI)/韩国。- 欧洲剥削气象卫星(Eumetsat)/欧洲的组织。- 欧洲电信卫星组织(Eutelsat)/欧洲。- 地理信息和太空技术发展局(GISTDA)/泰国。- 希腊国家太空委员会(HNSC)/希腊。- 希腊航天局(HSA)/希腊。- 印度太空研究组织(ISRO)/印度。- 太空研究所(IKI)/俄罗斯联合会。- 韩国航空航天研究所(KARI)/韩国。- 通信部(MOC)/以色列。- 穆罕默德垃圾箱拉希德航天中心(MBRSC)/阿拉伯联合酋长国。- 国家信息与通信技术研究所(NICT)/日本。- 国家海洋与大气管理局(NOAA)/美国。- 哈萨克斯坦共和国国家航天局(NSARK)/哈萨克斯坦。- 国家太空组织(NSPO)/中国台北。- 海军太空技术中心(NCST)/美国。- 荷兰太空办公室(NSO)/荷兰。- 粒子与核物理研究所(KFKI)/匈牙利。- 土耳其科学技术研究委员会(Tubitak)/土耳其。- 南非国家航天局(SANSA)/南非共和国。- 太空和高中气氛研究委员会(Suparco)/巴基斯坦。- 瑞典太空公司(SSC)/瑞典。- 瑞士太空办公室(SSO)/瑞士。- 美国地质调查局(USGS)/美国。
在大型图像中自动查找多个病变是医学图像分析中的常见问题。如果在优化过程中,自动化方法无法访问有关病变位置的信息,也没有给出病变的单个示例,那么解决这个问题可能会很困难。我们提出了一种使用神经网络的新型弱监督检测方法,该方法计算出显示脑病变位置的注意力图。这些注意力图是使用仅使用全局图像级标签优化的分割网络的最后特征图计算出来的。所提出的方法可以在全输入分辨率下生成注意力图,而无需在预处理期间进行插值,这使得小病变可以出现在注意力图中。为了进行比较,我们修改了最先进的方法来计算弱监督物体检测的注意力图,方法是使用全局回归目标而不是更传统的分类目标。这个回归目标优化了目标物体在图像中出现的次数,例如扫描中的脑病变数量或图像中的数字数量。我们研究了所提出方法在基于 MNIST 的检测数据集中的行为,并评估了该方法在扩大的血管周围间隙(一种脑损伤)的具有挑战性的检测中的表现,该检测是在 2202 个 3D 扫描的数据集中进行的,这些扫描在四个大脑区域的所有损伤中心都有逐点注释。在基于 MNIST 的数据集中,所提出的方法优于其他方法。在大脑数据集中,弱监督检测方法在每个区域中都接近人类的评分者内一致性。所提出的方法在四个区域中的两个区域中达到了最佳曲线下面积,并且在所有区域中的假阳性检测数量最低,而其在所有区域的平均灵敏度与其他最佳方法相似。所提出的方法可以促进扩大的血管周围间隙的流行病学和临床研究,并有助于推动扩大的血管周围间隙的病因及其与脑血管疾病的关系的研究。
基于机器学习的图像生成模型(例如稳定扩散)现在能够生成很难与真实图像区分开的合成图像,这引起了许多法律和道德问题。作为缓解措施的潜在度量,可以训练神经网络检测许多生成模型合成的图像中存在的数字伪像。但是,由于所讨论的伪影通常是特定于模型的伪像,因此这些所谓的探测器通常会出现来自模型的图像时的性能差,因此尚未接受过培训。在本论文中,我们研究了Dreambooth和Lora,最近出现了两种精细方法,以及它们对假图像探测器的性能的影响。Dreambooth和Lora可用于微调一个稳定的扩散基础模型,该模型具有创建基本模型更改版本的效果。可以这样做的便捷性导致了社区产生的合成图像的扩散。然而,模型微调对图像可检测性的影响尚未在科学背景下研究。因此,我们提出以下研究问题:使用Dreambooth或Lora对稳定的扩散基本模型进行微调会影响仅在基本模型图像上训练的探测器的性能指标吗?我们采用了一种实验方法,使用验证的VGG16架构将二进制分类作为检测器。我们在来自Imagenet数据集的真实图像上训练检测器,以及由三个不同稳定扩散基础模型合成的图像,从而产生了三个训练有素的检测器。然后,我们在这些模型的微调版本生成的图像上测试他们的性能。我们发现,在使用微调模型发生的图像上测试检测器的准确性低于对训练的基础模型生成的图像进行测试的准确性。在前者类别中,与洛拉生成的图像相比,Dreambooth生成的图像对检测器的影响更大。我们的研究表明,在伪造图像探测器培训的背景下,有必要在Dreambooth微调模型中考虑到不同的实体。
人类的大脑通过对客观世界的认知,形成图像和影像,这个过程也是人类最重要的信息来源,通过观察现实世界中人体各个系统的运行状态,很容易理解。随着人工智能、多媒体、计算机等新型信息技术的不断发展,图像处理应用也受到人们的青睐。图像识别技术在计算机系统的支持下,可以给人们的生产生活带来极大的便利。本文基于此背景,完成了计算机图像识别系统的设计,并通过改进图像算法完成了优化。
光谱图像融合结合了低空间分辨率高光谱(HS)和低光谱 - 分辨率多光谱(MS)图像,以估计高分辨率(HR)光谱图像。尽管基于监督深度学习的最新融合技术显示出令人鼓舞的结果,但这些方法需要大量的培训数据集,涉及昂贵的获取成本和较长的培训时间。相比之下,基于深图像先验(DIP)方法的无监督的HS和MS图像融合为具有不同分布的图像的适应性提供了适应性。但是,现有的无监督方法依赖于线性降解模型的假设,并且需要对这些模型的精确知识才能获得最佳性能。为了克服这些挑战,我们提出了无监督的盲人HS和MS图像融合的中间输出深图像先验(MODIP)。Modip基于DIP模型,并在网络中的中间层产生融合图像。该体系结构包括两个高尺度的卷积发生器,它们从HS和MS输入中重建了HR光谱图像,以及两个网络,这些网络适当地降低了估计的HR图像,以匹配可用的MS和HS数据集,从而学习非线性降解模型。MODIP的网络参数是通过最小化所提出的复合损耗函数的共同和迭代调整的。重要的是,这种方法可以处理降解操作员未知或部分估计的方案。广泛的模拟表明,MODIP的表现优于其他基于模型的图像融合方法。为了评估MODIP的性能,我们在两个模拟光谱图像数据集(Pavia University和Salinas Valley)上测试了Fusion方法,以及通过光学实验室中的测试台实现获得的真实数据集。
文本对图像(T2I)生成模型最近成为一种强大的工具,可以创建照片现实的图像并引起多种应用。然而,将T2i模型的有效整合到基本图像分类任务中仍然是一个悬而未决的问题。促进图像锁骨表现的一种普遍的策略是通过使用T2I模型生成的合成图像来增强训练集。在这项研究中,我们仔细检查了当前发电和常规数据增强技术的缺点。我们的分析表明,这些方法努力产生既忠实的(就前景对象)而且针对领域概念的多样化(在背景上下文中)。为了应对这一挑战,我们引入了一种创新的类数据增强方法,称为diff-mix 1,该方法通过在类之间执行图像翻译来丰富数据集。我们的经验结果是,DIFF-MIX在信仰和多样性之间取得了更好的平衡,从而导致各种图像分类场景之间的性能显着提高,包括域名数据集的少量,常规和长尾分类。
图像去雾是一种减少图像中雾霾、灰尘或雾气影响的方法,以便清晰地查看观察到的场景。文献中存在大量传统和基于机器学习的方法。然而,这些方法大多考虑可见光光谱中的彩色图像。显然,由于热红外光谱的波长较长,受雾霾的影响要小得多。但远距离观测期间的大气扰动也会导致热红外 (TIR) 光谱中的图像质量下降。在本文中,我们提出了一种为 TIR 图像生成合成雾的方法。然后,我们分析了现有的盲图像质量评估措施雾感知密度评估器 (FADE) 对 TIR 光谱的适用性。我们进一步全面概述了当前图像去雾的最新技术,并通过经验表明,许多最初为可见光图像设计的方法在应用于 TIR 光谱时表现得出奇的好。这在最近发布的 M3FD 数据集上进行的实验中得到了证实。
注意: *,TPR(true正率)= TP /(TP + FN); tnr(true负率)= tn /(fp + tn); fpr(假阳性率)= fp /(fp + tn); fnr(假阴性率)= fn /(fn + tp); ACC(精度)=(TP + TN) /(TP + FP + TN + FN); f1_score = 2 ∗ tp /(2 ∗ tp + fp + fn)。tp,fp,tn和fn分别代表真正的积极,误报,真为负和假阴性。