一种简单的背景增强方法,用于使用扩散模型的对象检测
机构名称:
¥ 1.0

摘要。在计算机视觉中,众所周知,缺乏数据会损害模型性能。在这项研究中,我们应对加强数据集多样性问题的挑战,以使各种下游任务(例如对象检测和实例segmentation)受益。我们通过利用生成模型中的进步,特别是文本对图像合成技术(如稳定扩散)提出了一种简单而有效的数据增强方法。我们的方法着重于标记的真实图像的变化,利用生成对象和背景增强通过indpainting来增强现有的培训数据,而无需其他注释。我们发现,尤其是背景增强,显着提高了模型的鲁棒性和泛化能力。我们还调查了如何提示和掩盖以确保生成的内容符合现有注释。通过对可可数据集的全面评估和其他几个关键对象检测基准测试,我们的增强技术的功效得到了验证,这表明在不同情况下,模型性能没有提高。这种方法为数据集启用的挑战提供了有希望的解决方案,这有助于开发更准确,更健壮的计算机视觉模型。

一种简单的背景增强方法,用于使用扩散模型的对象检测

一种简单的背景增强方法,用于使用扩散模型的对象检测PDF文件第1页

一种简单的背景增强方法,用于使用扩散模型的对象检测PDF文件第2页

一种简单的背景增强方法,用于使用扩散模型的对象检测PDF文件第3页

一种简单的背景增强方法,用于使用扩散模型的对象检测PDF文件第4页

一种简单的背景增强方法,用于使用扩散模型的对象检测PDF文件第5页

相关文件推荐