Loading...
机构名称:
¥ 1.0

文本对图像(T2I)生成模型最近成为一种强大的工具,可以创建照片现实的图像并引起多种应用。然而,将T2i模型的有效整合到基本图像分类任务中仍然是一个悬而未决的问题。促进图像锁骨表现的一种普遍的策略是通过使用T2I模型生成的合成图像来增强训练集。在这项研究中,我们仔细检查了当前发电和常规数据增强技术的缺点。我们的分析表明,这些方法努力产生既忠实的(就前景对象)而且针对领域概念的多样化(在背景上下文中)。为了应对这一挑战,我们引入了一种创新的类数据增强方法,称为diff-mix 1,该方法通过在类之间执行图像翻译来丰富数据集。我们的经验结果是,DIFF-MIX在信仰和多样性之间取得了更好的平衡,从而导致各种图像分类场景之间的性能显着提高,包括域名数据集的少量,常规和长尾分类。

通过扩散模型通过类间图像混合增强图像分类

通过扩散模型通过类间图像混合增强图像分类PDF文件第1页

通过扩散模型通过类间图像混合增强图像分类PDF文件第2页

通过扩散模型通过类间图像混合增强图像分类PDF文件第3页

通过扩散模型通过类间图像混合增强图像分类PDF文件第4页

通过扩散模型通过类间图像混合增强图像分类PDF文件第5页

相关文件推荐

2024 年
¥5.0
2024 年
¥1.0
2023 年
¥1.0
2024 年
¥6.0
2025 年
¥2.0
2022 年
¥1.0