Loading...
机构名称:
¥ 1.0

摘要 - 简单的提示学习方法可有效地适应视觉语言模型(VLMS)到下游任务。然而,经验证据表明,现有方法的趋势是他们过度拟合的班级,并且在看不见的阶级上表现出降解的表现。此限制是由于训练数据中对所见类的固有偏见。为了解决这个问题,我们提出了一种新颖的软提示学习方法,称为蒸馏混合物(MOPD),该方法可以从硬手工制作的硬提示中有效地传递有用的知识(又称A.K.A.老师提示)到可学习的软提示(又称学生提示),从而增强了在看不见的课程上软提示的概括能力。此外,提出的MOPD方法采用了一个门控网络,该网络学会选择用于迅速蒸馏的硬提示。广泛的实验表明,所提出的MOPD方法的表现优于现状的基准,尤其是在看不见的类别上。

参观视觉模型的蒸馏

参观视觉模型的蒸馏PDF文件第1页

参观视觉模型的蒸馏PDF文件第2页

参观视觉模型的蒸馏PDF文件第3页

参观视觉模型的蒸馏PDF文件第4页

参观视觉模型的蒸馏PDF文件第5页