Interpreting CLIP: Insights on the Robustness to ImageNet Distribution Shifts
稳健模型和非稳健模型的区别是什么?虽然对于 ImageNet 分布变化,已经表明这种稳健性差异可以主要追溯到训练数据的差异,但到目前为止,尚不清楚这在模型学习方面意味着什么。在这项工作中,我们通过探测具有各种主干(ResNets 和 ViTs)和预训练集(OpenAI、LAION-400M、LAION-2B、YFCC15M、CC12M 和 DataComp)的 16 个稳健零样本 CLIP 视觉编码器的表示空间,并将它们与较少的表示空间进行比较来弥合这一差距……