Loading...
机构名称:
¥ 1.0

我们研究对比视力语言模型(VLM)中的文化和社会经济多样性。使用广泛的基准数据集和评估指标,我们引起了一些重要的发现。首先,将培训数据的常见过滤到英语图像 - 文本对缺点社区的社区较低的社区,并对文化理解产生负面影响。值得注意的是,这种性能差距并未被目前流行的评估指标捕获,而不是与西方以西方为中心的ImageNet和可可数据集衍生的评估指标相矛盾。第二,在对英语内容进行微调之前对全球,未经过滤的数据进行预处理可以提高文化理解,而无需牺牲所述流行基准的表现。第三,我们将地理定位的任务介绍为评估VLM中文化多样性的新型评估指标。我们的工作强调了使用不同数据来创建更具包容性的多模式系统的价值,并为开发更好地代表全球视角的VLM奠定了基础。

对比愿景中的文化和社会经济多样性...

对比愿景中的文化和社会经济多样性...PDF文件第1页

对比愿景中的文化和社会经济多样性...PDF文件第2页

对比愿景中的文化和社会经济多样性...PDF文件第3页

对比愿景中的文化和社会经济多样性...PDF文件第4页

对比愿景中的文化和社会经济多样性...PDF文件第5页

相关文件推荐

2023 年
¥1.0
2020 年
¥1.0
2023 年
¥3.0
2023 年
¥1.0