北欧航空董事会成员埃里克·萨科夫补充道,他很高兴宣布北欧航空的行程中增加了这一令人兴奋的新活动:“爱丁堡拥有丰富的历史遗产,是爱沙尼亚度假者的理想选择,他们将享受古老苏格兰和现代欧洲文化的独特结合。此外,我相信塔林和爱沙尼亚也为苏格兰人提供了很多选择。我们国家美丽的中世纪首都是联合国教科文组织世界遗产,爱沙尼亚的多元自然和迷人的文化传统使每个人都能找到适合自己的东西。”
在广泛的数据集上预先训练的视觉语言模型(VLMS)可以通过将性别信息与特定对象或场景相关联,无意中地学习偏见。当前方法,该方法着重于修改输入并监视模型的输出概率分数的变化,通常从模型组件的角度来全面地偏见。我们提出了一个框架,该框架结合了因果中介分析,以确保并绘制VLM中偏见产生和传播的途径。我们的框架适用于广泛的视觉语言和多模式任务。在这项工作中,我们将其应用于对象检测任务并将其应用于GLIP模型。这种方法使我们能够确定干预措施对模型偏差的直接影响以及干预措施对通过不同模型组件介导的偏差的间接影响。我们的结果表明,图像效果是偏见的主要因素,其影响明显高于文本特征,特别是占MSCOCO和PASCAL-SONTIC数据集中偏见的32.57%和12.63%。值得注意的是,图像编码器的贡献超过了文本编码器和深层融合编码器的贡献。进一步的实验证实,语言和视力方式的贡献是对齐和不集中的。因此,在图像编码器中着重于模糊的性别表示,这对模型偏见做出了最大的贡献,在MSCOCO和PASCAL-SENTENCE数据集中,有效地降低了偏见22.03%和9.04%,并且具有最小的性能损失或增加的计算需求。1
本副本仅供您个人、非商业用途使用。本材料的分发和使用受我们的订户协议和版权法的约束。如需非个人用途或订购多份副本,请致电 1-800-843-0008 联系 Dow Jones Reprints 或访问 www.djreprints.com。
