在广泛的数据集上预先训练的视觉语言模型(VLMS)可以通过将性别信息与特定对象或场景相关联,无意中地学习偏见。当前方法,该方法着重于修改输入并监视模型的输出概率分数的变化,通常从模型组件的角度来全面地偏见。我们提出了一个框架,该框架结合了因果中介分析,以确保并绘制VLM中偏见产生和传播的途径。我们的框架适用于广泛的视觉语言和多模式任务。在这项工作中,我们将其应用于对象检测任务并将其应用于GLIP模型。这种方法使我们能够确定干预措施对模型偏差的直接影响以及干预措施对通过不同模型组件介导的偏差的间接影响。我们的结果表明,图像效果是偏见的主要因素,其影响明显高于文本特征,特别是占MSCOCO和PASCAL-SONTIC数据集中偏见的32.57%和12.63%。值得注意的是,图像编码器的贡献超过了文本编码器和深层融合编码器的贡献。进一步的实验证实,语言和视力方式的贡献是对齐和不集中的。因此,在图像编码器中着重于模糊的性别表示,这对模型偏见做出了最大的贡献,在MSCOCO和PASCAL-SENTENCE数据集中,有效地降低了偏见22.03%和9.04%,并且具有最小的性能损失或增加的计算需求。1
8。在表格的提案和活动项目部分下的咨询活动时,当采用以下任何情况时:(i)咨询活动将要求高级/关键人员作为咨询活动的一部分进行研究; (ii)咨询活动不涉及进行研究,而是与高级/关键人物的研究组合有关,并且可能有能力影响资金,改变时间或精力承诺,或者以其他方式影响科学完整性;或(iii)咨询实体提供了一份合同,要求高级/关键人物隐瞒或扣留机密的财务或其他关键人物与实体之间的其他联系,无论订婚期限如何
8。在表格的提案和活动项目部分下的咨询活动时,当采用以下任何情况时:(i)咨询活动将要求高级/关键人员作为咨询活动的一部分进行研究; (ii)咨询活动不涉及进行研究,而是与高级/关键人物的研究组合有关,并且可能有能力影响资金,改变时间或精力承诺,或者以其他方式影响科学完整性;或(iii)咨询实体提供了一份合同,要求高级/关键人物隐瞒或扣留机密的财务或其他关键人物与实体之间的其他联系,无论订婚期限如何
摘要“ voight-kampff”生成的AI作者验证任务旨在确定文本是由人工智能生成还是由人写的。在虚构的灵感中,voight-kampff任务结构AI的检测为建造者 - 破坏者挑战:建筑商,Pan Lab的参与者,提交软件,以检测AI写的文本,而Breakers,exterress of the Breakers,Eloquent Lab的参与者,提交AI写的文本,并以欺骗建筑商的目标。我们以一种让人联想到传统作者身份验证问题的方式制定了任务,在给定两条文本的情况下,应推断其人类或机器作者身份。对于第一个任务分期付款,我们进一步限制了问题,以确保每对包含一个人和一个机器文本。因此,任务描述读取:给定两个文本,一个由人类创作,一本由一台机器撰写:挑选人。总共评估了43个检测系统(30个参与者提交和13个基线),从线性分类器到基于困惑的零摄像系统。我们在14个基本集合中组织的70个单独的测试集变体上对它们进行了测试,每个变体都以不同的约束(例如短文,Unicode混淆或语言切换)设计。顶级系统的得分很高,证明自己并不完美,但在各种专业测试方案中都足够健壮。用于创建数据集并评估系统,基准和数据的代码可在GitHub上获得。2
