Crawford 和 Paglen 的两场展览 TH 和 MF 以及论文 EAI 可被视为对图像分类学的批判,尤其是对给人类照片贴标签的政治含义的警告。最引人注目的是,他们的项目在 ImageNet 数据库中的一些人物类别上推广了怪异和贬低性的标签。然而,C&P 对计算机视觉训练集的分析基础本身就因分类错误而受损。根本问题是 C&P 试图将非常异质的数据集选择归入机器学习“训练集”的单一未分化类别。C&P 展出的数据集在来源、预期用途、版权和知情同意状态、使用条款、资金来源等方面各不相同。下面我将说明区分各种图像数据集的重要性。 C&P 展示的人脸图像数据集有两种不同的来源:由研究小组在受控实验室条件下精心设计和拍摄的数据集,以及从互联网上大量抓取的图像数据集。我分别将它们称为构建数据集和抓取数据集。考虑它们的不同来源如何影响图像的公开展示。当然,这两种图像数据集未经授权公开展示都存在道德问题,但有一个重要区别:构建数据集的版权和知情同意状态是众所周知的,而抓取数据集的版权和知情同意状态则不确定或未知。与抓取的训练集相比,构建图像集(如 JAFFE、FERET、3 和 CK 4)也有明确定义的使用条款。这三个数据集允许用于非商业科学研究,并允许在报告研究结果的学术文章中有限地复制图像。通过在艺术展上公开展示这些图像,C&P 违反了 JAFFE、CK 和 FERET 构建集的使用条款。艺术家和普拉达基金会声称,他们的使用确实构成了“非商业科学
主要关键词