ProText：测量长文本中（错误）性别的基准数据集 XiaoMi-AI 科研信息收集

详细内容或原文请订阅后点击阅览

ProText：测量长文本中（错误）性别的基准数据集

2026年3月31日 00:00 33 Comments

我们引入了 ProText，这是一个用于测量风格多样的长篇英语文本中的性别和性别错误的数据集。 ProText 跨越三个维度：主题名词（姓名、职业、头衔、亲属称谓）、主题类别（典型男性、典型女性、中性/非性别）和代词类别（男性、女性、中性、无）。该数据集旨在探索文本转换中的（错误）性别，例如使用最先进的大型语言模型进行摘要和重写，超越传统的代词解析基准并超越......

来源:Apple机器学习研究

我们引入了 ProText，这是一个用于测量风格多样的长篇英语文本中的性别和性别错误的数据集。 ProText 跨越三个维度：主题名词（姓名、职业、头衔、亲属称谓）、主题类别（典型男性、典型女性、中性/非性别）和代词类别（男性、女性、中性、无）。该数据集旨在探讨文本转换中的（错误）性别，例如使用最先进的大型语言模型进行摘要和重写，超越传统的代词解析基准和性别二元。我们通过一个小型案例研究验证了 ProText，表明即使只有两个提示和两个模型，我们也可以得出有关性别偏见、刻板印象、性别歧视和性别歧视的细致入微的见解。我们揭示了系统性的性别偏见，特别是当输入不包含明确的性别线索或模型默认为异性恋假设时。

数据集性别歧视错误的 ProText 代词中性先进的明确的模型案例研究主题女性文本输入男性性别偏见类别典型多样的传统的

ProText：测量长文本中（错误）性别的基准数据集

其他外部链接

Tags

XiaoMi-AI