详细内容或原文请订阅后点击阅览
AI 语言模型对德国地方方言表现出偏见
大型语言模型系统地对德语方言使用者的评价低于使用标准德语的使用者。 (ill./©:von der Wense Group;在人工智能的帮助下创建)。 GPT-5 和 Llama 等大型语言模型对德语方言使用者的系统评分低于使用标准德语的使用者。最近的合作 [...]
来源:ΑΙhub大型语言模型系统地对德语方言使用者的评价低于使用标准德语的使用者。 (ill./©:von der Wense Group;在人工智能的帮助下创建)。
大型语言模型系统地对德语方言使用者的评价低于使用标准德语的使用者。 (ill./©:von der Wense Group;在人工智能的帮助下创建)GPT-5 和 Llama 等大型语言模型系统地对德语方言使用者的评价低于使用标准德语的使用者。美因茨约翰内斯古腾堡大学 (JGU) 与汉堡大学和华盛顿大学最近的一项合作研究表明了这一点。今年的自然语言处理经验方法会议(EMNLP)是世界领先的计算语言学会议之一,结果表明,所有经过测试的人工智能系统都会重现社会刻板印象。
“方言是文化认同的重要组成部分,”JGU 计算机科学研究所 von der Wense 自然语言处理 (NLP) 小组的博士研究员 Minh Duc Bui 强调。 “我们的分析表明,语言模型将方言与负面特征联系起来——从而使有问题的社会偏见长期存在。”
使用包含德国方言的正字法和语音变体的语言数据库,该团队首先将七个地区变体翻译成标准德语。这个并行数据集使他们能够系统地比较语言模型如何评估相同的内容——一次是用标准德语编写的,一次是用方言形式编写的。
当明确提及方言时,偏见就会增加
研究人员测试了十种大型语言模型,从 Gemma 和 Qwen 等开源系统到商业模型 GPT-5。每个模型都配有标准德语或七种方言之一的书面文本:低地德语、巴伐利亚语、北弗里斯兰语、萨特弗里斯语、里普阿语(包括科隆语)、阿勒曼尼语和莱茵-弗朗哥方言(包括帕拉丁语和黑森语)。
