AI在评分论文时表现出种族偏见，并且无法从Bad XiaoMi-AI 科研信息收集

详细内容或原文请订阅后点击阅览

AI在评分论文时表现出种族偏见，并且无法从Bad

2025年5月6日 18:30 33 Comments

每天，人工智能都会更深入到美国的教室，帮助教师个性化学习，辅导学生并制定课程计划。但是，陪审团仍然涉及其中一些工作的能力，特别是对学生写作的评分。学习机构的一项新研究发现，尽管[…]

来源:The 74

让这样的故事直接传递到您的收件箱中。注册74新闻 让这样的故事直接传递到您的收件箱中。 注册74新闻通讯

每天，人工智能都会更深入到美国的教室，帮助教师个性化学习，辅导学生并制定课程计划。但是，陪审团仍然涉及其中一些工作的能力，特别是对学生写作的评分。学习机构的一项新研究发现，尽管Chatgpt可以模仿人类的评分，但它努力将好的写作与坏人区分开来。这对学生具有严重的影响。

人工智能研究学习机构

为了更好地理解这些含义，我们使用自动化学生评估奖（ASAP）2.0基准评估了Chatgpt的论文评分能力。这包括大约24,000个由美国中学生和高中生撰写的辩论论文。 ASAP 2.0对于此类研究特别有用的是，每篇文章都是由人类评分的，其中包括种族，英语学习者身份，性别和每个学生作者的经济状况等人口统计数据。这意味着研究人员可以研究AI的表现，不仅与人类得分手相比，而且在不同的学生群体中的表现。

自动化学生评估奖（ASAP）2.0基准 24,000个辩论论文

那么我们找到了什么？ CHAT GPT确实为不同的人群群体分配了不同的平均分数，但是大多数差异很小，它们可能并不重要。但是，有一个例外：黑人学生的分数低于亚洲学生，而差距足够大，可以引起人们的注意。

分配不同的平均分数黑人学生的分数低于亚洲学生同样的差异出现在人为分数中 Chatgpt努力告诉差异将类似的故事直接传递到您的收件箱中。注册74新闻

ASAP 亚洲 Chatgpt 研究论文美国收件箱 74 低于人工智能分数不同的机构的差异统计数据 24 意味着研究人员评分学习机自动化同样的 2.0 有用的学习严重的人类学生工作的类似的

AI在评分论文时表现出种族偏见，并且无法从Bad

其他外部链接

Tags

XiaoMi-AI