详细内容或原文请订阅后点击阅览
AI在评分论文时表现出种族偏见,并且无法从Bad
每天,人工智能都会更深入到美国的教室,帮助教师个性化学习,辅导学生并制定课程计划。但是,陪审团仍然涉及其中一些工作的能力,特别是对学生写作的评分。学习机构的一项新研究发现,尽管[…]
来源:The 74每天,人工智能都会更深入到美国的教室,帮助教师个性化学习,辅导学生并制定课程计划。但是,陪审团仍然涉及其中一些工作的能力,特别是对学生写作的评分。学习机构的一项新研究发现,尽管Chatgpt可以模仿人类的评分,但它努力将好的写作与坏人区分开来。这对学生具有严重的影响。
人工智能 研究 学习机构为了更好地理解这些含义,我们使用自动化学生评估奖(ASAP)2.0基准评估了Chatgpt的论文评分能力。这包括大约24,000个由美国中学生和高中生撰写的辩论论文。 ASAP 2.0对于此类研究特别有用的是,每篇文章都是由人类评分的,其中包括种族,英语学习者身份,性别和每个学生作者的经济状况等人口统计数据。这意味着研究人员可以研究AI的表现,不仅与人类得分手相比,而且在不同的学生群体中的表现。
自动化学生评估奖(ASAP)2.0基准 24,000个辩论论文那么我们找到了什么? CHAT GPT确实为不同的人群群体分配了不同的平均分数,但是大多数差异很小,它们可能并不重要。但是,有一个例外:黑人学生的分数低于亚洲学生,而差距足够大,可以引起人们的注意。
分配不同的平均分数 黑人学生的分数低于亚洲学生 同样的差异出现在人为分数中 Chatgpt努力告诉差异 将类似的故事直接传递到您的收件箱中。注册74新闻