人工智能评分标准化考试是否公平准确?

德克萨斯州正在将其高风险标准化考试的部分评分过程移交给机器人。新闻媒体详细介绍了德克萨斯州的推出……

来源:EdSurge

德克萨斯州正在将其高风险标准化考试的部分评分过程移交给机器人。

新闻媒体详细介绍了德克萨斯州教育局推出的自然语言处理程序,这是一种人工智能,用于对三年级及以上学生进行的标准化考试的书面部分进行评分。

详细介绍了推出情况

与许多与人工智能相关的项目一样,这个想法最初是为了降低雇用人类的成本。

在一项新法律规定从 2022-23 学年开始至少 25% 的问题是开放式问题(而不是多项选择题)之后,德克萨斯州发现自己需要一种方法来对德克萨斯州学术准备评估 (STAAR) 中的书面答复进行成倍的评分。

新法律

官员们表示,自动评分系统将为该州节省数百万美元,否则这些钱将花在雇佣承包商阅读和评分书面答案上——今年春天只需要 2,000 名评分员,而去年同期则需要 6,000 名。

使用技术评分论文并不是什么新鲜事。例如,GRE 的书面答案早已由计算机评分。 Vice 在 2019 年的一项调查发现,至少有 21 个州使用自然语言处理来评分学生在标准化考试中的书面答案。

早已由计算机评分 21 个州

尽管如此,一些教育工作者和家长都对有关 K-12 学生论文自动评分的消息感到措手不及。德克萨斯州教师协会发言人 Clay Robison 表示,许多教师是通过媒体报道了解到这一变化的。

“我知道德克萨斯州教育局没有让我们的任何成员询问他们对此的看法,”他说,“显然他们也没有问过很多家长。”

由于低分可能对学生、学校和学区产生影响,使用技术对标准化考试答案进行评分的转变引发了人们对公平性和准确性的担忧。

休斯顿纪事报

公平和准确性