另一项研究发现在使用增值测量来评估教师时要非常谨慎的原因

一些教育“改革者”赞扬使用增值衡量标准来评估教师的表现。然而,研究人员发现了许多需要谨慎使用它们的理由。我已经在“学习教师评估“增值”方法的最佳资源”中发布了有关它们的内容,包括:新研究问题 VAM 在 [...] 中的使用

来源:Larry Ferlazzo | 英语教育博客

一些教育“改革者”赞扬使用增值衡量标准来评估教师的表现。

然而,研究人员发现了许多需要谨慎使用它们的理由。  我已经在“了解教师评估“增值”方法的最佳资源”中发布了有关它们的内容,包括:

新研究问题 VAM 在教师评估中的使用

多么令人惊讶(不是!)——新研究发现教师评估的增值方法并不准确

新研究发现 VAM 对“有风险”学生的教师存在偏见

当然,还有其他研究质疑考试成绩在教师评估中的整体作用,您可以在最重要的研究中找到这些帖子,这些研究表明考试成绩的 VAM 并不是学校教育的全部和最终目的。

现在,另一项研究对 VAM 的绝对正确性提出了漏洞。

增值估计对测试评分决策的敏感性发现:

虽然各种测试成绩高度相关,但平均而言,使用不同的评分方法会导致 VA 百分位数排名变化超过 20 分,并且超过 50% 的教师或学校被归入 VA 分布的多个四分位数。 VA 排名的分散性随着更完整的项目响应数据而减少。我们的研究结果表明,考虑测量误差和模型不确定性对于正确解释 VAM 非常重要。

我要求 ChatGPT 用非学术语言表述:

这是一个简单的简单版本:

尽管不同的测试分数通常彼此非常接近,但计算“增值”分数(据说教师或学校可以提高学生学习的程度)的方式可以极大地改变结果。

当学生的测试数据更加完整和详细时,排名会变得更加稳定。

总体而言,该研究表明: