另一项研究发现在使用增值测量来评估教师时要非常谨慎的原因 XiaoMi-AI 科研信息收集

详细内容或原文请订阅后点击阅览

另一项研究发现在使用增值测量来评估教师时要非常谨慎的原因

2026年5月7日 07:18 33 Comments

一些教育“改革者”赞扬使用增值衡量标准来评估教师的表现。然而，研究人员发现了许多需要谨慎使用它们的理由。我已经在“学习教师评估“增值”方法的最佳资源”中发布了有关它们的内容，包括：新研究问题 VAM 在 [...] 中的使用

来源:Larry Ferlazzo | 英语教育博客

一些教育“改革者”赞扬使用增值衡量标准来评估教师的表现。

然而，研究人员发现了许多需要谨慎使用它们的理由。我已经在“了解教师评估“增值”方法的最佳资源”中发布了有关它们的内容，包括：

新研究问题 VAM 在教师评估中的使用

多么令人惊讶（不是！）——新研究发现教师评估的增值方法并不准确

新研究发现 VAM 对“有风险”学生的教师存在偏见

当然，还有其他研究质疑考试成绩在教师评估中的整体作用，您可以在最重要的研究中找到这些帖子，这些研究表明考试成绩的 VAM 并不是学校教育的全部和最终目的。

现在，另一项研究对 VAM 的绝对正确性提出了漏洞。

增值估计对测试评分决策的敏感性发现：

虽然各种测试成绩高度相关，但平均而言，使用不同的评分方法会导致 VA 百分位数排名变化超过 20 分，并且超过 50% 的教师或学校被归入 VA 分布的多个四分位数。 VA 排名的分散性随着更完整的项目响应数据而减少。我们的研究结果表明，考虑测量误差和模型不确定性对于正确解释 VAM 非常重要。

我要求 ChatGPT 用非学术语言表述：

这是一个简单的简单版本：

尽管不同的测试分数通常彼此非常接近，但计算“增值”分数（据说教师或学校可以提高学生学习的程度）的方式可以极大地改变结果。

当学生的测试数据更加完整和详细时，排名会变得更加稳定。

总体而言，该研究表明：

谨慎使用高度相关评估的分散性考试成绩响应数据不同的提高 VAM 不准确测试数据百分位教师增值发现测量误差不确定性重要的测试研究 VA 正确性学习的方法评估研究人员敏感性研究结果排名完整的学生简单的学校