详细内容或原文请订阅后点击阅览
设置检查一致性有一个最佳点
Steve Wren 警告说,实现一致性充满了复杂性。走得太远,你可以从 Ofsted 检查中获得洞察力。这篇文章《There’s a sweet point to be find in set Inspection Consistency》首次出现在《学校周》上。
来源:Schools Week英国教育标准局 (Ofsted) 在最近的《学校周》评论文章中承诺“进一步”确保检查的一致性,这是值得欢迎的一步。
Ofsted 在最近的学校周评论文章中“走得更远”以确保检查的一致性 学校周它认识到问题的复杂性,并概述了加强和测试可靠性的实际措施。
但如果检查是一种评估形式——而且确实如此——那么 Ofsted 必须走得更远。他们需要就一致性的真正含义发起一场严肃、公开的辩论,并诚实地了解如果一致性成为最终目标将会损失什么。
英国教育标准局在考虑考试的可靠性时,我们提出的一个核心问题是评分者间的可靠性:两名考官会对同一个剧本给予相同的分数吗?
检验当量是指两个检验员(或两个检验组)是否会根据相同的证据得出相同的判断。理想情况下,是的。但这需要什么?
正如我们可以将历史 GCSE 变成一系列明确正确或错误的多项选择题一样,我们可以将检查变成二进制指标清单:进度 8 是否高于零?出席率是否高于全国平均水平?停赛次数是否在减少?
全部明确是或否。但这样做时,我们会剥夺系统原本要捕捉的细微差别和专业洞察力。
变化不是需要修复的缺陷
判断力的变化并不是需要修复的缺陷——它是复杂评估的固有特征。即使经过严格的训练和校准,一定程度的差异仍然会存在。
因此,真正的挑战不是通过缩小视野来消除变异,而是找到最佳点——我们在保持有效性的同时可以容忍的不一致程度。
太多的变化会破坏信任。判断力太少会使检查变成一种公式化的练习。
如果我们认真对待一致性,我们就必须诚实地对待这种权衡。
