测验生成器如何改变课堂中的形成性评估

一位生物教师对使用人工智能更快地建立形成性评估的诚实看法,而不牺牲其背后的教学思维。

来源:TeachThought

上周二我做了一个测验,大约用了四十五秒。

它涵盖了细胞呼吸,有八个问题,并发现了我在单元测试之前可能会错过的关于 ATP 的误解。这个测验对我第三节课的帮助比我前一周花了一个晚上写的复习工作表还要多。

老实说:我对人工智能生成的评估持怀疑态度。我教生物学,多年来我一直相信写自己的问题是了解学生的一部分。我仍然相信这一点。但我也开始相信另一件事,那就是我应该做的低风险测验的数量远远超过了我有时间写的数量。

更多测验的研究案例

检索练习背后的证据并不新鲜,但它比大多数教师意识到的更强大。 Roediger 和 Karpicke 2006 年在华盛顿大学进行的研究表明,随着时间的推移,参加练习测试的学生比那些花时间重读笔记的学生记住的材料要多得多。利润并不小。在几天后进行的延迟回忆测试中,测试组的表现明显优于重新研究组。

这个想法,有时被称为测试效果,从那时起就被广泛复制。 Agarwal、Nunes 和 Blunt 在 2021 年进行了一项系统审查,检查了 50 名学生参与的 50 项课堂实验。百分之五十七的效应大小为中等或较大。一项早期的课堂研究发现,学生在测验材料上的得分为 94%,而在他们学过但从未测验过的材料上得分为 81%,而且这种差距在几个月后仍然存在。

时间问题确实存在

我尝试过保留一个题库。我使用 Google 表单来构建快速检查。我什至让学生们互相写问题一次,这是一项很好的活动,但并不能可靠地产生测试正确事物的问题。

人工智能测验生成实际上是什么样的

让老师随时了解情况