在人工智能的背景下,真实的评估意味着什么?

为了抵御人工智能风暴,夏洛特·冯·埃森 (Charlotte von Essen) 认为,评估必须真实且负责任。

来源:Wonkhe | 高等教育政策、人物与政治

在最近关于高等教育评估的讨论中,对生成式人工智能的反应集中在一个熟悉的解决方案上:真实评估。

该术语通常用于描述类似于现实世界或专业实践的评估任务。原则上,此类任务旨在减少不当行为的机会并增强学习的相关性。

这种本能是合理的。与应用知识的环境有意义地联系起来的评估具有真正的教学价值。但仅有真实性是不够的。如果没有问责制,真实的评估就有可能成为令人放心的标签,而不是有意义的学习保证。

在人工智能的背景下,真实的评估通常被定位为一种保障。基本假设是,足够情境化的、复杂的或经验性的任务将抵制自动化,从而保持学术诚信。这是有道理的。精心设计的真实任务可以创造条件,使理解比输出更重要。

困难在于,真实性被视为完整性的充分条件,但其基础却越来越脆弱。

在现实世界中

真实评估假设“现实世界”作为稳定的参考点。评估旨在模拟专业实践,前提是这种实践代表了教育的真实终点。然而,在各个行业,人工智能工具已经融入到日常工作中。律师在人工智能的协助下起草合同。记者使用人工智能进行构思、起草和编辑。软件开发人员依赖人工智能生成的代码。在许多领域,没有人工智能的工作不再代表专业实践。如果真实性被定义为反映现实世界的条件,那么真实性评估必须适应人工智能的使用,这意味着真实性本身无法完成验证理解的工作。

从真实性到问责制

应对变化