人工智能 (AI) 是一种新兴技术,在 STEM 教育和 STEM 教育研究中得到越来越多的应用(例如,Zhai 等人,2020b;Ouyang 等人,2022;Linn 等人,2023)。人工智能被定义为一种模仿人类认知行为的技术,在解决 STEM 教育中一些最具挑战性的问题方面具有巨大潜力(Neumann 和 Waight,2020;Zhai,2021)。其中一项挑战是支持所有学生实现 21 世纪科学学习愿景,例如在美国。K-12 科学教育框架(国家研究委员会,2012 年)、德国(Kulgemeyer 和 Schecker,2014 年)、芬兰(芬兰国家教育委员会,2016 年)和 PISA 框架(OECD,2017 年)。这些政策文件要求学生提高运用思想的能力,以便学习者能够利用他们的知识解决具有挑战性的问题并理解复杂的现象。例如,该框架要求学生发展将学科核心思想 (DCI) 和跨不同科学学科 (CCC) 的交叉概念的知识与参与主要科学和工程实践 (SEP) 的技能相结合的能力,以解释日常科学现象和解决实际问题。该框架还描述了学生在发展预期能力方面取得进展的途径,称为学习进度。但是,为了最好地支持学生发展这种能力,需要进行评估,使学生能够使用知识解决具有挑战性的问题并理解现象。这些评估需要经过设计和测试,以有效地定位学生的学习进度,从而向学生和教师提供有关他们学习中有意义的下一步的反馈。然而,这样的任务评分很耗时,而且很难为学生提供适当的反馈以将他们的知识发展到下一个水平。人工智能技术,更具体地说是机器学习,已成功证明能够帮助自动评估复杂结构,例如学生的解释(Nehm 等人,2012 年)论证能力(Zhai 等人,2022a),学生在完成类似于教学中使用的复杂任务的任务时产生的绘图模型(Zhai 等人,2022b)(有关概述,请参阅 Zhai 等人,2020a)。基于机器学习的评估实践涵盖了一系列学术著作,旨在利用人工智能技术的潜力在 STEM 教育背景下评估学习,以支持学习者发展预期的能力。
主要关键词