最近兴起的人工智能系统(例如 ChatGPT)给教育行业带来了根本性问题。在大学和学校中,许多形式的评估(例如课程作业)都是无需监考即可完成的。因此,学生可以提交自己的作业,而这些作业实际上是由人工智能完成的。自 COVID 大流行以来,该行业还加速了对无人监督的“带回家考试”的依赖。如果学生使用人工智能作弊并且未被发现,则对学生的评估方式的完整性将受到威胁。我们报告了一项严格的盲测研究,在该研究中,我们将 100% 的人工智能书面提交内容注入了英国一所知名大学心理学学士学位的五个本科模块的考试系统中,涵盖了所有学习年限。我们发现 94% 的人工智能提交内容未被发现。我们 AI 提交的成绩平均比真实学生的成绩高出半个等级。在各个模块中,AI 提交的模块成绩优于随机选择的相同数量的真实学生提交的概率为 83.4%。
最近兴起的人工智能系统(例如 ChatGPT)给教育行业带来了一个根本性问题。在大学和学校中,许多形式的评估(例如课程作业)都是在没有监考的情况下完成的。因此,学生可以提交自己的作业,而这些作业实际上是由人工智能完成的。自新冠疫情以来,该行业还加速了对无人监督的“家庭考试”的依赖。如果学生使用人工智能作弊而未被发现,那么学生评估方式的完整性就会受到威胁。我们报告了一项严格的盲测研究,在该研究中,我们将 100% 的人工智能书面提交内容注入了英国一所知名大学心理学学士学位的五个本科模块的考试系统中,涵盖了所有学习年限。我们发现 94% 的人工智能提交内容未被发现。我们人工智能提交的成绩平均比真实学生的成绩高出半个等级界限。在各个模块中,有 83.4% 的可能性,模块上的 AI 提交内容会胜过随机选择的相同数量的真实学生提交内容。