我们希望确保学生彻底理解文本分类的所有步骤。为此,我们强调了 (1) 词向量、(2) K-最近邻 (KNN) 算法和 (3) 分类偏差的概念。然后,学生在 (4) 编程活动和最终项目中展示了他们的理解。1.词向量:向学生介绍了如何用词向量以数字形式表示单词的概念。我们通过示例创建了包含单词“公主”的词向量,并确定其向量中与“皇室”、“男性气质”、“女性气质”和“年龄”相对应的数字应该高还是低。2.KNN 算法:为了更好地理解 KNN 算法,学生使用在二维图上绘制的单词的视觉效果 [ 4 ]。他们了解了 K 参数的选择如何影响算法的输出。3.分类偏差:为了说明分类偏差,学生使用词语类比网站来绘制诸如“护士”、“医生”等工作,