摘要 - 数据科学和机器学习已证明在包括教育在内的许多行业中都非常重要和有效。计算系统能够通过机器学习(人工智能的一部分)从数据学习和得出结论。通过数据挖掘和机器学习技术评估教育数据来预测学生成就的评估系统已由教育领域的最新发展引入。评估学生绩效是影响机构认证的重要教育指标。大学应使用咨询来为成绩不佳制定绩效改进计划,以解决这一问题。预测学术成就已成为众多教育机构的关键目标。帮助高风险的学生,确保他们留在学校,提供出色的学习材料以及提高大学的地位和声誉,这都取决于这一点。中小型大学可能会发现很难实现这一目标,尤其是当他们专注于研究生和研究生课程并缺乏可用于研究的学生数据时。该项目的主要目标是证明训练和建模微型数据集并产生具有合理准确性水平的预测模型是可行的。这项研究还介绍了如何使用可视化和聚类方法来在有限的数据集中找到重要的迹象。为了找到最准确的模型,许多机器学习算法接受了最佳指标培训。调查结果表明,可以使用聚类技术成功识别小型数据集中的关键指标
主要关键词