在这项工作中,建议专门用于检测妊娠糖尿病(GDM)的基于机器学习(ML)的电子诊断系统。审查最近的GDM数据并概述了GDM与糖尿病前期疾病之间的紧密联系,以及我们的目标是胰岛素抵抗的未来下降和未来下降的潜力。本研究探讨了K-Nearest邻居(KNN)算法在广泛使用的PIMA Indians糖尿病数据库上的诊断中的应用。KNN算法是一种非参数,基于实例的学习方法,用于将个体归类为糖尿病或非糖尿病患者,我们的目标是评估算法的准确预测和探索影响其性能的因素的能力。该研究以数据预处理开始,包括处理丢失值,功能缩放以及将数据分解为训练和测试集。使用这些最佳拟合参数对KNN分类器进行了训练和测试。这项研究的结果揭示了一个模型在预测糖尿病诊断时精度约为0.76。这项研究研究了糖尿病患者分类的各种机器学习方法,包括召回,准确性,精度和F1评分。该研究讨论了超参数调整,数据预处理和数据处理不平衡的重要性在实现最佳KNN模型性能中的重要性。最后,这项研究显示了如何使用PIMA Indians糖尿病数据库来投射KNN算法。调查结果表明,KNN可以作为早期糖尿病的可行工具,为在医疗保健和预测建模中更广泛的应用铺平道路。
主要关键词