摘要:机器学习算法已被广泛用于公共卫生中,用于预测或诊断流行病学慢性疾病,例如糖尿病,由于其较高的全球患病率,该疾病被归类为流行病。机器学习技术对于包括糖尿病在内的各种疾病的描述,预测和评估过程很有用。这项研究研究了沙特阿拉伯,根据相关的行为危险因素(吸烟,肥胖和不活动)对不同分类方法分类糖尿病患病率和预测趋势的能力。使用不同的机器学习算法(包括线性判别(LD),支持向量机(SVM),K -NER -NER -NEAR -最邻居(KNN)和神经网络模式识别(NPR))开发了用于糖尿病患病率的分类模型。使用了SVM的四个内核函数和两种类型的KNN算法,即线性SVM,Gaussian SVM,二次SVM,Cubic SVM,Finfine KNN和加权KNN。根据预测速度和培训时间,使用MATLAB中的分类学习者应用程序比较开发的分类器的性能评估,并使用分类学习者应用程序比较开发的分类器。分类模型的预测性能分析的实验结果表明,与其他分类方法相比,与其他分类方法相比,加权KNN在糖尿病患病率的预测中表现良好,最高平均准确性为94.5%,训练时间较少,男性和女性数据集则表现出色。
主要关键词