摘要:近年来,随着技术的发展,机器学习已广泛应用于医学领域。机器学习也是一个用于诊断糖尿病并帮助专家做出决策的领域。糖尿病是一种终身疾病,在世界各地和我国都很常见。本研究的主要目的是使用不同的机器学习分类算法进行早期诊断糖尿病。本研究的另一个目的是比较所使用的机器学习模型的成功率。早期诊断糖尿病可以过上健康正常的生活。在此背景下,人们尝试在皮马印第安人糖尿病数据集上使用机器学习技术决策树、随机森林、K-最近邻和支持向量机分类器进行早期诊断糖尿病。该数据集包括 9 个特征和 768 个样本。使用准确度、精确度、召回率、F1 分数和 AUC 指标对分类器的成功率进行评估。随机森林的准确率为 80%,效果最好。本文旨在研究不同机器学习技术的使用、糖尿病数据诊断能力、女性糖尿病患者的糖尿病诊断以及机器学习技术性能比较之间的关联。讨论了理论和实践的意义。在本研究中,使用与文献中使用的分类算法不同的算法进行了比较,并为该领域的文献做出了贡献。关键词:糖尿病疾病;机器学习;分类;随机森林
主要关键词