Loading...
机构名称:
¥ 1.0

糖尿病是一种慢性代谢性疾病,其特征是血糖升高,可导致眼睛和重要器官受损。2 型糖尿病是糖尿病的一种变体,最常影响 18 岁以上的成年人,这种变体引起的症状并不明显,识别它需要很长的测试过程。使用分类算法预测糖尿病,有助于在疾病早期阶段将风险降至最低,并帮助健康从业者控制糖尿病的影响。在本研究中,作者在 Pima Indian Diabetes 数据集上比较了决策树和 K-Nearest Neighbor 算法在预测糖尿病方面的表现。两种算法模型均使用 3 个数据集共享比率进行训练,分别为 80:20、70:30 和 65:35。此外,作者还实施了 GridSearchCV 超参数调整,以找到两种模型的最佳参数。两种模型的准确率、精确度、召回率和 F-1 分数用于确定哪种模型具有最佳性能。结果表明,未进行超参数调优的决策树算法在 70:40 的比例下效果最佳,准确率为 83.33%;KNN 算法中 K=7 为最优 K 值,准确率为 77.65%;进行超参数调优的 GridSearchCV 在 80:20 和 65:35 的比例下效果最佳,能够找到决策算法中的最佳参数。但决策树算法仍然存在过拟合的问题。

决策树算法与k-最近邻算法的比较...

决策树算法与k-最近邻算法的比较...PDF文件第1页

决策树算法与k-最近邻算法的比较...PDF文件第2页

决策树算法与k-最近邻算法的比较...PDF文件第3页

决策树算法与k-最近邻算法的比较...PDF文件第4页

决策树算法与k-最近邻算法的比较...PDF文件第5页