马来西亚国家健康和发病率调查显示,五分之一的马来西亚成年人被诊断出患有糖尿病。它存在于不同年龄段的人群中,尤其是在年轻人中发现的,因为只能在某些需要特殊设备的地方进行测试。必须开发能够产生高精度预测的工具。这项研究经过了选择一个辅助数据集的选择,该数据集包含17个属性,没有无关的数据和缺失值,并将其作为基本算法模型,支持向量机(SVM)以及机器学习知识开发的集合模型。使用SelectKest为每个模型选择了数据集中的前五个最受影响的功能,以在数据集上进行训练和测试,并实现了更高的准确性预测结果。比较了三个模型的预测,并在集合模型中合并了Adaboost和SVM的结果。开发了糖尿病预测原型,以比较使用观察到的数据集比较三种方法的准确性。这项研究得出结论,整体模型给出了糖尿病预测的最高精度,并且可能被认为是糖尿病预测工具中最合适的方法。
主要关键词