印度尼西亚是世界上糖尿病患者最多的国家之一。糖尿病会引起严重的并发症,对患者来说具有潜在危险。本研究旨在通过考虑糖尿病的各种风险,使用分类增强 (CatBoost) 算法开发一个准确的预测模型来对糖尿病进行分类。 CatBoost 因其良好处理分类数据的能力而闻名。这项研究的初始阶段是数据处理或预处理,包括数据清理以处理不干净数据的问题、处理具有极端值的数据以及纠正不适当的数据类型。接下来,使用 CatBoost 算法进行创建预测模型的阶段,这是一种有效的决策梯度增强方法。使用混淆矩阵进行模型评估以评估分类性能。研究结果显示,糖尿病分类的准确率相当高,根据数据中使用的属性,准确率为 98.63%。希望这项研究能够有助于增进人们对糖尿病风险及其导致的死亡率的了解和控制。关键词:算法,CatBoost,糖尿病,分类,预测 1.介绍 糖尿病(DM)是一种由遗传因素、环境、饮食和其他因素引起的自身免疫性疾病[1]。糖尿病是一种与胰腺健康相关的疾病,胰腺产生胰岛素激素的异常会导致血糖水平升高。人体内血糖水平升高会扰乱肾脏、心脏和大脑等重要器官的功能 [2]。 2019 年,世界卫生组织 (WHO) 指出,至少有 200 万人的死亡可归因于糖尿病 [3]。根据2018年印尼卫生部在抗击糖尿病世界大会上的官方报告,印尼是世界上糖尿病患者最多的国家,位列第六。数据显示,印度尼西亚 20-79 岁年龄段的糖尿病患者数量达到约 1030 万人 [4]。
主要关键词