电子邮件; iChannadafitria@gmal.com*摘要。糖尿病(DM)是一种代谢性疾病,其特征是由于胰岛素缺乏症而引起的高血糖水平。导致糖尿病(DM)的因素是生活方式,包括饮食,缺乏运动,监测血糖和药物。大多数人没有意识到自己有DM,只有在遇到严重症状的情况下才能发现。为避免这种情况,可以使用K-Neartiment(KNN)方法来预测患糖尿病的可能性。这项研究的目的是使用K-Neartheber(KNN)方法对糖尿病进行分类,并通过健康的生活方式改变使人们更加了解疾病的风险。根据研究人员的需求(包括年龄,BMI,胰岛素,皮肤厚度,葡萄糖,糖尿病,遗传学和胰岛素)对从Dharma Husada诊所收到的数据进行分类。这项研究是通过三个主要步骤进行的:数据集输入,预处理和评估。第一阶段是数据分析,该数据分析是从输入数据集来训练和测试模型的数据,每个数据元素都具有某些特征(属性)和类。预处理步骤包括培训数据生成和数据清洁,其中包括卫生,小写,标准化,停止词,茎和令牌化。最后一步是评估。评估包括构建评估模型并衡量准确性的水平,建立预测模型并保存模型。。k值太小会导致过度拟合,而太大的k值可能会导致不合格。。Latar Belakang这项研究表明,K-Nearest邻居(KNN)方法可用于对糖尿病(DM)进行分类,但尤其是在一个由245个日期和8个属性组成的小数据集中,对于30岁的患者而言,它不准确。howver,如果数据量很小,那么K的选择可能会产生很大的影响。关键字:糖尿病,KNN,抽象数据集。糖尿病(DM)是一种代谢性疾病,其特征是由于缺乏胰岛素而导致高血糖水平。导致糖尿病(DM)的因素,即生活方式,包括饮食模式,缺乏运动,监测血糖和治疗。大多数人没有意识到自己患有这种DM疾病,只知道何时出现严重的症状。为避免这种情况,可以使用k-nearest邻居(KNN)方法来预测糖尿病的可能性。这项研究的目的是使用K-Neartialt Neighboar(KNN)方法对糖尿病进行分类,并通过健康的生活方式改变使人们更加了解疾病的风险。根据研究人员的需求,包括年龄,BMI,胰岛素,皮肤厚度,葡萄糖,糖尿病,遗传学和胰岛素的需求,对从Dharma Husada诊所收到的数据进行了分类。这项研究是通过三个主要步骤进行的:数据集输入,预处理和评估。第一阶段是数据分析,该数据分析是输入数据集来训练和测试模型的数据分析,每个数据元素都具有特征(属性)和某些类。预处理步骤包括创建培训数据和清洁数据,其中包括卫生,小写,标准化,停止词,茎和令牌化。最后一步是评估,评估,包括建立评估模型并衡量准确性,构建预测模型和存储模型的水平。这项研究表明,可使用K-Nearthign(KNN)方法可用于对糖尿病(DM)进行分类,但主要是在一个由245个日期和8个30岁患者的小型数据集中进行分类。k值太小会导致过度拟合,而太大的k值可能会导致不合格。但是,如果数据量很小,则K的选择可能会产生很大的影响。关键字:糖尿病,k-nearest邻居(KNN),数据集1。
主要关键词