糖尿病是一种威胁生命的疾病,应尽早诊断和治疗。在本文中,递归特征消除率(RFE)和遗传算法(GA)已被用于两种不同患者遗产的两个不同糖尿病数据集的特征选择(FS),并与K-Nearest邻居(KNN)和最佳的糖尿病预测相结合。在我们的论文中,与KNN相比,RF表现出更好的性能。准确度级别也很大程度上取决于所使用的数据集。伊拉克社会糖尿病(ISD)数据集的准确性明显高于使用相同的FS和分类方法的PIMA印度糖尿病(PID)数据集。通过将KNN与RFE或GA结合在FS中可以提高,而与RF结合使用时,RF与COMEN -COMEN -CONDING一起使用。GA在计算上的效率低于RFE,并且表现出较低的精度。
我们希望确保学生彻底理解文本分类的所有步骤。为此,我们强调了 (1) 词向量、(2) K-最近邻 (KNN) 算法和 (3) 分类偏差的概念。然后,学生在 (4) 编程活动和最终项目中展示了他们的理解。1.词向量:向学生介绍了如何用词向量以数字形式表示单词的概念。我们通过示例创建了包含单词“公主”的词向量,并确定其向量中与“皇室”、“男性气质”、“女性气质”和“年龄”相对应的数字应该高还是低。2.KNN 算法:为了更好地理解 KNN 算法,学生使用在二维图上绘制的单词的视觉效果 [ 4 ]。他们了解了 K 参数的选择如何影响算法的输出。3.分类偏差:为了说明分类偏差,学生使用词语类比网站来绘制诸如“护士”、“医生”等工作,
摘要:糖尿病是一个重大的全球健康问题,早期发现和对该疾病状态的分类对于有效的管理非常重要。在这种情况下,本研究的目的是在糖尿病状态分类中使用K-Nearthent邻居(KNN)算法实施机器学习模型。为了促进用户简单的交互和更好的理解,基于简化的Web应用程序是作为接口开发的。相关数据集糖尿病用于训练和测试已实施的KNN模型。研究方法包括收集和预处理数据的阶段,参数选择,模型培训以及模型的绩效评估。结果表明,通过简化应用程序实施的KNN模型能够以良好的准确性对糖尿病的状态进行分类。用户可以根据输入的数据轻松访问和使用此应用程序来获取糖尿病状态的预测。这项研究有可能通过机器学习方法和Web技术来提高公共可访问性和对糖尿病状况的理解。此外,这项研究的结果可能是疾病检测和整体健康监测领域进一步发展的基础。
随着社会快速发展的速度,人们的生活变得更加复杂,因此他们没有时间注意自己的食物模式和健康习惯。因此,许多人患有糖尿病,压力和胆固醇等非传染性疾病。因此,该提出的系统基本上考虑了2型糖尿病患者,并且作为主要目的,该系统使用建议的算法为用户提供了三种餐食计划。此外,该系统还提供了患者的日常活动习惯监测系统,该系统的最终输出是作为Android移动应用程序开发的,以将产品介绍给市场,并将其命名为U-Health。用于生成算法过程的进餐计划,已被使用随机森林和k-nearest邻居(KNN)机器学习算法。和食品数据集是为斯里兰卡食品风格创建的,以生成算法和KNN用于对食物数据集的过程进行分类,并使用随机森林来创建餐食计划准备的决定,进餐准备树的准确性为84.33%,与其他饮食准备模型进行比较时,与其他饮食量相比[3],请诊断三个主要的饮食量[3],分别供您使用,以备为晚餐的饮食量[3],相比之下。关于用户健康事实,食品崇拜,食物过敏,营养含量,性别,年龄和用户BMI,BMR计数被用作KNN算法中的K值,用于食品分类过程。关键字:决策树,绝热患者,食物扫描,健康监测系统,K-Nearest邻居算法(KNN)。
摘要。流动性风险是巨大的财务威胁,其管理不善会导致重大财务损失。本研究研究了机器学习技术(例如KNN,SVM,决策树,RF和XGBOOST)在印度银行的流动性风险中的应用。2013 - 2022年的财务数据分析了31个商业银行。模型将财务比率用作预测因素,流动性风险由流动资产与总资产和贷款比率相关。尽管由于样本较小而导致的普遍性限制,但结果表现出诸如KNN和XGBoost等算法的潜力,以预测准确的流动性风险。该研究的发现表明,使用液体资产将液体资产用于总资产来替代流动性风险的模型给予了KNN的最佳结果,并分别给出了MAE和MSE评分0.129和0.027。当使用存款贷款以替代流动性风险时,DT是表现最好的算法,MAE和RMSE得分分别为0.191和0.231。还发现,与其他选定模型相比,MLP表现不佳。实际含义包括使用这些技术为印度银行开发流动性预警系统。
摘要:经过人类数千年的努力,产生了大量的音乐流派。因此,寻找能够自动对音乐流派进行分类的算法已成为现代数字音乐产业发展的关键问题。此外,找出哪种算法可以更准确地完成任务可以大大提高实际应用中的效率,例如根据用户最常听的音乐发送用户感兴趣的音乐。本研究比较了几种音乐流派分类算法的使用,并证明了音乐流派分类在现代数字应用中的重要性,并确定了不同算法的优缺点。本研究主要集中在使用 GTZAN 数据集的 K-最近邻 (KNN) 和卷积神经网络 (CNN) 上。本研究讨论了 CNN 捕捉复杂时间和频谱模式的能力,以及 KNN 在基于特征接近度进行流派识别的有效性。结果证明了 KNN 的可靠性、准确性和适应性。为算法在技术驱动的音乐产业中的实际应用提供了见解。
降水在有效管理水资源和维持储层水位中起着至关重要的作用。然而,气候变化发生了显着改变的降水模式,导致了极端的水文事件,例如干旱和洪水,这些事件具有深远的社会经济和环境影响。本研究的重点是使用机器学习模型预测上印度河盆地(UIB)中的降水事件。在这项研究中,采用了三种广泛使用的机器学习算法支持向量机(SVM),K-Nearest邻居(KNN)和随机森林(RF),以预测UIB中的降水事件。数据集分为培训(80%)和测试(20%)子集进行模型评估。在测试的算法中,KNN表现出最佳的预测性能,得出的平均绝对误差(MAE)为2.662,根平均平方误差(RMSE)为16.3,R²得分为0.879,总准确度为83.16%。结果表明,KNN算法是UIB中降水预测的最有效的机器学习模型。这项研究的结果有助于改善预警系统,并在面对气候变化和极端天气事件的情况下促进有效的水资源管理。
摘要:由于每天有越来越多的心脏病病例,因此要预见到任何前瞻性问题很重要,并且有关。完成这种困难的诊断需要准确性和敏捷性。i将创建一个系统,该系统仅使用许多机器学习技术,包括此类回归模型,随机森林和KNN,预测患者是否会根据患者的病史诊断患有心脏病。该模型以一种非常有益的方法来控制,以提高每个个体心肌梗塞预测的准确性。在建议的模型中使用了随机森林,KNN和逻辑回归,该模型的优势是,比以前使用的分类器(如Naive Bayes)具有更高精度的特定人的心脏病症状。这些技术也将比其他分类器(如Naive Bayes)显示出更好的准确性。因此,通过使用提出的模型来评估分类器将准确,始终检测到心血管疾病的可能性,从而降低了大量压力。该实验教会了我们很多我们可以利用的人来预测谁将患上心脏病。关键字:随机森林,KNN,逻辑回归,机器学习,预测。
方法此机器学习模型是在Google Colab中编码的,我们使用了编程语言Python。我们使用诸如Pandas,KneighBorsRegressor和Train_test_split之类的库进行数据操纵,构建和培训机器学习模型,以及对模型的测试和验证。KNN模型使用7个邻居来预测测试数据集目标。将培训和测试数据集加载到熊猫数据框架上进行数据操作。然后,我们通过将功能与目标分离来分开训练数据集。培训数据集被拆分,其中80%的数据用于培训,其余数据用于验证。我们在培训数据集上训练KNN模型。然后该模型预测目标。我们使用均方根误差来评估预测。
电子邮件; iChannadafitria@gmal.com*摘要。糖尿病(DM)是一种代谢性疾病,其特征是由于胰岛素缺乏症而引起的高血糖水平。导致糖尿病(DM)的因素是生活方式,包括饮食,缺乏运动,监测血糖和药物。大多数人没有意识到自己有DM,只有在遇到严重症状的情况下才能发现。为避免这种情况,可以使用K-Neartiment(KNN)方法来预测患糖尿病的可能性。这项研究的目的是使用K-Neartheber(KNN)方法对糖尿病进行分类,并通过健康的生活方式改变使人们更加了解疾病的风险。根据研究人员的需求(包括年龄,BMI,胰岛素,皮肤厚度,葡萄糖,糖尿病,遗传学和胰岛素)对从Dharma Husada诊所收到的数据进行分类。这项研究是通过三个主要步骤进行的:数据集输入,预处理和评估。第一阶段是数据分析,该数据分析是从输入数据集来训练和测试模型的数据,每个数据元素都具有某些特征(属性)和类。预处理步骤包括培训数据生成和数据清洁,其中包括卫生,小写,标准化,停止词,茎和令牌化。最后一步是评估。评估包括构建评估模型并衡量准确性的水平,建立预测模型并保存模型。。k值太小会导致过度拟合,而太大的k值可能会导致不合格。。Latar Belakang这项研究表明,K-Nearest邻居(KNN)方法可用于对糖尿病(DM)进行分类,但尤其是在一个由245个日期和8个属性组成的小数据集中,对于30岁的患者而言,它不准确。howver,如果数据量很小,那么K的选择可能会产生很大的影响。关键字:糖尿病,KNN,抽象数据集。糖尿病(DM)是一种代谢性疾病,其特征是由于缺乏胰岛素而导致高血糖水平。导致糖尿病(DM)的因素,即生活方式,包括饮食模式,缺乏运动,监测血糖和治疗。大多数人没有意识到自己患有这种DM疾病,只知道何时出现严重的症状。为避免这种情况,可以使用k-nearest邻居(KNN)方法来预测糖尿病的可能性。这项研究的目的是使用K-Neartialt Neighboar(KNN)方法对糖尿病进行分类,并通过健康的生活方式改变使人们更加了解疾病的风险。根据研究人员的需求,包括年龄,BMI,胰岛素,皮肤厚度,葡萄糖,糖尿病,遗传学和胰岛素的需求,对从Dharma Husada诊所收到的数据进行了分类。这项研究是通过三个主要步骤进行的:数据集输入,预处理和评估。第一阶段是数据分析,该数据分析是输入数据集来训练和测试模型的数据分析,每个数据元素都具有特征(属性)和某些类。预处理步骤包括创建培训数据和清洁数据,其中包括卫生,小写,标准化,停止词,茎和令牌化。最后一步是评估,评估,包括建立评估模型并衡量准确性,构建预测模型和存储模型的水平。这项研究表明,可使用K-Nearthign(KNN)方法可用于对糖尿病(DM)进行分类,但主要是在一个由245个日期和8个30岁患者的小型数据集中进行分类。k值太小会导致过度拟合,而太大的k值可能会导致不合格。但是,如果数据量很小,则K的选择可能会产生很大的影响。关键字:糖尿病,k-nearest邻居(KNN),数据集1。