印度尼西亚尼格利·塞马朗大学摘要。目的:本研究旨在比较PNN和K-NN算法,以确定用于糖尿病分类的准确性和速度。方法:本研究中使用了两种算法,即概率神经网络(PNN)和K-Nearest邻居(K-NN)。使用的数据是PIMA印第安人糖尿病数据库。数据集包含768个带有8个属性和1个目标类别的数据,即无糖尿病为0,糖尿病为1个。数据集已分为80%的培训数据和20%的测试数据。结果:实现K折交叉验证后获得精度(k = 4)。准确性结果表明,与PNN相比,K-NN算法具有更好的快速性。K-NN算法的所有功能的精度为74.6%,四个功能的精度为78.1%。新颖性:本文的新颖性是通过关注分类算法中的数据预处理,特征选择和K折的交叉验证来优化和提高准确性。关键字:数据挖掘,功能选择,K-折叠验证,k-nearest邻居,2023年2月6日收到的概率神经网络 / 2023年2月9日 / 2023年9月14日接受修订。
电子邮件; iChannadafitria@gmal.com*摘要。糖尿病(DM)是一种代谢性疾病,其特征是由于胰岛素缺乏症而引起的高血糖水平。导致糖尿病(DM)的因素是生活方式,包括饮食,缺乏运动,监测血糖和药物。大多数人没有意识到自己有DM,只有在遇到严重症状的情况下才能发现。为避免这种情况,可以使用K-Neartiment(KNN)方法来预测患糖尿病的可能性。这项研究的目的是使用K-Neartheber(KNN)方法对糖尿病进行分类,并通过健康的生活方式改变使人们更加了解疾病的风险。根据研究人员的需求(包括年龄,BMI,胰岛素,皮肤厚度,葡萄糖,糖尿病,遗传学和胰岛素)对从Dharma Husada诊所收到的数据进行分类。这项研究是通过三个主要步骤进行的:数据集输入,预处理和评估。第一阶段是数据分析,该数据分析是从输入数据集来训练和测试模型的数据,每个数据元素都具有某些特征(属性)和类。预处理步骤包括培训数据生成和数据清洁,其中包括卫生,小写,标准化,停止词,茎和令牌化。最后一步是评估。评估包括构建评估模型并衡量准确性的水平,建立预测模型并保存模型。。k值太小会导致过度拟合,而太大的k值可能会导致不合格。。Latar Belakang这项研究表明,K-Nearest邻居(KNN)方法可用于对糖尿病(DM)进行分类,但尤其是在一个由245个日期和8个属性组成的小数据集中,对于30岁的患者而言,它不准确。howver,如果数据量很小,那么K的选择可能会产生很大的影响。关键字:糖尿病,KNN,抽象数据集。糖尿病(DM)是一种代谢性疾病,其特征是由于缺乏胰岛素而导致高血糖水平。导致糖尿病(DM)的因素,即生活方式,包括饮食模式,缺乏运动,监测血糖和治疗。大多数人没有意识到自己患有这种DM疾病,只知道何时出现严重的症状。为避免这种情况,可以使用k-nearest邻居(KNN)方法来预测糖尿病的可能性。这项研究的目的是使用K-Neartialt Neighboar(KNN)方法对糖尿病进行分类,并通过健康的生活方式改变使人们更加了解疾病的风险。根据研究人员的需求,包括年龄,BMI,胰岛素,皮肤厚度,葡萄糖,糖尿病,遗传学和胰岛素的需求,对从Dharma Husada诊所收到的数据进行了分类。这项研究是通过三个主要步骤进行的:数据集输入,预处理和评估。第一阶段是数据分析,该数据分析是输入数据集来训练和测试模型的数据分析,每个数据元素都具有特征(属性)和某些类。预处理步骤包括创建培训数据和清洁数据,其中包括卫生,小写,标准化,停止词,茎和令牌化。最后一步是评估,评估,包括建立评估模型并衡量准确性,构建预测模型和存储模型的水平。这项研究表明,可使用K-Nearthign(KNN)方法可用于对糖尿病(DM)进行分类,但主要是在一个由245个日期和8个30岁患者的小型数据集中进行分类。k值太小会导致过度拟合,而太大的k值可能会导致不合格。但是,如果数据量很小,则K的选择可能会产生很大的影响。关键字:糖尿病,k-nearest邻居(KNN),数据集1。
认可吸引了很多人群。例如,它已用于大多数现代设备的安全性。使用机器和深度学习,将提高整体性能,并且标识精度将更加精确。我们旨在发现这些算法在分类人的面部表情中的表现以及我们是否可以依赖它们。步骤如下。首先,我们嵌入数据集中的图像,然后将数据集分为70%的培训数据和30%的测试数据;之后,我们采用五种不同的算法:支持向量机,k-nearest邻居,逻辑回归,天真的贝叶斯和随机森林。支持向量机的准确率为36%,K-Nearest邻居的准确率为52.3%,逻辑回归的精度为64.2%,而天真的贝叶斯的准确率达到了38.1%的准确率。随机森林的准确率为51.7%。使用的数据集是FER13数据集的清洁版本,其中包含16,780个图像分为五个类(愤怒,快乐,中立,厌恶和恐惧)。结果表明,逻辑回归被证明是所介绍的分类器最准确的分类器,F1得分为63.8%,精度为64.2%。
本研究旨在鉴定水中的影响参数和重金属,并评估巴基斯坦三个地区高山冰川湖和河流的水质分类。为此,使用九个水质参数(CD,CR,PB,Ni,Fe,AS和TDS)中的Mg/L,pH,EC µS/CM用于计算水质指数(WQI)。Boruta方法用于识别与水质类别相关的影响参数。此外,我们采用了监督的机器学习模型,包括决策树,最近的邻居方法,神经网络模型(多层感知),支持向量机和随机森林,以预测和验证水质类别。所有算法的性能通过精度度量评估。验证集的准确率为决策树模型的精度为83%,K-Neartheniber方法为75%,神经网络为83%,支持向量机器为88%,随机森林模型为88%。观察到的位置的水质评估指定了重要的见解,表明49%的位置表现出低水质量。根据当前的研究,政府应通过实施适当的措施设计的水监测系统和创新技术来解决巴基斯坦受影响地区水质的问题。
感谢我的邻居 David AM Wilensky,他既是遛狗人,又是文字编辑兼组织者,他花了很多时间帮助我把所有活动部分都安排好。衷心感谢 Heinemann 团队,从编辑到制作,从设计到营销,他们不知疲倦地处理从大到小的所有细节,使这本书易于阅读、易于使用、视觉效果令人惊叹,并且可供所有人使用:
感谢我的Dog Walker-Slash-copy编辑编辑 - 施法者邻居David A. M. Wilensky,他花了很多时间帮助我将所有活动部件保持一致。非常感谢Heinemann团队,从社论到制作,设计再到市场营销,不懈地仔细研究所有细节,从大到很小
机场的上一个总体规划和 ALP 于 1997 年 9 月完成。在这 26 年中,机场、周边社区和航空业发生了许多变化。这促使机场继续进行总体规划,以确保机场准备好满足未来的需求,同时优化其资源的使用,并确保它继续成为雷丁顿镇、亨特顿县和新泽西州中部社区的良好经济和环境邻居。
我们考虑由小型自主设备组成的网络,这些设备彼此之间以无线方式进行通信。在设计此类网络的算法时,最小化能耗是一项重要的考虑因素,因为电池寿命是一种至关重要且有限的资源。在发送和接收消息都会消耗能量的模型中,我们考虑在任意且未知拓扑的无线电网络中寻找节点的最大匹配的问题。我们提出了一种分布式随机算法,该算法以高概率产生最大匹配。每个节点的最大能量成本为 O (log 2 n) ,时间复杂度为 O (∆ log n) 。这里 n 是节点数的任意上限,∆ 是最大度的任意上限;n 和 ∆ 是我们算法的参数,我们假设所有处理器都先验地知道这些参数。我们注意到,存在图族,对于这些图族,我们对能量成本和时间复杂度的界限同时达到多项对数因子的最优,因此任何重大改进都需要对网络拓扑做出额外的假设。我们还考虑了相关问题,即为网络中的每个节点分配一个邻居,以便在节点最终发生故障时备份其数据。此处,一个关键目标是最小化最大负载,其定义为分配给单个节点的节点数。我们提出了一种高效的分散式低能耗算法,该算法可以找到一个邻居分配,其最大负载最多比最优值大一个 polylog(n) 因子。
糖尿病是一种慢性代谢性疾病,其特征是血糖升高,可导致眼睛和重要器官受损。2 型糖尿病是糖尿病的一种变体,最常影响 18 岁以上的成年人,这种变体引起的症状并不明显,识别它需要很长的测试过程。使用分类算法预测糖尿病,有助于在疾病早期阶段将风险降至最低,并帮助健康从业者控制糖尿病的影响。在本研究中,作者在 Pima Indian Diabetes 数据集上比较了决策树和 K-Nearest Neighbor 算法在预测糖尿病方面的表现。两种算法模型均使用 3 个数据集共享比率进行训练,分别为 80:20、70:30 和 65:35。此外,作者还实施了 GridSearchCV 超参数调整,以找到两种模型的最佳参数。两种模型的准确率、精确度、召回率和 F-1 分数用于确定哪种模型具有最佳性能。结果表明,未进行超参数调优的决策树算法在 70:40 的比例下效果最佳,准确率为 83.33%;KNN 算法中 K=7 为最优 K 值,准确率为 77.65%;进行超参数调优的 GridSearchCV 在 80:20 和 65:35 的比例下效果最佳,能够找到决策算法中的最佳参数。但决策树算法仍然存在过拟合的问题。
AES致力于成为一个好邻居,开发更绿色,更智能的解决方案,以改善生活,并在我们经营的社区中产生积极的影响。我们的人民与利益相关者紧密合作,以确保清洁能源过渡的好处公平地累积,同时尊重当地社区和文化的价值。,我们通过社会影响伙伴关系和与联合国的可持续发展目标和四个社会影响支柱保持一致的计划来创造长期价值: