摘要。这项研究使用三种不同的机器学习算法来构建用于糖尿病预测的模型,并比较每个模型的准确性,这些算法是K最近的邻居(KNN),逻辑回归和特质梯度提升(XGBoost)。这项研究的目标是找到一种用于糖尿病预测的精确算法,这确实是为医生诊断糖尿病的导电性。以这种方式,患者可以按时获得适当的治疗。在构建模型之前,数据集是通过标准缩放和综合少数族裔过度采样(SMOTE)来进行处理的,以平衡类。然后,使用网格搜索简历来找到模型的最佳参数。最后,结果表明,KNN的精度为82%,其次是XGBoost的精度,为79.87%,而Lo-Cistic回归为75.5%。KNN算法的优点是,它仅考虑训练样本与新样本之间的距离,这些距离将在没有任何其他计算的情况下预测。结果,KNN在这三种算法中表现出了最佳性能。将来,本研究可以扩大数据集的大小并尝试更多参数,以便在糖尿病预测模型上获得更高的准确性。
生物序列最近的邻居搜索在生物信息学中起有趣的作用。减轻二次复杂性对常规距离计算的痛苦,神经距离嵌入(将项目序列置于几何空间中)已被公认为是有希望的范式。为了维持序列之间的距离顺序,这些模型所有部署三重态损失并使用直观方法来选择三胞胎的子集,以从广阔的选择空间中进行训练。但是,我们观察到,这种训练通常使模型只能区分一小部分距离顺序,从而使其他人未被认可。此外,天真地选择了更多的三胞胎进行最新的网络下的培训,不仅增加了成本,而且还增加了模型性能。在本文中,我们介绍了Bio-KNN:KNN搜索框架 - 生物序列的工作。它包括一种系统的三重态选择方法和一个多头网络,增强了所有距离订单的识别而不增加培训费用。最初,我们提出了一种基于聚类的方法,将所有三重态分为具有相似支持的几个群集,然后使用创新策略从这些群集中选择三胞胎。同时,我们注意到同一网络中同时培训不同类型的三胞胎无法实现预期的性能,因此我们提出了一个多头网络来解决此问题。我们的网络采用卷积神经网络(CNN)来提取所有群集共享的本地效果,然后分别学习一个分别为每个群集学习多层启示(MLP)头。此外,我们将CNN视为特殊的头部,从而将以前模型中忽略的关键特征整合到我们的模型中以获得相似性识别。广泛的实验表明,我们的生物KNN在两个大规模数据集上的最先进方法显着优于而没有增加培训成本。
这种疾病在人类中是普遍的。攻击人类的疾病不认识任何人,也不知道年龄。一个人所经历的疾病从普通水平开始,直到可能严重到处于死亡风险的地步。在这项研究中,进行了早期诊断与糖尿病有关的糖尿病是糖尿病是患者体内糖水平低于正常水平的疾病。受害人经历的症状包括频繁的口渴,尿液频繁,频繁饥饿和体重减轻。基于这些问题,需要一个系统可以快速发现患者所经历的诊断。这项研究旨在根据早期症状在早期诊断糖尿病。使用的方法是基于KNN和基于Web的模糊C均值。创建基于Web的系统可以代表医疗人员专家以快速诊断的糖尿病方法。该系统是嵌入糖尿病特征的计算机程序。测试KNN和模糊的C均应用程序的应用和方法对于K-最近的邻居方法的准确度为96%,而对于使用混淆矩阵计算的模糊C-Means方法,获得了96%的精确度,因此可以得出结论,因此可以得出结论,即Fuzzy C-Means方法比K-nearears方法更好。
摘要:脑电图 (EEG) 信号分类在开发残疾人辅助康复设备中起着重要作用。在此背景下,从 20 名健康人身上获取脑电图数据,然后进行预处理和特征提取过程。提取 12 个时间域特征后,采用两个著名的分类器,即 K 最近邻 (KNN) 和多层感知器 (MLP)。采用五重交叉验证方法将数据分为训练和测试目的。结果表明,MLP 分类器的性能优于 KNN 分类器。MLP 分类器实现了 95% 的分类器准确率,这是最好的。本研究的结果对于在线开发脑电图分类模型以及设计基于脑电图的轮椅非常有用。关键词:运动想象,脑电图信号,KNN,MLP,ICA。介绍
文章历史记录:收到:2021年1月10日;修订:2021年2月12日;接受:2021年3月27日;在线发布:2021年4月28日摘要:情感是我们日常生活中必不可少的组成部分。尽管如此,脑部计算机界面(BCI)系统尚未达到解释情绪的必要水平。基于BCI框架的经编程的感觉确认是最后几十年来非凡询问的点。脑电图(EEG)信号是这些框架的重要资产之一。EEEG可能是通过头皮在脑波框架内从脑工作中记录的生理标志。利用脑电图信号的最大优势是它反映了真实的感觉,并且可以通过计算机框架有效地准备。一个虚拟数据集可以使用并填充脑电图数据,以计算和分类从脑电图信号生成的这些信号。此处使用的数据集是种子,可以通过称为K-Nearest(KNN)算法的机器学习技术来习惯它来系统化数据。实验性能通过种子分类期间的94.06%的分类值实现。这种提出的方法表明,通过脑电图信号,情绪识别如积极,中立和负面是可能的。
摘要。如今,在线评论和推荐系统在维护各种领域任何产品的质量方面发挥着重要作用。客户必须评估产品并根据自己的兴趣提供正面和负面评论。教育领域有各种评估阶段,即与员工相关、与学生相关和与组织相关等。通常,由于他们自己的协议和系统,评论仅限于特定的学院或大学。提出的框架是根据各自的配置实现通用评论系统。引入了各种模板以获得准确的评论和良好的评估结果。该框架使用抽象层建模。用户界面层为使用定制设计系统的用户提供完整支持。审查层通过检索和存储凭证以进行进一步审查处理来处理不同的所有数据。应用程序配置层用于提供模板,用于分配凭证和授权,并完成系统配置。最终报告用于评估过程,以采取纠正措施进一步改进。对评论进行分类是为了实现高水平的准确性。该框架的主要目标是使用 KNN(K 最近邻)算法对学生评论进行高效分类。
摘要。季节性对年间气候预测对社会,商业,农业以及人类生活几乎所有方面的影响,迫使科学家对此事进行适当关注。最近几年在这一领域显示了巨大的成就。到目前为止,所有系统和技术都开发了,将海面温度(SST)用作主要因素,以及其他季节性的属性属性。然后将统计和数学模型用于进一步的气候预测。在本文中,我们开发了一个使用区域历史天气数据(降雨,风速,露点,温度等)的系统。),并将数据挖掘算法“ k-nearest邻居(KNN)”应用于这些历史数据的分类中。k最近跨度(K最近的邻居)进行预测天气。我们的实验表明,该系统会在合理的时间内提前几个月内产生准确的结果。
3. 使用 K 最近邻 (KNN) 方法进行分析 K 最近邻 (KNN) 是一种通过考虑现有属性和训练样本来对新对象进行分类的算法。分类不需要使用模型,而仅基于记忆。在该算法中,将在查询点中搜索若干个𝐾个最近的训练点,并根据这些𝐾点中的大多数进行分类。 KNN 采用基于邻域的分类方法,通过计算查询实例到训练样本的最短距离来确定 KNN。 KNN算法对于预测新物体的分类非常简单而且有效。使用KNN方法的步骤如下:
a b s t r a c t全球死亡率是心脏病,而早期鉴定对于限制疾病的发展至关重要。早期检测心血管疾病的方法有助于确定高风险人士应该发生的进展,从而降低了风险。主要目标是通过在心脏情况下识别异常来挽救生命,这将通过识别和分析从心脏信息中产生的原始数据来执行。机器学习可以提供有效的方法来做出决策和创建准确的预测。机器学习技术已在医疗业务中广泛使用。在拟议的研究中提供了一种独特的机器学习技术,以预测心脏病。计划的研究利用了Kaggle的开源心脏病数据集。用于机器学习预测的混合算法是许多以前旨在提高效率并产生改善结果的方法的逻辑混合物。提出的工作引入了一种混合方法,该方法采用分类概念进行预测分析。我们使用实际患者数据来构建一种预测心脏病的混合技术。KNN和SVM分类技术。jupyter笔记本用于实现此混合方法。一种混合技术在心脏病的预测分析中优于其他算法。1。简介从一系列原始数据集收集可用信息和模式的实践通常称为数据挖掘。它包括使用一种或多种技术分析大量数据和发现趋势或模式。它在各种情况下都有用,包括分析,研究和医疗保健。因为数据挖掘是一种调查方法,而且医疗保健的许多出色的早期预测系统已经从医疗数据集中发展,这可以检测大量数据的趋势(J. H. Joloudari等,2019)。提高
机器了解和基于记录的完全预测和诊断冠状动脉疾病的技术可能是一项非凡的医疗收益,但这是改进的主要意义。在许多国家 /地区,可能缺乏心血管专业人员,并且可以通过对虚拟患者信息的医疗决策分析来建立正确且强大的早期心脏预测来解决大量误诊的实例。这是针对目的,以挑选出过多的跨性能设备,以了解用于此类诊断目的的变体。已经使用了几种使用小工具到知识的算法,这些算法可能与预测心脏病的准确性和准确性相比。每个细节的重要性得分限制为除MLP和KNN以外使用的所有算法。所有元素都是完全基于成本点来计算的,以找到提供高危险冠心病预后的人。外观发现,使用Kaggle的3段心脏数据库,基于Pro-K(KNN),选择树(DT)和随机森林(RF)RF技术算法完成了97-2%的精度和97.2%的敏感性。因此,我们观察到,可以使用一组规则的易于监督的机器可以使用最佳的准确性和最令人满意的用途来使冠心病的猜想。关键字:MLP,KNN,选择树,随机森林,心脏数据库。