抽象的糖尿病早期检测对于减少疾病引起的后果非常重要。糖尿病受许多因素影响,因此进行诊断需要复杂的分析。用于分析糖尿病预测的数据集使用机器学习算法。机器学习算法用于根据已将其设置为输入的因素对患有糖尿病的人进行分类。诊断/预测的结果并非完美,这是由于许多错误分类引起的。为了减少分类错误,建议应用决策树和提升技术。本研究中使用的分类算法是随机森林。实验结果表明,决策树和增强技术以及两者的组合可以减少糖尿病预测中的错误分类。关键字:糖尿病;专家系统;决策树和提升
是否前往过一个没有疫情爆发,但有证据表明过去 5 年内有基孔肯雅病毒在人类中传播的国家或地区 1 ,并且属于以下人群之一? 1. 年龄 >65 岁,特别是那些患有基础疾病的人,可能至少有中度接触 2 蚊子的风险?或者
鉴于它们能够用宽阔和狭窄的自然光谱杀死细菌,因此在开发新药物来打击抗生素耐药性的新药中,出现了使用细菌素的使用。因此,对于可以准确预测新型细菌蛋白的精确且有效的计算模型产生了令人信服的要求。机器学习能够从细菌素序列中学习模式和特征的能力,这些序列很难使用基于序列匹配的方法捕获,这使其成为准确预测的潜在优越选择。使用机器学习方法,在本研究中创建了用于预测细菌素的Web应用程序。使用交替决策树(ADTREE),遗传算法(GA)和线性支持向量分类器(线性SVC)基于基于的特征评估方法选择了应用程序中使用的功能集。最初,从细菌蛋白和非细菌蛋白蛋白序列的物理化学,结构和序列属性属性中提取了潜在特征。我们使用Pearson相关系数评估了候选人的特征,然后对Adtree,GA和Lineare SVC进行了单独的评估,以消除不必要的特征。最后,我们构建了随机森林(RF),支持向量机(SVM),决策树(DT),Logistic回归(LR),K -Neart -Neart Neirbors(KNN)和GaussianNaïve的贝叶斯(GNB)模型,使用功能集降低。,我们使用具有ADTREE还原功能的SVM获得了总体性能模型,在测试数据集中获得了99.11%的精度,AUC值为0.9984。我们还评估了相对于我们先前开发的软件解决方案,一种基于序列对齐的工具和深度学习方法,每个还原功能集的最佳模型的预测能力。开发了一种标题为BPAGS(基于ADTREE,GA和Linear SVC的细菌素预测)的Web应用程序,以合并使用ADTREE,GA和基于线性SVC的特征集构建的预测模型。当前,基于Web的工具提供了具有关联概率值的分类结果,并具有在培训数据中添加新样本以提高预测效率的选项。bpags可以在https://shiny.tricities.wsu.edu/bacteriocin-预测中自由访问。
摘要 非计划维护是航空公司的一大成本驱动因素,但状态监测和预测可以减少非计划维护操作的数量。本文表明,通过采用数据驱动方法和使用现有数据源,可以将状态监测引入大多数系统。目标是根据各种传感器输入预测系统的剩余使用寿命 (RUL)。我们使用决策树来学习系统的特性。决策树训练和分类的数据由通用参数信号分析处理。为了获得决策树的最佳分类结果,使用遗传算法优化参数。使用具有不同信号分析参数的三种不同决策树的森林作为分类器。使用来自 ETIHAD 航空公司的 A320 飞机的数据验证了所提出的方法。验证表明,状态监测可以将样本数据分为十个预定类别,以 10% 的步长表示总使用寿命 (TUL)。这用于预测 RUL。在 850 个样本中,有 350 个错误分类。降噪将异常值减少到接近零,从而可以正确预测状态。还可以使用分类输出来检测验证数据中的维护操作。
采用基于生物信号的输入的抽象人机接口很难转化为现实生活应用,部分原因是开发一般模型的困难来对代表用户行动的生理事件进行分类。在拟议的框架中,通过决策方法的管道来操作基于电视学(EOG)的游戏。这些包括使用卷积神经网络(CNN)的眼动物运动的分类模型,该模型以信号窗口创建的图像和公用事业决策网络(EUDN)的合奏为食,这使经常会冲突的事件的影响在实现更自然的控制级别的界面上,从而缓解了界面事件的影响。CNN和EUDN取代了EOG的正常使用的基于特征的眼事件检测方法。最后,一种基于强化的学习驱动方法同时更新了每个奖励结果的多个(状态,动作)对,干预以减轻错误的游戏命令的后果,并可以用作“共享控制”范围的一部分。结果显示,加强学习在改善参与者的游戏表现以及减少其一些主观工作量指标方面的积极影响。
摘要:在桥梁的动态条件下,我们需要实时管理。为此,本文提出了一种基于规则的决策支持系统,该系统从 Aimsun 交通微观模拟软件的模拟结果中提取必要的规则。然后,借助模糊规则生成算法对这些规则进行泛化。然后,通过一组监督和非监督学习算法对它们进行训练,以获得在实际情况下做出决策的能力。作为一项试点案例研究,在 Aimsun 中模拟了德黑兰的 Nasr 桥,并使用 WEKA 数据挖掘软件执行学习算法。根据这项实验,监督算法泛化规则的准确率大于 80%。此外,CART 决策树和顺序最小优化 (SMO) 为正常数据提供了 100% 的准确率,这些算法对于桥梁危机管理非常可靠。这意味着,可以使用此类机器学习方法在实时条件下管理桥梁。
背景:在当代医疗保健领域,实验室测试是推动精准医疗进步的基石。这些测试提供了对各种医疗状况的深入见解,从而促进了诊断、预后和治疗。然而,某些测试的可及性受到诸如高成本、专业人员短缺或地理差异等因素的阻碍,这对实现公平的医疗保健构成了障碍。例如,超声心动图是一种极其重要且不易获得的实验室测试。对超声心动图的需求不断增加,凸显了更高效的调度协议的必要性。尽管有这种迫切的需求,但在这一领域的研究却有限。目标:本研究旨在开发一种可解释的机器学习模型,以确定需要超声心动图检查的患者的紧急程度,从而帮助确定调度程序的优先级。此外,本研究旨在利用机器学习模型的高可解释性,深入了解影响超声心动图预约优先级的关键属性。方法:基于来自电子健康记录的大量现实世界超声心动图预约数据集(即 34,293 个预约),进行了实证和预测分析以评估患者的紧急程度,该数据集包含管理信息、转诊诊断和潜在患者状况。我们使用了一种最先进的可解释机器学习算法,即最佳稀疏决策树 (OSDT),该算法以高准确性和可解释性而闻名,来研究与超声心动图预约相关的属性。结果:与表现最佳的基线模型相比,该方法表现出令人满意的性能(F 1 -score=36.18%,提高了 1.7% 和 F 2 -score=28.18%,比表现最佳的基线模型提高了 0.79%)。此外,由于其高度可解释性,结果为通过从 OSDT 模型中提取决策规则来识别紧急患者进行测试提供了宝贵的医学见解。结论:该方法表现出了最先进的预测性能,证实了其有效性。此外,我们通过将 OSDT 模型得出的决策规则与既定的医学知识进行比较来验证这些决策规则。这些可解释的结果(例如 OSDT 模型中的属性重要性和决策规则)强调了我们的方法在优先考虑患者紧急程度的超声心动图预约方面的潜力,并且可以扩展到使用电子健康记录数据优先考虑其他实验室测试预约。
模型反转 [1] 和模型提取(窃取)攻击 [2] 是先进的对抗技术,可危及机器学习 (ML) 模型的安全和隐私。这些攻击从模型中提取敏感信息,例如训练数据和超参数。出于对日益增长的安全和隐私问题的担忧,文献中研究了越来越多的 ML-as-a-service 系统,这些系统提供使用机密数据训练的 ML 模型以及这些模型的可公开访问的查询界面。对黑盒 AI 模型可解释性的研究引发了一个新的研究课题可解释人工智能 (XAI) [3]。XAI 旨在描述难以被人类理解的 AI 模型的内部工作原理,以便可以描述模型的准确性、公平性、透明度和结果 [4]。其中一种方法是局部可解释模型不可知解释 (LIME) [5],它通过围绕该样本生成局部替代数据集来识别给定样本的最重要特征(影响 AI 的决策)。通过结合 XAI 产生的额外漏洞,可以增强对抗性 ML 攻击的能力。因此,我们提出了一种名为 AUTOLYCUS 的新型模型提取攻击,它使用来自 LIME 的模型解释来生成比最先进的攻击更少的查询,以揭示决策树模型的决策边界,并将这些边界提取到本地训练的代理模型。AUTOLYCUS 还可以从其他资源获得的样本中获取信息。这些资源可能包括先前采样的查询和其他数据集。我们演示
模型反转 [1] 和模型提取(窃取)攻击 [2] 是先进的对抗技术,可危及机器学习 (ML) 模型的安全和隐私。这些攻击从模型中提取敏感信息,例如训练数据和超参数。出于对日益增长的安全和隐私问题的担忧,文献中研究了越来越多的 ML-as-a-service 系统,这些系统提供使用机密数据训练的 ML 模型以及这些模型的可公开访问的查询界面。对黑盒 AI 模型可解释性的研究引发了一个新的研究课题可解释人工智能 (XAI) [3]。XAI 旨在描述难以被人类理解的 AI 模型的内部工作原理,以便可以描述模型的准确性、公平性、透明度和结果 [4]。其中一种方法是局部可解释模型不可知解释 (LIME) [5],它通过围绕该样本生成局部替代数据集来识别给定样本的最重要特征(影响 AI 的决策)。通过结合 XAI 产生的额外漏洞,可以增强对抗性 ML 攻击的能力。因此,我们提出了一种名为 AUTOLYCUS 的新型模型提取攻击,它使用来自 LIME 的模型解释来生成比最先进的攻击更少的查询,以揭示决策树模型的决策边界,并将这些边界提取到本地训练的代理模型。AUTOLYCUS 还可以从其他资源获得的样本中获取信息。这些资源可能包括先前采样的查询和其他数据集。我们演示
这项研究利用一系列机器学习算法来预测Ikpoba河的小时流量。数据收集依赖于沿河沿线安装的水透度系统,收集每小时测量量高度,环境温度和大气压。将量规高度转换为流量数据,从Ikpoba河等级曲线中提取了涵盖2015年至2020年期间的历史量规和流量数据,并使用曲线拟合技术对水流和量规高度之间的精确关系进行了分析。使用各种拟合度措施,例如调整后的R平方值,估计标准误差和确定系数,用于识别最佳拟合关系。随后使用土壤和水评估工具对估计的流量数据进行了验证,并结合了研究区域的数字高程模型,以及其他输入参数,例如土壤,坡度,每日最大降水量和每日最高温度。使用Microsoft Excel中生成的回归图进行了验证结果。从机器学习结果中,随机森林算法在预测流量方面的其他方法优于其他方法,均为0.02的均值误差和确定系数为0.98。相反,决策树在预测单个数据点方面表现出了较高的准确性,最低的根平方误差为0.02。