机器学习(ML)方法和工具正在重塑网络安全格局,从而增强了组织的整体准备,以确保流程和数据的机密性,完整性和可用性。在网络安全,独立响应和检测领域,正在广泛使用AI工具。这项研究深入研究了三种著名的机器学习算法(决策树,支持机器和神经网络)在增强防病毒决策和响应能力方面的有效性。我们的研究包括有关在网络安全事件响应和检测域中使用ML技术的广泛文献综述,已经产生了重要的发现。我们探讨了它们在定位和有效阻止传入的恶意软件方面的有效性,我们讨论了这些发现的含义,并建议未来的研究方向。关键字:机器学习,神经网络,决策树,支持向量机,内容分析,AI
有关针对中度或重度免疫功能低下者的 COVID-19 疫苗接种的更多信息,请访问 CDC 的针对中度至重度免疫功能低下者的 COVID-19 疫苗临床注意事项网站。
摘要:心脏病是全球主要健康挑战之一,其预防和治疗对于确保人们的健康至关重要。这项研究基于2020年堆叠的集合调查数据集用于心脏病分类。通过分析各种因素与心脏病之间的关系,我们探讨了机器学习模型在心脏病预测中的应用。研究发现,诸如空腹血糖,胆固醇和运动引起的心绞痛等因素与心脏病密切相关,而静息心电图和静止血压的影响相对较小。在比较的各种机器学习模型中,梯度提升决策树(GBDT)表现最好,具有高度的预测准确性和精确度。然而,该研究还指出了数据集的局限性以及模型的问题未完全释放其潜力。值得注意的是,这项研究还探讨了在心脏病预测中使用其他机器学习模型的可能性,并进行了比较分析,并提供了更多的预防心脏病预防和治疗参考。
糖尿病是一种慢性代谢性疾病,其特征是血糖升高,可导致眼睛和重要器官受损。2 型糖尿病是糖尿病的一种变体,最常影响 18 岁以上的成年人,这种变体引起的症状并不明显,识别它需要很长的测试过程。使用分类算法预测糖尿病,有助于在疾病早期阶段将风险降至最低,并帮助健康从业者控制糖尿病的影响。在本研究中,作者在 Pima Indian Diabetes 数据集上比较了决策树和 K-Nearest Neighbor 算法在预测糖尿病方面的表现。两种算法模型均使用 3 个数据集共享比率进行训练,分别为 80:20、70:30 和 65:35。此外,作者还实施了 GridSearchCV 超参数调整,以找到两种模型的最佳参数。两种模型的准确率、精确度、召回率和 F-1 分数用于确定哪种模型具有最佳性能。结果表明,未进行超参数调优的决策树算法在 70:40 的比例下效果最佳,准确率为 83.33%;KNN 算法中 K=7 为最优 K 值,准确率为 77.65%;进行超参数调优的 GridSearchCV 在 80:20 和 65:35 的比例下效果最佳,能够找到决策算法中的最佳参数。但决策树算法仍然存在过拟合的问题。
这项研究利用一系列机器学习算法来预测Ikpoba河的小时流量。数据收集依赖于沿河沿线安装的水透度系统,收集每小时测量量高度,环境温度和大气压。将量规高度转换为流量数据,从Ikpoba河等级曲线中提取了涵盖2015年至2020年期间的历史量规和流量数据,并使用曲线拟合技术对水流和量规高度之间的精确关系进行了分析。使用各种拟合度措施,例如调整后的R平方值,估计标准误差和确定系数,用于识别最佳拟合关系。随后使用土壤和水评估工具对估计的流量数据进行了验证,并结合了研究区域的数字高程模型,以及其他输入参数,例如土壤,坡度,每日最大降水量和每日最高温度。使用Microsoft Excel中生成的回归图进行了验证结果。从机器学习结果中,随机森林算法在预测流量方面的其他方法优于其他方法,均为0.02的均值误差和确定系数为0.98。相反,决策树在预测单个数据点方面表现出了较高的准确性,最低的根平方误差为0.02。
是否前往过一个没有疫情爆发,但有证据表明过去 5 年内有基孔肯雅病毒在人类中传播的国家或地区 1 ,并且属于以下人群之一? 1. 年龄 >65 岁,特别是那些患有基础疾病的人,可能至少有中度接触 2 蚊子的风险?或者
决策树是最受欢迎的监督模式之一,因为它们的解释性和知识表示类似于人类的推理。常用的决策树归纳算法基于贪婪的自上而下策略。尽管已知这些方法是一种有效的启发式方法,但所得树仅在局部最佳,并且往往具有过于复杂的结构。另一方面,最佳决策树算法尝试立即创建整个决策树以实现全局最优性。我们通过设计针对决策树的生成模型在这些方法之间提出建议。我们的方法首先通过使用预训练的决策树模型来学习潜在的决策树空间。然后,它采用了一种遗传程序来探索这种潜在空间,以找到具有良好预测性能的紧凑型决策树。我们将我们的建议与覆盖树诱导方法,最佳方法和结合模型进行了比较。结果表明,我们的建议可以产生准确而浅的,即可解释的决策树。
尽管对文本和图像数据进行了深度学习的成功,但基于树的集合模型仍然是使用异质表格数据的机器学习的最新。但是,由于其高灵活性,因此非常需要基于表格的基于梯度的方法。在本文中,我们提出了Grande,Gra Die n t-d ecision树E nSembles,这是一种使用端到端梯度下降的努力学习的新方法。Grande是基于树形合奏的密集表示,该代表允许使用直线操作员使用backpropaga,以共同优化所有模型参数。我们的方法结合了轴对齐的分裂,这是对TAB-ular数据的有用电感偏差,并具有基于梯度的优化的灵活性。此外,我们引入了一个高级实例的加权,以促进单个模型中简单和复杂关系的学习代表。我们对预定义的基准进行了广泛的评估,并与19个分类数据集进行了广泛的评估,并证明我们的方法在大多数数据集上都优于现有的梯度增强和深度学习框架。该方法可在:https://github.com/s-marton/grande
鉴于它们能够用宽阔和狭窄的自然光谱杀死细菌,因此在开发新药物来打击抗生素耐药性的新药中,出现了使用细菌素的使用。因此,对于可以准确预测新型细菌蛋白的精确且有效的计算模型产生了令人信服的要求。机器学习能够从细菌素序列中学习模式和特征的能力,这些序列很难使用基于序列匹配的方法捕获,这使其成为准确预测的潜在优越选择。使用机器学习方法,在本研究中创建了用于预测细菌素的Web应用程序。使用交替决策树(ADTREE),遗传算法(GA)和线性支持向量分类器(线性SVC)基于基于的特征评估方法选择了应用程序中使用的功能集。最初,从细菌蛋白和非细菌蛋白蛋白序列的物理化学,结构和序列属性属性中提取了潜在特征。我们使用Pearson相关系数评估了候选人的特征,然后对Adtree,GA和Lineare SVC进行了单独的评估,以消除不必要的特征。最后,我们构建了随机森林(RF),支持向量机(SVM),决策树(DT),Logistic回归(LR),K -Neart -Neart Neirbors(KNN)和GaussianNaïve的贝叶斯(GNB)模型,使用功能集降低。,我们使用具有ADTREE还原功能的SVM获得了总体性能模型,在测试数据集中获得了99.11%的精度,AUC值为0.9984。我们还评估了相对于我们先前开发的软件解决方案,一种基于序列对齐的工具和深度学习方法,每个还原功能集的最佳模型的预测能力。开发了一种标题为BPAGS(基于ADTREE,GA和Linear SVC的细菌素预测)的Web应用程序,以合并使用ADTREE,GA和基于线性SVC的特征集构建的预测模型。当前,基于Web的工具提供了具有关联概率值的分类结果,并具有在培训数据中添加新样本以提高预测效率的选项。bpags可以在https://shiny.tricities.wsu.edu/bacteriocin-预测中自由访问。
抽象的糖尿病早期检测对于减少疾病引起的后果非常重要。糖尿病受许多因素影响,因此进行诊断需要复杂的分析。用于分析糖尿病预测的数据集使用机器学习算法。机器学习算法用于根据已将其设置为输入的因素对患有糖尿病的人进行分类。诊断/预测的结果并非完美,这是由于许多错误分类引起的。为了减少分类错误,建议应用决策树和提升技术。本研究中使用的分类算法是随机森林。实验结果表明,决策树和增强技术以及两者的组合可以减少糖尿病预测中的错误分类。关键字:糖尿病;专家系统;决策树和提升