此外,一些研究应用了集合技术来改善结果。参考[6]进行了几种ML算法的比较:逻辑回归,线性判别分析,k-neart邻居,决策树,支持向量机,Adaboost分类器,梯度增强分类器,随机森林分类器,随机森林分类器和额外的树分类器。使用PIMA印度糖尿病数据集和早期糖尿病风险预测数据集评估了这些算法。与两个数据集中的其他机器学习算法相比,整体机器学习算法提供了更好的分类精度。在其他研究[7]中,使用了决策树,SVM,随机森林,逻辑回归,KNN和各种集合技术。该研究采用了PIMA印度糖尿病数据集和203名来自孟加拉国的女性患者的样本。此外,采用了Smote和Adasyn方法来解决阶级不平衡问题。XGBoost分类器与Adasyn方法结合使用,得出的结果最佳,获得了81%的精度,F1系数为0.81,AUC为0.84。
●Breiman(2001)首先提出了随机森林算法,但基于1995年的Tim Kan Ho●RF采用了两种集合技术:首先是训练样本,以种植基于不同培训训练数据的树木森林。第二个是特征空间的子采样。●如果我选择变量的子集(例如x1, x3, x7) to create a split in a node of a decision tree, and another subset (x2, x4, x5, x7) to create a different one, there will be events that get classified in a different way by the two nodes ● Often there is a dominant variables that is used to decide the split, offsetting the power of the subdominant ones.rf通过减少不同树的相关性来避免该问题
摘要本章探讨了机器学习中鲁棒性的基础概念(ML)及其在建立人工智能(AI)系统中的信任度中不可或缺的作用。讨论始于对鲁棒性的详细定义,将其描述为ML模型在各种和意外的环境条件下保持稳定性能的能力。ml鲁棒性是通过多种镜头解剖的:它与普遍性的互补性;它的地位是值得信赖的AI的要求;它的对抗性与非对抗性方面;它的定量指标;及其指标,例如可重复性和解释性。本章深入研究了障碍鲁棒性的因素,例如数据偏见,模型复杂性和未育种ML管道的陷阱。它从广泛的角度来调查鲁棒性评估的关键技术,包括对抗性攻击,包括数字和物理领域。它涵盖了深度学习(DL)软件测试方法的非对抗性数据变化和细微差别。从以数据为中心的方法开始,例如以数据为中心的方法,探索巩固鲁棒性的改善策略正在发展。 进一步检查包括各种以模型为中心的方法,例如转移学习,对抗训练和随机平滑。 最后,讨论了训练后方法,包括集合技术,修剪和模型维修,作为成本效果的策略出现,以使模型对不可预测的模型更具弹性。探索巩固鲁棒性的改善策略正在发展。进一步检查包括各种以模型为中心的方法,例如转移学习,对抗训练和随机平滑。最后,讨论了训练后方法,包括集合技术,修剪和模型维修,作为成本效果的策略出现,以使模型对不可预测的模型更具弹性。本章强调了通过现有的估算和实现ML鲁棒性的持续挑战和局限性。它为这一关键概念的未来研究提供了见解和方向,这是值得信赖的AI系统的先决条件。
摘要:由于世界各地的高死亡率,心脏病已经成为许多人的严重健康问题。常规的临床数据分析在心脏病的早期诊断方面有很大的困难。心脏病的鉴定可能会受益于机器学习的使用。为了改善机器学习模型,以前已经进行了几项研究。建议的研究使用分类的最大投票集合技术有效地识别心脏病。建议的分类器是一种更可靠和准确的方法。以识别和消除异常值,进行四分位数范围外离群值的去除和在预处理过程中的最低最大标准化。准确性,精度,召回和F1得分是针对各种模型进行计算和评估的。对于从Kaggle收集的心脏病数据集,建议的最大投票集合分类器的精度为99.22%。关键字:心脏病,最大投票,合奏,离群拆除,XGBoost,决策树,KNN,SVM,梯度增强
抽象的量子神经网络对许多应用程序具有重要的承诺,尤其是因为它们可以在当前一代的量子硬件上执行。但是,由于量子位或硬件噪声有限,进行大规模实验通常需要显着的资源。此外,模型的输出容易受到量子硬件噪声损坏的影响。为了解决这个问题,我们建议使用集合技术,该技术涉及基于量子神经网络多个实例构建单个机器学习模型。尤其是,我们实施了具有不同数据加载配置的包装和ADABOOST技术,并评估其在合成和现实世界分类和回归任务上的性能。为了评估不同环境下的潜在性能改善,我们对基于模拟的无噪声软件和IBM超导QPU进行了实验,这表明这些技术可以减轻量子硬件噪声。此外,我们量化了使用这些集成技术节省的资源量。我们的发现表明,这些方法即使在相对较小的量子设备上也能够构建大型,强大的模型。
摘要 - 努力估计对于软件开发努力的胜利至关重要。适当的预测方法对于使软件项目努力估计结果保持一致至关重要。此过程有助于有效分发资源,制定项目策略并促进IT项目管理中的知情选择。机器学习是人工智能(AI)的一个方面,致力于制定算法和模型,使计算机能够根据数据来增强其性能,并促进预测或决策。本研究通过强调合奏技术的优势来讨论机器学习在软件开发工作估算中的实施,我们收集了有关软件努力估算和机器学习技术的558篇论文。经过质量审查过程,我们确定了40篇文章以进行深入审查。研究结果表明,在监督和无监督的学习中使用集成技术可以提高软件努力估算的准确性。人工神经网络,回归,k-neart邻居,决策树,随机森林和自举的聚集是最常用的方法。研究还表明,大多数文章都使用集合技术来调整参数,选择功能和加权功能。本研究提供了实施机器学习技术来估算软件工作的见解,并突出了集合技术的优势。
摘要:本文研究了新颖的分类器集合技术,用于应用于图像分类的各种深层神经网络的不确定性校准。我们评估了准确性和校准指标,重点介绍了校准误差(ECE)和最大校准误差(MCE)。我们的工作比较了构建简单而高效的分类器合奏的不同方法,包括多数投票和几种基于元模型的方法。我们的评估表明,尽管用于图像分类的最新深层神经网络在标准数据集上具有很高的精度,但它们经常遭受重大校准误差。基本的合奏技术(例如多数投票)提供了适度的改进,而基于元模型的电源始终降低所有体系结构中的ECE和MCE。值得注意的是,我们比较的元模型表现出最大的校准改进,对准确性的影响最小。此外,具有元模型的分类器合奏在校准的情况下优于传统模型集合,同时需要较少的参数。与传统的事后校准方法相比,我们的方法消除了对单独的校准数据集的需求。这些发现强调了我们提出的基于元模型的分类器集合的潜力,作为一种有效的有效方法来证明模型校准,从而有助于更可靠的深度学习系统。
文献中已经提出了统计和神经方法来预测医疗保健支出。然而,对比较这两种方法的预测以及医疗保健领域中的集合方法的关注更少。本文的主要目的是评估其预测某些止痛药每周平均支出的能力,以评估不同的统计,神经和集合技术。两个统计模型,持久性(基线)和自回归积分移动平均(ARIMA),一个多层感知器(MLP)模型,一个长期的短期内存(LSTM)模型以及结合ARIMA,MLP预测的集合模型和LSTM模型进行校准,以预测两种不同的止痛药的支出。在MLP和LSTM模型中,我们比较了训练数据的障碍和MLP和节点中某些节点的辍学的影响,并在训练过程中LSTMS中的LSTMS中的复发连接。结果表明,整体模型在两种止痛药中的持久性,Arima,MLP和LSTM模型都优于持久性。一般而言,不助长训练数据并添加辍学有助于MLP模型并助长了训练数据,而没有添加辍学帮助两种药物中的LSTM模型。我们强调了使用统计,神经和集合方法来预测医疗领域结果的时间序列。
解决分类和预测挑战,树木集成模型已获得了重要的重要性。促进集合技术是用于预测II型糖尿病的综合技术。光梯度提升机(LightGBM)是一种以其叶片生长策略,减少损失和增强的训练精度而闻名的算法。但是,LightGBM容易过度拟合。相比之下,Catboost使用了称为决策表的平衡基础预测值,该预测值可以减轻过度适应风险,并明显提高测试时间效率。catboost的算法结构抵消了梯度增强偏见,并结合了过度拟合的检测器以尽早停止训练。本研究的重点是开发一种混合模型,该模型结合了LightGBM和Catboost,以最大程度地减少过度拟合并通过降低方差改善效果。为了找到与基础学习者一起使用的最佳超级仪表,使用了贝叶斯超级参数操作方法。通过微调正则化参数阀,混合模型有效地降低了方差(过拟合)。针对LightGBM,Catboost,Xgboost,Deciest Crey,Random Forest,Adaboost和GBM算法的比较评估表明,混合模型具有最佳的F1得分(99.37%),召回率(99.25%)和准确性(99.37%)。因此,拟议中的框架对医疗保健行业的早期糖尿病有望有望,并显示出与糖尿病共享相似性的其他数据集的潜在适用性。
摘要:整体深度学习和机器学习的融合已成为应对医疗保健,金融和自治系统等各种领域的复杂挑战的关键策略。合奏方法结合了多个模型的优势,以提高预测准确性,鲁棒性和概括性而闻名。本文调查了集合技术的应用,强调了它们在改善医学成像中诊断精度,推进金融服务中的欺诈检测机制以及在自动驾驶汽车中的决策中的作用。整体方法(包括堆叠,增强和包装)的最新进步已显示在各种情况下都超过单个模型。但是,合奏学习提供的机会,例如高计算需求,模型可解释性问题以及过度拟合的潜力。本研究探讨了解决这些挑战的方法,包括创建更有效的算法以及合并可解释的AI(XAI)框架以增强透明度和用户信任。此外,我们讨论了量子计算和联合学习对集合技术发展的尖端技术的未来影响。集成深度学习和机器学习的未来将由大数据的扩散,计算硬件的进步以及对实时可扩展解决方案的需求来塑造。本文对当前的集合学习状态进行了广泛的审查,确定了重大挑战,并建议未来的研究方向充分利用这些技术在解决现实世界中问题方面的潜力。