摘要 — 已经提出了几种方法来解释深度神经网络 (DNN)。然而,据我们所知,只有分类网络被研究过,试图确定哪些输入维度促使了分类决策。此外,由于这个问题没有基本事实,因此结果只能定性地评估对人类有意义的结果。在这项工作中,我们设计了一个可以获得基本事实的实验数据库:我们生成理想信号和有误差的干扰信号,并训练一个神经网络来确定所述信号的质量。这个质量只是一个基于干扰信号和相应理想信号之间距离的分数。然后,我们试图找出网络如何估计这个分数,并希望找到发生错误的时间步骤和信号维度。这种实验设置使我们能够比较几种网络解释方法,并基于几次训练提出一种名为精确梯度 (AGRA) 的新方法,该方法可以减少大多数最先进结果中存在的噪声。比较结果表明,在定位信号中出现错误的时间步骤方面,所提出的方法优于最先进的方法。
内核回归是一种良好的非线性回归方法,其中使用周围训练样品的加权平均值来实现测试点的目标值。通常通过将基于距离的内核函数应用于每个样品,从而获得了权重,该函数假定存在良好的距离。在本文中,我们构建了一种用于监督度量学习的新颖算法,该算法通过将剩余的重新介绍错误降至最低,从而学习了距离功能。我们表明,我们的算法使内核回归与几个基准数据集的最先进的状态进行了比较,并且我们提供了充分的实现详细信息,从而使应用程序可以应用于具有〜O(10K)内置的数据集。此外,我们表明我们的al-gorithm可以看作是PCA的监督变化,可用于降低降低和高度数据可视化。
提交日期:2024年1月23日,审查日期:2024年1月26日修订日期:2024年1月27日接受日期:2024年1月29日,抽象糖尿病是一种可以攻击任何人的疾病,这种疾病发生,因为人体中糖含量过多。因此,需要预防糖尿病,以便可以尽早采取预防措施。在这项研究中,将使用随机森林算法,支持向量分类和XGBoost进行分类过程。本研究将使用一个数据集,该数据集由768个总数据组成,其分布非糖尿病数据为500,糖尿病数据的分布为268。对于测试后的分类结果,结果是,使用随机森林获得的分类为79.22%,使用使用支持矢量分类的测试精度获得了76.62%的测试精度,使用XGBoost的测试准确度使用逻辑回归的测试精度为79.22%的测试准确度为80.52%。使用逻辑回归算法时,获得最佳分类值,即精度为79.00%,召回77.00%,F1得分为78.00%。
机器学习(ML)算法正在各个行业中出现,作为传统数据回归方法的强大补充/替代方案。主要原因是,与确定性模型不同,即使没有详细的现象学知识,它们也可以使用。毫不奇怪,在传热应用中也探索了ML算法的使用。在处理复杂几何形状和潜在现象的系统中特别感兴趣(例如流体相变,多相流量,大量结垢堆积)。然而,传热系统提出了需要解决的特定挑战,例如高质量数据的稀缺性,已发表的数据源之间的不一致,输入的复杂(且经常相关)的影响,培训和测试集之间的数据拆分以及有限的划线能力,无法进行统一条件。试图克服这些挑战中的一些,更重要的是,为了提供系统的方法,本文回顾并分析了ML算法在传热应用中的应用中的过去努力,并提出了将其部署的回归框架以估算关键数量(例如传热系数),用于改进热交换器的设计和操作。该框架由六个步骤组成:i)数据预处理,ii)特征选择,iii)数据分裂理念,iv)训练和测试,v)调整超参数,而VI)具有特定指标的性能评估,以支持准确且可靠的模型的选择。相关案例研究涉及缩合传热系数在微囊管中的估计来说明所提出的框架。根据其估计和外推能力对两种数据驱动算法,深神经网络和随机森林进行了测试和比较。结果表明,与过去研究中提出的众所周知的半经验相关性相比,ML算法在预测传热系数方面通常更准确,其中最合适的ML模型的平均绝对误差为535 [𝑊𝑚2𝐾-1],与使用1061 [𝑊𝑚22-−1]的误差相比,与使用误差相比。在外推方面,所选的ML模型的平均绝对误差为1819 [𝑊𝑚2𝐾-1],而相关性为1111 [𝑊𝑚2𝐾-1],表明使用半经验模型的劣势,尽管对比较并不完全适合,但鉴于相关性不适合使用。此外,功能选择还启用了仅取决于可能与目标变量最重要的功能的更简单的模型。需要特别注意,因为部署这些模型时会遇到的过度拟合和有限的外推能力是常见的困难。
我们的方法论具有多种优势作为替代增长指标。首先,我们的IDI CATOR借鉴了大量的高频数据,这可能与中国的经济表现有关。我们的方法论然后淘汰了有关潜在经济增长的信息的较少信息。接下来,我们将基础数据定位为一组与中国经济各个重要方面高度相关的经济指标。最终结果是稀疏的部分最小二乘(PLS)回归的因素,似乎可以在高频中跟踪中国业务周期,表现良好,如Clark,Dawson和Pinkovskiy(2019)所示,与世界各地的一系列增长指标相关联。最后,我们的因素模型使我们能够将中国从趋势增长到全球增长,信贷供应和货币政策组成部分的偏差分解。
磁共振成像 (MRI) 可以非侵入性地绘制大脑的代谢氧消耗 (CMRO 2 ),这对于理解和监测健康和疾病状态下的神经功能至关重要。然而,由于缺乏稳健的方法,对 MRI 氧代谢的深入研究迄今为止受到阻碍。一种绘制 CMRO 2 的 MRI 方法基于在氧气和二氧化碳的呼吸调节期间同时获取脑血流 (CBF) 和血氧水平依赖 (BOLD) 加权图像。虽然这种双校准方法在研究环境中显示出良好的前景,但当前的分析方法在存在噪声的情况下不稳定和/或计算要求高。在本文中,我们提出了一种机器学习实现,用于对双校准 fMRI 数据进行多参数评估。所提出的方法旨在解决稳定性、准确性和计算开销问题,消除使用 MRI 研究氧代谢的重大障碍。该方法利用获取的灌注和 BOLD 加权数据的时间频率变换,从中选择适当的特征向量来训练机器学习回归器。实施的机器学习方法之所以被选中,是因为它们对噪声具有鲁棒性,并且能够映射复杂的非线性关系(例如 BOLD 信号加权和血氧之间存在的关系)。极端随机树 (ET) 回归器用于估计静息血流量,多层感知器 (MLP) 用于估计 CMRO 2 和氧提取分数 (OEF)。带有加性噪声的合成数据用于训练回归器,模拟数据涵盖广泛的生理合理参数。在模拟和体内数据(n = 30)中,将实施的分析方法的性能与已发表的方法进行了比较。所提出的
准确确定电池状况是操作中的关键挑战。随着锂离子电池的性能随着时间的推移而降级,对健康状况的准确预测将提高整体效率和安全性。本文根据高斯过程回归提出了一种预测方法,并在单个模型中使用自动相关性确定内核,用于三种不同类型的电池电池。降低了问题的维度和对特征的灵敏度分析后,对模型进行了训练,验证并在看不见的数据上进行了进一步测试。最小测试误差的平均绝对误差为1.33%。结合了预测结果的低不确定性,这表明了使用数据驱动方法预测电池状况的适用性和巨大潜力。
摘要:由于全球城市化,城市地区遇到了许多环境,社会和经济挑战。已经提出和实施了不同的解决方案,例如基于自然的解决方案以及绿色和蓝色基础设施。考虑到与这些解决方案相关的外源性因素是评估其可能影响的关键问题。这项研究研究了可能的解释性因素及其演变,直到2054年对紫外线地区的几种解决方案进行了研究:废水恢复,地表地热能和区域的热量减震能力。此研究由一系列统计模型,即普通最小二乘(OLS)和地理位置加权回归(GWR)进行,这些回归(GWR)集成在地理信息系统中。主要的驱动因素被确定为土地使用/土地覆盖和人口分布。结果表明,GWR模型捕获了空间自相关的很大一部分。的预测结果,低,中和高潜力实施特定溶液的区域。此外,将解决方案的实施能力与所描述的需求进行了比较,因为需要减慢地表城市热岛的影响和对化石能量的依赖。此外,降温能力始终与人类活动有明显的联系。需要进一步研究以发现剩余的原因,尤其是空气质量,水,植被和气候变化。