摘要:准确预报电离层F2层临界频率(foF2)具有十分重要的意义,它极大地限制了通信、雷达和导航系统的效率。本文引入熵权法,建立了澳大利亚达尔文站(12.4 ◦ S,131.5 ◦ E)长期foF2的组合预报模型(CPM)。在完成校准期单个模型的仿真后,利用熵权法确定CPM中各单个模型的权重系数。为验证本研究采用的方法,分析了两组数据:一组是2000年和2009年,属于校准期(1998—2016年),另一组是校准周期之外的数据(1997年和2017年)。为了检验性能,我们将观测到的每月 foF2 中值、所提出的 CPM、国际无线电科学联盟 (URSI) 和国际无线电咨询委员会 (CCIR) 的均方根误差 (RMSE) 进行比较。1997 年、2000 年、2009 年和 2017 年,从 CPM 计算出的年度 RMSE 平均值小于从 URSI 和 CCIR 计算出的年度 RMSE 平均值。2000 年和 2009 年,CPM 与 URSI 之间的平均百分比改进为 9.01%,CPM 与 CCIR 之间的平均百分比改进为 13.04%。在校准期之外,CPM 与 URSI 之间的平均百分比改进为 13.2%,CPM 与 CCIR 之间的平均百分比改进为 12.6%。预测结果表明,无论是在校准期内还是在校准期外,所提出的 CPM 都比 URSI 和 CCIR 具有更高的预测精度和稳定性。
脑钟可以量化大脑年龄与实际年龄之间的差异,有望帮助人们了解大脑健康和疾病。然而,多样性(包括地理、社会经济、社会人口、性别和神经退化)对大脑年龄差距的影响尚不清楚。我们分析了来自 15 个国家(7 个拉丁美洲和加勒比国家 (LAC) 和 8 个非 LAC 国家)的 5,306 名参与者的数据集。基于高阶交互,我们开发了一种用于功能性磁共振成像(2,953)和脑电图(2,353)的大脑年龄差距深度学习架构。数据集包括健康对照者和患有轻度认知障碍、阿尔茨海默病和行为变异额颞叶痴呆症的个体。与非 LAC 模型相比,LAC 模型显示额后网络的大脑年龄较大(功能性磁共振成像:平均方向误差 = 5.60,均方根误差 (rmse) = 11.91;脑电图:平均方向误差 = 5.34,rmse = 9.82)。结构性社会经济不平等、污染和健康差距是导致大脑年龄差距扩大的重要预测因素,尤其是在 LAC(R ² = 0.37,F ² = 0.59,rmse = 6.9)。发现从健康对照组到轻度认知障碍再到阿尔茨海默病,大脑年龄差距不断扩大。在 LAC 中,我们观察到对照组和阿尔茨海默病组女性的大脑年龄差距大于男性。结果无法用信号质量、人口统计或采集方法的差异来解释。这些发现提供了一个定量框架,可以捕捉加速大脑衰老的多样性。
光伏系统最大功率输出与控制优化分析建立在准确可靠的光伏电池参数辨识基础上,但其高度非线性、多峰性等难题成为传统优化方法获取准确高效结果的障碍。本研究采用一种新型智能优化算法——MA(may fly algorithm,MA)对光伏电池三二极管模型(TDM)进行高效辨识,并以最小均方根误差(RMSE)作为评价指标验证算法的有效性。而且,通过不断调整MA的参数、种群数量和迭代次数来更好地平衡全局发展与局部优化的关系,从而获取更高效、更优的优化结果。研究案例表明MA在光伏电池参数辨识的准确性和稳定性方面优于其他元启发式算法。例如,MA 获得的 RMSE 的最小标准差 (SD) 比其他算法小 1,305 倍。
摘要 —本文提出了一种针对实际条件下运行的锂离子电池 (LIB) 使用长短期记忆循环神经网络 (LSTM) 的精确充电状态 (SOC) 估计算法。凭借其自学习能力,这种数据驱动的方法能够模拟整个电池寿命期间由于环境和工作条件变化而导致的 LIB 高度非线性行为。结果表明,在准确性和稳定性方面,LSTM 方法优于使用扩展卡尔曼滤波器 (EKF) 的常见物理模型。为了证明这一优势在实际应用中的优势,使用从储能领域的商业行业应用收集的数据对所提供的网络进行训练和测试。在不同工作条件下使用 EKF 对 LSTM 进行评估并将其与等效电路模型 (ECM) 进行比较。对于动态负载曲线,ECM-EKF 的误差 (RMSE) 为 9.5%,而 LSTM 的误差 (RMSE) 为 5.0%。
微度是一种无意的,瞬态的意识丧失,与睡眠相关,持续到15秒。脑电图(EEG),记录已广泛用于诊断和研究各种神经系统疾病。这项研究分析了时间序列EEG信号,以使用两个深度学习模型来预测微渗:长期术语记忆(LSTM)和人工神经网络(ANN)。调查结果表明,ANN模型在微填料预测中实现了出色的指标,在关键性能指标中的表现优于LSTM。该模型表现出了出色的性能,如散点图,R2分数,平均绝对误差(MAE),均方误差(MSE)和根平方误差(RMSE)的结果所证明的。与LSTM模型相比,在两个模型之间,ANN模型在两个模型之间达到了最重要的R2,MAE,MSE和RMSE值(0.84、1.10、1.90和1.38)。这项研究的关键贡献在于其开发全面有效的方法,以准确预测来自EEG信号的微度事件。
摘要本文致力于评估电影推荐系统中集合机器学习模型的有效性。它探讨了各种集合方法,包括随机森林,adaboost,XGBoost,LightGBM,Catboost和梯度提升机,以增强预测用户偏好的准确性。该研究基于Movielens 100K数据集,该数据集包含1,682部电影中943位用户的100,000个评级。功能工程,数据归一化方法和迭代功能选择的应用提高了模型准确预测用户兴趣的能力。分析表明,XGBoost模型的最佳结果为0.902,与所考虑的其他模型相比,预测准确性更高。LightGBM和Catboost还显示了竞争结果,RMSE值分别为0.910和0.919。这项研究强调了综合方法在开发适应用户各种偏好和环境的建议系统中的重要性,并在该领域开辟了广泛的观点,以进一步研究。
目的:本研究应用机器学习(ML)和可解释的人工智能(XAI)来预测HbA1c水平的变化,这是监测血糖控制的关键生物标志物,在诊断为2型糖尿病患者的患者中,在启动一种新的抗糖尿病药物后的12个月内。它还旨在确定与这些变化相关的预测因素。患者和方法:来自芬兰北卡雷利亚(North Karelia)的10,139名2型糖尿病患者的电子健康记录(EHR)用于训练整合了随机对照试验(RCT)衍生的HBA1C变化值作为预测变量的预测因子,创建将RCT洞察力与现实世界中集成的偏移模型。各种ML模型 - 包括线性回归(LR),多层感知器(MLP),山脊回归(RR),随机森林(RF)和XGBoost(XGB) - 使用R²和RMSE衡量标准进行评估。基线模型在药物启动之前或之前使用的数据,而随访模型包括第一个药物后HBA1C测量,通过合并动态患者数据来改善性能。模型性能也与临床试验中预期的HBA1C变化进行了比较。结果:结果表明,ML模型的表现要优于RCT模型,而LR,MLP和RR模型具有可比性的性能,RF和XGB模型表现出过于拟合。与基线模型相比,随访MLP模型的表现优于基线MLP模型,其R²得分(0.74,0.65)和较低的RMSE值(6.94,7.62)与基线模型(R²:0.52,0.54; RMSE; RMSE:9.27,9.50)相比。HBA1C变化的关键预测因子包括基线和药后HBA1C值,禁食等离子体葡萄糖和HDL胆固醇。未来的研究将探索治疗选择模型。结论:使用EHR和ML模型可以开发对HBA1C变化的更真实和个性化的预测,考虑到更多样化的患者人群及其异质性,为管理T2D提供了更量身定制和有效的治疗策略。XAI的使用提供了对特定预测因子影响的见解,从而增强了模型的解释性和临床相关性。关键字:类型2糖尿病,HBA1C,治疗效果估计,机器学习,Shap
本研究对机器学习 (ML) 和深度学习 (DL) 模型进行了全面的比较分析,这些模型用于根据温度、湿度、风速和风向等环境变量预测风力涡轮机 (WT) 的功率输出。除了人工神经网络 (ANN)、长短期记忆 (LSTM)、循环神经网络 (RNN) 和卷积神经网络 (CNN) 外,还研究了以下 ML 模型:线性回归 (LR)、支持向量回归器 (SVR)、随机森林 (RF)、额外树 (ET)、自适应增强 (AdaBoost)、分类增强 (CatBoost)、极端梯度增强 (XGBoost) 和轻梯度增强机 (LightGBM)。使用 40,000 个观测值的数据集,根据 R 平方、平均绝对误差 (MAE) 和均方根误差 (RMSE) 对模型进行了评估。在 ML 模型中,ET 的性能最高,R 平方值为 0.7231,RMSE 为 0.1512。在 DL 模型中,ANN 的性能最佳,R 平方值为 0.7248,RMSE 为 0.1516。结果表明,DL 模型(尤其是 ANN)的表现略优于最佳 ML 模型。这意味着它们更擅长对多变量数据中的非线性依赖关系进行建模。预处理技术(包括特征缩放和参数调整)通过增强数据一致性和优化超参数来提高模型性能。与之前的基准相比,ANN 和 ET 的性能均表明 WT 功率输出预测的预测准确度有显著提高。这项研究的新颖之处在于直接比较了各种 ML 和 DL 算法,同时强调了先进计算方法在可再生能源优化方面的潜力。
总共发现 12 个已完成的项目既有足够的时间报告数据,也有一些项目信息。以前的项目平均比项目开始时估计的时间多 55.1%。每个项目都有以下一项或多项:项目描述、工作分解结构和/或甘特图。但是,几乎所有项目的细节程度都很低,很难提取有用的特征。一个恒定时间模型(预测每个项目花费相同的时间)的均方根误差 (RMSE) 为 5058 小时,平均绝对百分比误差 (MAPE) 为 282%。另一个模型考虑了项目是纯软件、纯硬件还是两者兼有,其 RMSE 为 4269 小时,MAPE 为 320%。由于数据稀缺,没有进行进一步的改进。确定为了开发出能够与人类估计相匹配的预测模型,以下条件至少之一必须为真:数据的细节程度更高、以前项目的样本量更大,或者项目更相似以便它们更频繁地共享共同特征。
摘要。我们先前研究中产生的长期无缘高分辨率空气污染物(LGHAP)浓度数据集提供了空间连续的每日气溶胶光学深度(AOD)和细节颗粒物(PM 2。5)自2000年以来,中国1公里的网格分辨率的浓度。这一进步赋予了对区域气溶胶变化的前所未有的评估及其对过去20年中环境,健康和气候的影响。但是,有必要增强这种高质量的AOD和PM 2。5浓度数据集具有新的可靠功能和扩展的空间覆盖范围。在这项研究中,我们介绍了全球尺度LGHAP数据集(LGHAP V2)的版本2,该版本是通过使用多功能数据科学,模式识别和机器学习方法的无缝集成的改进的Big Earth Data Analytics生成的。特定的,从相关卫星,地面监测站获得的多模式AOD和空气质量测量值通过利用基于随机的数据驱动模型的能力来协调。随后,开发了改进的基于张量流的AOD重建算法,以编织统一的多源AOD产品共同填充数据差距,以填补大气孔校正(MAIAIA)AOD AOD AOD从Terra的多角度实现。消融实验的结果表明,在收敛速度和数据准确性方面,基于张量的间隙填充方法的改进性能更好。for pm 2。5浓度测量。 验证结果表明无间隙PM 2。 55浓度测量。验证结果表明无间隙PM 2。5Ground-based validation results indicated good data accuracy of this global gap-free AOD dataset, with a correlation coefficient ( R ) of 0.85 and a root mean square error (RMSE) of 0.14 compared to the worldwide AOD observations from the AErosol RObotic NETwork (AERONET), outperforming the purely re- constructed AODs ( R = 0.83, RMSE = 0.15), but they were比原始的Maiac AOD检索稍差(r = 0.88,RMSE = 0.11)。5浓度映射,一种新颖的深度学习方法,称为场景意识到的集合学习图表网络(SCAGAT)。在考虑到跨区域的数据驱动模型的场景代表性时,SCAGAT算法在空间外推时进行了更好的表现,在很大程度上降低了对有限和/甚至不存在原位PM 2的区域的建模偏差。5浓度估计值具有更高的预测精度,与PM 2相比,R为0.95,RMSE为5.7 µg m-3。