摘要:本研究比较了在财务数据分析中预测时间序列的不同机器学习模型。使用包括Arima,LSTM和GRU在内的模型来预测股票价格变动。我们衡量每个模型在各种数据集中的准确性和计算效率,并讨论其在财务预测环境中的优势和劣势。调查结果表明,深度学习模型在捕获传统方法的复杂时间模式方面显示出显着改善。关键字:时间序列预测,机器学习,Arima,LSTM,财务分析。A.简介
摘要 —心血管疾病 (CVD) 是全球死亡的主要原因,需要精确的预测模型来监测心率、血压和心电图等生命体征。传统模型(如 ARIMA 和 Prophet)受到手动参数调整需求以及处理嘈杂、稀疏和高度可变的医疗数据的挑战的限制。本研究调查了先进的深度学习模型,包括 LSTM 和基于变压器的架构,用于预测来自 MIT-BIH 数据库的心率时间序列。结果表明,深度学习模型(尤其是 PatchTST)在多个指标上的表现明显优于传统模型,可以更有效地捕获复杂的模式和依赖关系。这项研究强调了深度学习在增强患者监测和 CVD 管理方面的潜力,表明其具有巨大的临床益处。未来的工作应该将这些发现扩展到更大、更多样化的数据集和现实世界的临床应用,以进一步验证和优化模型性能。索引词 —时间序列;ARIMA;LSTM;TimesNet;PatchTST;iTransformer
无监督的域适应性在将知识从标记的源域转移到未标记的目标域,在时间序列应用中起关键作用。现有的时间序列域适应方法要么忽略频率特征,要么平等地处理时间和频率特征,这使得充分利用这两种功能的优势变得具有挑战性。在本文中,我们深入研究了可传递性和可区分性,这是传递表示学习中的两个至关重要的特性。可以洞悉频率特征在特定域内更具歧视性,而时间特征则在跨域上显示出更好的可传递性。基于发现,我们提出了一个dversarial co-co-co-n n etworks(acon),以通过协作学习方式在三个方面通过协作学习方式来增强可转移的表示:(1)考虑到时代的多个过度差异,提出了多个频率频率特征学习,以增强频率特征的辨别能力; (2)提出了时间域互助学习,以增强源域中时间特征的可区分性,并提高目标域中频率特征的可传递性; (3)域对抗学习是在时间频率特征的相关子空间中进行的,而不是原始特征空间,以进一步增强这两个特征的可传递性。在广泛的时间序列数据集和五个常见范围内进行的广泛实验证明了ACON的最新性能。代码可从https://github.com/mingyangliu1124/acon获得。
摘要 - 强化学习以其能够对顺序任务进行建模和学习潜在数据模式的能力而闻名。深度学习模型已在回归和分类任务中广泛探索和采用。但是,深度学习具有其局限性,例如假设均等和有序数据,以及缺乏在时间序列预测方面合并图形结构的能力。图形性化neu-ral网络(GNN)具有克服这些挑战并捕获时间序列数据中的时间依赖性的能力。在这项研究中,我们提出了一种新的方法,用于使用GNN和增强学习(RL)监测时间序列数据。gnns能够将数据的图形结构明确地纳入模型,从而使它们能够以更自然的方式捕获时间依赖性。这种方法允许在复杂的时间结构中进行更准确的预测,例如医疗保健,交通和天气预报中的预测。我们还使用贝叶斯优化技术来微调我们的GraphRl模型,以进一步提高性能。所提出的框架在时间序列预测和监视中优于基线模型。本研究的贡献包括引入时间序列预测的新型GraphRl框架,以及与传统深度学习模型(例如RNN和LSTMS)相比,GNNS的有效性的证明。总体而言,这项研究证明了GraphRL在动态RL环境中提供准确有效的预测的潜力。
这项间断时间序列研究使用了 2013 年 7 月 1 日至 2019 年 6 月 25 日期间 2,844 个智利家庭(138,391 个家庭-月)每月食品和饮料购买的纵向数据。食品和饮料包装上的营养成分面板数据与产品级别相关联,并由营养学家审核。如果产品含有添加的糖、钠或饱和脂肪,并且超过营养或卡路里阈值,则被视为“高营养”。使用相关随机效应模型和间断时间序列设计,我们估计了与第 1 阶段和第 2 阶段相关的食品和饮料购买的营养成分,并与基于政策前 36 个月时间范围内趋势的反事实情景进行了比较。与反事实相比,我们观察到第二阶段高热量食品和饮料的购买量显著减少,其中糖相对减少 36.8%(-30.4 卡路里/人/天,95% CI -34.5, -26.3),能量相对减少 23.0%(-51.6 卡路里/人/天,95% CI -60.7, -42.6),钠相对减少 21.9%
时间序列是指在一段时间内按时间顺序收集的一系列数据点,每个点通常记录在特定的时间戳。时间序列有两个主要组成部分:时间戳和观测值。时间戳表示获取特定记录的时间,而观测值则显示与每个时间戳相关联的值,该值表明该值相对于其他时间点的相对重要性。此外,时间序列数据可能还带有一些其他模式,使时间序列分析更具挑战性。例如,来自同一数据集的样本可能具有不同的长度(可变长度)和/或相邻时间点可能具有不同的时间间隔(异质间隔)。时间序列分析涉及研究和解释样本随时间变化的趋势和依赖性等模式,并已广泛应用于现实世界现象 [1-3]。其中,时间序列分类 (TSC) 专注于将序列数据分类并标记为不同的类别,在医学、电信和金融等领域发挥着不可或缺的作用。TSC 算法的有效性取决于它们平衡短期和长期记忆以及捕捉时间依赖性的能力,同时将所需模式与噪声模式区分开来。在过去的几十年中,已经开发了大量算法来解决这一特定领域。到目前为止,长短期记忆 (LSTM) 网络可以看作是一个里程碑式的突破,它为序列数据中复杂的长期依赖关系建模所带来的挑战提供了强大的解决方案 [4-7]。LSTM 网络是一种循环神经网络 (RNN),它利用记忆单元和门作为控制信息在网络中流动的手段。网络的设计主要是为了缓解梯度消失的瓶颈。然而,网络的训练是通过最先进的时间反向传播 (BPTT) 技术实现的。虽然 BPTT 是一种强大而有效的方法,但它的计算成本可能很高,尤其是对于大型和深度神经网络而言。除了反向传播辅助神经网络外,基于距离的方法也在广泛的 TSC 任务中取得了巨大的成功 [8-10],其中,1-最近邻动态时间规整 (1NN-DTW) 已被证明
摘要。在本文中,我们介绍了Indmask,这是一个框架,用于解释Black-Box时间序列模型的决策。存在大量用于提供机器学习模型解释的方法时,时间序列数据需要其他考虑。一个人需要考虑解释中的时间方面,并处理大量输入功能。最近的工作提出了通过在In-In-In-Time序列上产生面具来解释时间序列预测的。掩码中的每个条目对应于每个时间步骤的每个功能的重要性得分。但是,这些方法仅生成实例解释,这意味着需要对每个输入进行分别计算掩码,从而使它们不适合归纳设置,在这种情况下,需要为众多输入生成解释,并且实例解释的生成非常严重。此外,这些方法主要是在简单的复发性神经网络上评估的,通常仅适用于特定的下游任务。我们提出的框架IndMask通过利用掩码生成的参数化模型来解决这些问题。我们还超越了经常性的神经网络,并将indmask部署到变压器体系结构上,从而真正地阐明了其模型 - 不合Snostic的性质。通过对现实世界数据集和时间序列分类和预测任务的实验进一步证明了indmask的有效性。它也是有效的,并且可以与任何时间序列模型一起部署。
Liang,Y.,Wen,H.,Nie,Y.,Jiang,Y.,Jin,M.,Song,D.,...&Wen,Q。 (2024)。 时间序列分析的基础模型:教程和调查。 在KDD'24 中Liang,Y.,Wen,H.,Nie,Y.,Jiang,Y.,Jin,M.,Song,D.,...&Wen,Q。(2024)。时间序列分析的基础模型:教程和调查。在KDD'24
董事,尼日利亚港口大学bourdillon.omijeh@uniport.edu.ng摘要的摘要准确的温室气体预测(GHG)排放对于解决气候变化和指导有效的缓解策略至关重要。我们开发并测试了高级技术,以改善时间序列的温室气体排放预测,以解决现有模型的局限性。我们的研究探索了各种算法,包括Arima,Sarima,ETS,先知和TBAT,以确定最有效的方法,用于捕获尼日利亚河流Harcourt港特有的温室气体数据中复杂的季节性和非线性模式。我们使用ADF和KPSS测试测试了时间序列的平稳性。使用网格搜索和Akaike信息标准(AIC)优化了其处理趋势和季节性组件的能力和季节性组件的能力。然后,我们将其与Arima,Sarima,Prophet和TBATS模型进行了比较。ETS模型的表现优于其他模型,在观察到的数据的95%置信区间内预测了CO₂值,平均绝对误差(MAE)为14.82,而根平方误差(MSE)为18.91。这项研究标志着温室气体排放预测的重大进步,强调了调整模型在环境科学中的实践价值及其与政策决策的相关性。未来的工作应着重于完善这些模型以实时使用,以确保计算效率和预测精度之间的平衡,以为决策者和环境科学家提供可行的见解。关键字:时间序列,发射,温室气体,预测,指数平滑。简介预期温室气体(GHG)排放对于制定有效减轻气候变化的策略至关重要。2023年,国际能源局(IEA)报告说,全球能源相关的二合作的排放量增长了1.1%,达到创纪录的37.4 gigatonnes(GT)(GT)(IEA,2023年)。这强调了气候缓解当局深入了解当前和未来排放趋势的重要性,以开发和实施有效的对策。本文回顾了用于温室气体排放预测的预测模型和算法,检查了其优势和缺点,如先前的研究中所强调的那样。重点是了解对这些低效率的研究如何指导预测准确性的改善。温室气体(温室气体)是捕获并重新发射红外辐射的大气气体,导致温室效应。尽管这种作用对于维持生命的温度至关重要,但人类活动(例如燃烧化石燃料和森林砍伐)却显着增加了温室气体排放,导致全球变暖和气候变化(英国地质调查,2023年)。二氧化碳(CO₂),主要的温室气体,主要是通过燃烧化石燃料(例如煤炭,石油和天然气)以及工业
具有图属性的表格应包括图的空间坐标以及有关实验处理和/或环境变量的信息。默认情况下,除非参数COORD_NAMES另有说明,否则假定为储存和北部的空间坐标分别为“ X”和“ Y”。如果提供的坐标是纬度,并且纵向确保设置参数latlong = true,则在计算空间,基于样本的稀有功能(SSBR)时,它会打开较大的圆距离,而不是欧几里得距离。如果时间趋势是感兴趣的,而不仅仅是仅提供代表时间的坐标。