免责声明 本报告是作为美国政府机构赞助的工作的说明而编写的。美国政府及其任何机构、芝加哥大学阿贡分校有限责任公司及其任何员工或官员均不做任何明示或暗示的保证,也不对所披露的任何信息、设备、产品或流程的准确性、完整性或实用性承担任何法律责任或义务,也不表示其使用不会侵犯私有权利。本文以商品名、商标、制造商或其他方式提及任何特定商业产品、流程或服务,并不一定构成或暗示美国政府或其任何机构对其的认可、推荐或支持。本文表达的文档作者的观点和意见不一定陈述或反映美国政府或其任何机构、阿贡国家实验室或芝加哥大学阿贡分校有限责任公司的观点和意见。
时间序列的预训练提出了一个独特的挑战,因为预训练和目标域之间可能存在不匹配,例如时间动态的变化、快速演变的趋势以及长期和短期周期效应,这可能会导致下游性能不佳。虽然领域自适应方法可以缓解这些变化,但大多数方法都需要直接来自目标域的示例,这使得它们对于预训练来说不是最优的。为了应对这一挑战,方法需要适应具有不同时间动态的目标域,并且能够在预训练期间无需看到任何目标示例即可做到这一点。相对于其他模态,在时间序列中,我们期望同一示例的基于时间和基于频率的表示在时频空间中位置靠近。为此,我们假设时频一致性 (TF-C)——将示例的基于时间的邻域嵌入到靠近其基于频率的邻域——对于预训练是可取的。受 TF-C 启发,我们定义了一个可分解的预训练模型,其中自监督信号由时间和频率分量之间的距离提供,每个分量都通过对比估计单独训练。我们在八个数据集上评估了新方法,包括电诊断测试、人体活动识别、机械故障检测和身体状态监测。针对八种最先进方法的实验表明,TF-C 在一对一设置(例如,在 EMG 数据上微调 EEG 预训练模型)中平均比基线高出 15.4%(F1 分数),在具有挑战性的一对多设置(例如,对 EEG 预训练模型进行微调以进行手势识别或机械故障预测)中高出 8.4%(精度),反映了现实世界应用中出现的场景广度。源代码和数据集可在https://github.com/mims-harvard/TFC-pretraining获得。
大型语言模型(LLMS)在诸如自然语言过程和计算机视觉之类的领域中有明显的使用。超越文本,图像和图形,LLM为分析时间序列数据,诸如气候,物联网,医疗保健,传统,音频和金融等有益领域的巨大潜力。本调查论文提供了深入的探索和详细的分类法,以利用用于利用LLMS进行时间序列分析的各种方法。我们解决了弥合LLM的原始文本数据训练与时间序列数据的数值性质之间差距的固有挑战,并探讨了将知识从LLMS转移和提炼知识转移到数值时间序列分析的策略。我们详细介绍了各种方法,包括(1)LLM的直接提示,(2)时间序列量化,(3)对齐技术,(4)利用视频模式为桥接机制,以及(5)LLMS的组合。此外,这项调查还提供了各种域中的多模式时间序列和文本数据集的全面概述,并讨论了这个新兴领域的挑战和未来机会。
摘要 — 由于量子电路上的旋转分量,一些基于变分电路的量子神经网络可以被认为等同于经典的傅里叶网络。此外,它们还可用于预测连续函数的傅里叶系数。时间序列数据表示变量随时间的状态。由于一些时间序列数据也可以被视为连续函数,我们可以预期量子机器学习模型能够成功地对时间序列数据执行许多数据分析任务。因此,研究用于时间数据处理的新量子逻辑并分析量子计算机上数据的内在关系非常重要。在本文中,我们使用需要少量量子门的简单量子算子,通过 ARIMA 模型对经典数据预处理和预测进行量子模拟。然后,我们讨论了未来的方向以及可用于量子计算机上时间数据分析的一些工具/算法。
人口普查局每年进行数百项业务调查,为美国经济提供官方统计数据。这些统计数据提供了关键数据,使决策者,投资者和美国公众每天做出至关重要的决策。经济指标是每月和季度调查,可提供最及时的数据,并显示构成美国经济的核心行业的趋势。这些调查设定了美国经济统计的标准,并受到各个企业提供的数据的推动。数据提供了可靠的美国经济综合措施。各种统计数据来自涵盖建筑,住房,国际贸易,零售贸易,批发贸易,服务和制造业的调查。每个调查中收集的数据提供了经济活动的衡量标准,可以分析经济绩效并为商业投资和政策决策提供信息。访问人口普查局的商业和经济网站以了解更多信息。
摘要:本研究比较了在财务数据分析中预测时间序列的不同机器学习模型。使用包括Arima,LSTM和GRU在内的模型来预测股票价格变动。我们衡量每个模型在各种数据集中的准确性和计算效率,并讨论其在财务预测环境中的优势和劣势。调查结果表明,深度学习模型在捕获传统方法的复杂时间模式方面显示出显着改善。关键字:时间序列预测,机器学习,Arima,LSTM,财务分析。A.简介
研究助理将与澳大利亚研究委员会卓越的土著和环境历史与期货卓越中心(CIEHF.AU)合作,分析古环境的时间序列以及环境,生态和考古学的现代代理,尤其着重于过去1000年中澳大利亚发生的转移环境和人类趋势。研究助理将应用现有的代码,并开发新方法来分析源自湖,泻湖,河流和湿地核心的复杂数据,测量过时的植被组成,火灾状态和气候波动的各个方面。研究助理还将开发模拟模型,以评估各种环境限制下不同代理的行为,以帮助解释时间序列模型的输出。
可以通过使用神经网络近似其矢量场来学习系统的不变动态,这是一种称为神经odes的概念(Chen等人。,2018b; Rubanova等。,2019年; Yildiz等。,2019年)。然而,这些模型的损失景观的复杂性随观察到的轨迹的长度而增加,因此它们的训练也无法收敛于中等长的观察范围(Ribeiro等人。,2020年; Metz等。,2022)。早期溶液将长轨迹分为较小的细分市场,并通过约束确保概率模型的连续性(Hedge等人。,2022; Iakovlev等。,2023)。然而,在没有离散近似值的情况下安装长轨迹仍然是一个空旷的问题。
摘要。山体滑坡是巴西经常发生的现象,造成了许多社会经济损失和人员伤亡。为了监测山体滑坡,土地利用和土地覆盖 (LULC) 以及山体滑坡清单图对于识别高易发区域至关重要。从这个意义上讲,本研究的主要目的是通过半自动方法,使用遥感时间序列图像的数据挖掘技术,对以山体滑坡检测为重点的 LULC 进行分类。为此,从 Sentinel-2 图像中提取了不同的指数,例如归一化差异植被指数、归一化差异建筑指数 (NDBI) 和土壤调整植被指数。从时间序列中提取了基本、极坐标和分形指标。从航天飞机雷达地形任务数字高程模型中提取了六个地貌特征。然后,使用四种不同方法的随机森林进行分类:单时间、双时间、度量和全部。在每种方法中,NDBI 指数或从中得出的度量都具有最高重要性,而斜率则排在前六个预测因子之中。全部方法显示出最高的总体准确率 (OA) (88.96%),其次是度量 (87.90%)、双时间 (82.59%) 和单时间 (74.95%)。简而言之,度量方法呈现出最有益的结果,呈现出高 OA 和低水平的犯错和遗漏错误。© 作者。由 SPIE 根据知识共享署名 4.0 国际许可发布。分发或复制本作品的全部或部分内容需要完全注明原始出版物,包括其 DOI。[DOI:10.1117/1.JRS.16.034518]