详细内容或原文请订阅后点击阅览
使用 Python 掌握时间序列分析的 7 个步骤
本文分解了 7 个关键步骤,帮助您使用 Python 分析和预测时间序列数据。
来源:KDnuggets简介
时间序列数据无处不在 - 每小时记录的能源消耗、记录到毫秒的交易、在住院期间跟踪的患者生命体征、每日更新的库存水平等等。分析、建模和预测此类数据是各行业最需要的技能之一。
时间序列与一般数据科学的不同之处在于它在每个阶段都需要不同的思维模型。时间顺序、自相关、季节性和非平稳性是表格数据中不存在的结构属性,但定义了有关时间序列行为方式的所有内容。本文概述的七个步骤将帮助您学习并精通使用 Python 进行时间序列分析。
第 1 步:了解时间序列数据有何不同
首先,您需要了解使时间序列在结构上不同于表格数据的属性。许多从业者跳过这一步,直接假设一般机器学习知识转移。事实并非如此,至少在没有调整的情况下是这样。
三个最重要的结构属性总结如下:
资源:Rob Hyndman 和 George Athanasopoulos 的免费在线教科书《预测:原理与实践》(第三版)是一本综合参考书。如果您有兴趣学习一些严肃的时间序列分析,您可能需要在继续任何建模步骤之前将其添加为书签。
第 2 步:掌握 Python 中的时间序列数据结构
在 Python 中使用时间序列意味着熟悉 pandas 的时间感知数据结构:DatetimeIndex、PeriodIndex、重采样和滚动操作。
The distinction between DatetimeIndex and PeriodIndex matters more than it first appears.
资源:在继续之前,使用真实数据集阅读 pandas 时间序列和日期功能指南。
