时间序列预测变得简单(第3.1部分):STL分解

STL分解会在季节性模式随时间演变时出色。帖子时间序列预测变得简单(第3.1部分):STL分解首先出现在数据科学上。

来源:走向数据科学

,我们以温度数据为例探索了趋势,季节性和残差。我们首先使用Python的siensional_decostose方法在数据中发现模式。接下来,我们使用标准基线模型(如季节性天真)进行了首个温度预测。

ensional_decostose

从那里开始,我们更深入地了解了Sishiesal_decompose如何实际计算趋势,季节性和残留成分。

我们提取了这些零件以构建基于分解的基线模型,然后尝试根据我们的数据量身定制的定制基线。

最后,我们使用平均绝对百分比误差(MAPE)评估了每个模型,以查看我们的方法的表现。

在前两个部分中,我们使用了温度数据,这是一个相对简单的数据集,在该数据集中,趋势和季节性清晰,季节性_decoposose在捕获这些模式方面做得很好。

但是,在许多实际数据集中,事情并不总是那么简单。趋势和季节性模式可能会发生变化或杂乱无章,在这些情况下,季节性征收可能无法有效地捕获基础结构。

这是我们转向一种更高级的分解方法来更好地理解数据:STL - 使用Loess的季节性趋势分解。

stl - 使用黄土的季节性趋势分解。

loess代表局部估计的散点图平滑。

loess 局部估计的散点图平滑

为了更好地了解这一点,我们将使用Fred(Federal Reserve经济数据)的百货商店数据集的零售。

百货商店零售

这是数据的样子:

从弗雷德(Fred)的百货商店数据集的零售销售样本。

我们正在与美国百货公司的每月零售销售合作的数据集,它来自受信任的弗雷德(联邦储备经济数据)来源。

它只有两个列:

    observation_date - 每个月的雷达尔_sales的开始 - 该月的总销售额,以数百万美元的价格
  • observation_date - 每个月开始
  • 注意: 3