详细内容或原文请订阅后点击阅览
罕见事件的时间序列建模,python
这是在时间序列中以几行Codethe Post Hand on Time序列建模的罕见事件建模的时间序列中的罕见事件发生的方法,而Python首先出现在数据科学上。
来源:走向数据科学您听到了以下消息:
我们在这个时间表中拥有这些非常大的价值离群值
在我的数据科学时期,我听到了很多句子。在会议,产品评论和与客户的呼叫期间,据说这句话要保证,可能出现的一些很大(或小的)不需要的值不是“标准”,它们不属于“通常的过程”(我听说过的所有模糊的词语),并且它们并不构成我们试图构建的系统(x,y和z)的问题(x,y和z)。
在生产环境中,那些非常小的或非常大的值(称为极值)伴随着护栏,以“优雅地失败”,以防极端值测量。对于您只需要系统工作的情况,这通常就足够了,并且即使在不需要/不是标准/粗鲁,疯狂和令人讨厌的极端价值观的情况下,您也希望安全起作用。
极端值尽管如此,在分析时间表时,我们可以做一些事情,而不是用护栏“固定”极值,如果/否则阈值:我们实际上可以监视极端值,以便我们可以理解它们。
监视在时间表中,极端值实际上代表了感兴趣系统中的某些东西。例如,如果您的时间序列描述了城市的能源消耗,那么不合理的高能级可能表明特定区域中令人担忧的能源消耗,这可能需要采取行动。如果您要处理财务数据,高潮和低点具有明显的,至关重要的含义,并且理解其行为非常重要。
在这篇博客文章中,我们将处理天气数据,时间序列将代表温度(在开尔文)。我们将看到的数据将有多个城市,每个城市都会产生时间。如果您选择一个特定的城市,则有类似于您看到的时间表:
天气数据 数据源 建模 Gumbel 城市 l