详细内容或原文请订阅后点击阅览
时间序列中的线性回归:虚假回归的来源
为什么错误术语的自相关关系很重要?时间序列的线性回归:伪造回归的来源首先出现在数据科学上。
来源:走向数据科学1。简介
很明显,我们的大多数工作将来会被AI自动化。这是可能的,因为许多研究人员和专业人员都在努力使他们的工作在线提供。这些贡献不仅有助于我们了解基本概念,还可以完善AI模型,最终腾出时间专注于其他活动。
但是,即使在专家中,也有一个概念仍然被误解。这是时间序列分析中的虚假回归。当回归模型暗示变量之间的牢固关系时,即使不存在,就会出现这个问题。通常在时间序列回归方程中观察到它似乎具有高度拟合度(如高R²(多重相关系数)所示),但具有极低的Durbin-Watson统计量(D),在误差项中信号强度相关。
虚假回归 似乎有很高的拟合度 r²(多重相关系数) 极低的Durbin-Watson统计量(D),错误术语中的强相关信号尤其令人惊讶的是,几乎所有的计量经济学教科书都警告了自相关错误的危险,但是在许多发表的论文中,这个问题仍然存在。 Granger和Newbold(1974)确定了几个例子。例如,他们发现了R²= 0.997的公开方程,而Durbin-Watson统计量(D)等于0.53。最极端发现的是一个方程,R²= 0.999且D = 0.093。
1974 r²= 0.997 r²= 0.999 d = 0.093 许多关键变量表现出自相关 相邻值之间的串行相关 请参阅第7节无论您是经济学家,数据科学家还是使用时间序列数据的分析师,了解此问题对于确保您的模型产生有意义的结果至关重要。
您的模型会产生有意义的结果。2。随机步行和Arima(0,1,1)过程的简单介绍
2.1随机步行
让𝐗ₜ做一个时间序列。我们说,𝐗ₜ如果它的表示形式由:
和
1954