详细内容或原文请订阅后点击阅览
当预测因素发生冲突时:在多共线回归中掌握VIF
探索方差通货膨胀因子如何有助于检测和管理回归模型中的多重共线性。预测器发生冲突时的帖子:在多共线回归中掌握VIF首先出现在数据科学上。
来源:走向数据科学在模型中,独立变量必须彼此不相互依赖或仅略微依赖,即它们不相关。但是,如果存在这样的依赖性,则将其称为多重共线性,并导致难以解释的不稳定模型和结果。差异通胀因子是识别多重共线性的决定性指标,并指示与其他预测因子相关性增加回归系数方差的程度。该度量的高值表明该变量与模型中其他自变量的相关性很高。
多重共线性在下面的文章中,我们详细介绍了多重共线性和VIF作为测量工具。我们还展示了如何解释VIF以及可以采取哪些措施来减少它。我们还将指标与测量多重共线性的其他方法进行了比较。
什么是多共线性?
多重共线性是一种现象,它在两个或多个变量彼此之间密切相关时发生在回归分析中,因此一个变量的变化会导致另一个变量的变化。结果,可以完全或至少由另一个变量完全预测自变量的开发。这使线性回归的预测变得复杂,以确定自变量对因变量的影响。
可以在两种类型的多重共线性之间进行区分:
- 完美的多重共线性:变量是另一个变量的确切线性组合,例如,当两个变量以不同单位的重量和磅重的重量测量相同的事物时,高度的多重共线性:在这里,一个变量是强有力的,但并非完全可以用一个可变量来解释。例如,一个人的教育与收入之间存在很高的相关性,但这并不是完美的多重共线性。
x