详细内容或原文请订阅后点击阅览
逐步选择变得简单:改进Python中的回归模型
线性回归中的维度降低:经典的逐步方法和现实世界中的Python应用程序的逐步选择简单:改进Python中的回归模型,首先是迈向数据科学的。
来源:走向数据科学为了充分利用本教程,您应该已经对线性回归的工作方式及其背后的假设有了深入的了解。您还应该注意,实际上,使用差异通货膨胀因子(VIF)来解决多重共线性。此外,您需要了解预测风险的含义,并熟悉Python及其核心功能的基础知识。在本文结尾处,您将找到此处使用的逐步选择过程的代码。该实现遵循两个关键原则:正交性,不要重复自己(干燥),确保清洁,模块化和可重复使用的代码。
为了充分利用本教程,您应该已经对线性回归的工作方式及其背后的假设有了深入的了解。您还应该注意,实际上,使用差异通货膨胀因子(VIF)来解决多重共线性。此外,您需要了解预测风险的含义,并熟悉Python及其核心功能的基础知识。
在本文末尾,您将找到此处使用的逐步选择过程的代码。该实现遵循两个关键原则:正交性,不要重复自己(干燥),确保清洁,模块化和可重复使用的代码。
正交性 不要重复自己(干燥) 以前的工作这对使用回归模型的任何人提出了一个基本问题:我们如何确定应该包含哪些变量?换句话说,我们如何在不丢失基本信息的情况下降低数据的维度?
我们如何确定应该包含哪些变量?挑战取决于分析的目的。该模型是否应该提供系数的精确估计值?它应该确定哪些预测因子很重要?还是应该最大程度地提高预测精度?这些目标都要求采用不同的模型选择方法,而忽略这种区别会导致误导性结论。
1 p