线性回归的直观解释

一篇包含 100 多个可视化内容的长篇文章,涵盖了从如何构建线性回归模型、衡量质量以及如何改进模型等一系列主题。《线性回归的视觉解释》一文首先出现在《走向数据科学》上。

来源:走向数据科学

人们!如果您曾经想了解线性回归的工作原理,或者只是想刷新主要思想,而不需要在许多不同的来源之间跳转,那么这篇文章就是为您准备的。这是一篇超长的读物,我花了一年多的时间才写完。它围绕五个关键想法构建:

  • 视觉效果第一。这是一篇漫画风格的文章:阅读文本会有所帮助,但这不是必需的。快速浏览一下图像和动画仍然可以让您充分了解事物的工作原理。共有100+视觉效果;
  • 可能有帮助的动画(总共 33 个)。计算机科学最好在运动中理解,因此我使用动画来解释关键思想;
  • 适合初学者。我使材料尽可能简单,以使初学者易于理解本文。
  • 可重现。大多数视觉效果都是用 Python 生成的,并且代码是开源的。
  • 注重实践。接下来的每个步骤都解决了上一步中出现的问题,因此整篇文章保持联系。
  • 还有一件事:这篇文章是有意简化的,因此某些措辞和示例可能有点粗糙或不完全精确。请不要只相信我的话——批判性地思考并仔细检查我的观点。对于最重要的部分,我提供了源代码的链接,以便您可以自己验证所有内容。

    目录

    这篇文章是写给谁的

    跳过这一段,只需滚动文章两分钟并查看视觉效果。你会立即知道是否要正确阅读它(主要思想在情节和动画中显示)。这篇文章适合初学者和任何处理数据的人,也适合想要快速刷新的有经验的人。

    本文涵盖的内容

    本文分为三幕:

  • 线性回归:它是什么、为什么使用它以及如何拟合模型;
  • 如何评估模型的性能;
  • 当结果不够好时如何改进模型。
  • 在较高层面上,本文涵盖:

  • 数据驱动建模;
  • 评估模型质量的方法,包括视觉和指标;
  • 指标