机器学习“降临日历”第 11 天:Excel 中的线性回归

线性回归看似简单,但却介绍了现代机器学习的核心思想:损失函数、优化、梯度、缩放和解释。在本文中,我们在 Excel 中重建线性回归,将闭式解与梯度下降进行比较,看看系数如何一步步演化。这个基础自然会导致正则化、核、分类和对偶视图。线性回归不仅仅是一条直线,而是我们接下来将在降临节中探索的许多模型的起点。日历。机器学习“降临日历”第 11 天:Excel 中的线性回归一文首先出现在走向数据科学上。

来源:走向数据科学

线性回归,终于!

在第 11 天,我等了很多天才展示这个模型。它标志着这个“降临日历”新旅程的开始。

到目前为止,我们主要研究基于距离、邻居或局部密度的模型。如您所知,对于表格数据,决策树,尤其是决策树集合,性能非常好。

但从今天开始,我们转向另一种观点:加权方法。

线性回归是我们进入这个世界的第一步。

它看起来很简单,但它介绍了现代机器学习的核心要素:损失函数、梯度、优化、缩放、共线性和系数解释。

现在,当我说线性回归时,我指的是普通最小二乘线性回归。当我们深入了解这个“降临日历”并探索相关模型时,您将明白为什么指定这一点很重要,因为“线性回归”这个名称可能会令人困惑。

有人说线性回归不是机器学习。

他们的论点是,机器学习是一个“新”领域,而线性回归很早就存在,因此不能被视为机器学习。

这是误导性的。

线性回归非常适合机器学习,因为:

  • 它从数据中学习参数,
  • 最小化损失函数,
  • 它对新数据进行预测。
  • 换句话说,线性回归是最古老的模型之一,也是机器学习中最基本的模型之一。

    这是使用的方法:

  • 线性回归,
  • 逻辑回归,
  • 以及后来的神经网络和法学硕士。
  • 对于深度学习,这种基于加权的、基于梯度的方法是随处使用的方法。

    在现代法学硕士中,我们不再讨论几个参数。我们谈论的是数十亿的重量。

    在本文中,我们的线性回归模型恰好有 2 个权重。

    斜率和截距。

    仅此而已。

    但我们必须从某个地方开始,对吧?

    在我们阅读本文以及接下来的文章时,您可以记住以下几个问题。

  • 线性回归会过度拟合吗?