详细内容或原文请订阅后点击阅览
线性回归实际上是一个投影问题,第 1 部分:几何直觉
向量和投影的视觉指南后线性回归实际上是一个投影问题,第 1 部分:几何直觉首先出现在《走向数据科学》上。
来源:走向数据科学学习机器学习通常从线性回归开始,不仅因为它简单,而且因为它向我们介绍了神经网络和深度学习中使用的关键概念。
我们已经知道线性回归用于预测连续值。
现在我们有了这些数据,我们需要构建一个简单的线性回归模型来根据房屋的大小来预测房屋的价格。
我们一般使用python来实现这个算法。
代码:
将 numpy 导入为 np
将 matplotlib.pyplot 导入为 plt
从 sklearn. Linear_model 导入 LinearRegression
# 1. 数据
X = np.array([1, 2, 3]).reshape(-1, 1)
y = np.array([11, 12, 19])
# 2. 训练 scikit-learn 模型模型=线性回归()模型.fit(X, y)# 3. 提取参数和预测截距 = model.intercept_斜率 = model.coef_[0]y_pred = model.predict(X)错误 = y - y_predprint("--- Scikit-Learn 结果 ---")print(f"截距 (Beta 0): {截距:.0f}")print(f"坡度 (Beta 1): {坡度:.0f}")print(f"预测:{y_pred}")print(f"错误(残差):{错误}")# 4. 创建 2D 散点图plt.figure(figsize=(8, 6))# 绘制实际数据点plt.scatter(X, y, color='蓝色', s=100, label='实际数据(y)')# 绘制最佳拟合线 scikit-learnplt.plot(X, y_pred, color='red', linewidth=2, label='scikit-learn 最佳拟合线')# 绘制垂直残差线(误差)对于范围内的 i(len(X)):plt.plot([X[i][0], X[i][0]], [y[i], y_pred[i]], color='绿色', linestyle='--', linewidth=2)plt.text(X[i][0] + 0.05, (y[i] + y_pred[i])/2, f'e={errors[i]:.0f}', color='green', fontsize=12)plt.xlabel('尺寸(x,以 1000 平方英尺为单位)')plt.ylabel('价格(y,单位:10万美元)')plt.title('scikit-learn 简单线性回归')plt.图例()plt.grid(True, linestyle=':', alpha=0.7)# 显示绘图plt.show()然后我们得到这些值:准备好!这次我们将采取不同的路线来解决这个问题。一旦我们奠定了基础,第 2 部分将深入探讨具体的实现。我们走吧。\[\\
