详细内容或原文请订阅后点击阅览
皮尔逊相关系数,简单解释
皮尔逊相关系数的简单解释与示例简单解释皮尔逊相关系数一文首先出现在《走向数据科学》上。
来源:走向数据科学构建回归模型,这意味着在数据上拟合一条直线来预测未来值,我们首先将数据可视化以了解其外观并查看模式和关系。
数据可能显示出正线性关系,但我们通过计算皮尔逊相关系数来确认这一点,该系数告诉我们数据与线性的接近程度。
让我们考虑一个简单的薪资数据集来理解皮尔逊相关系数。
薪资数据集数据集由两列组成:
YearsExperience:一个人工作的年数
年经验Salary(目标):对应的美元年薪
薪资现在我们需要建立一个模型,根据多年的经验来预测薪资。
我们可以理解,这可以通过简单的线性回归模型来完成,因为我们只有一个预测变量和一个连续目标变量。
但是我们可以直接应用简单的线性回归算法吗?
编号
我们有几个适用于线性回归的假设,其中之一是线性。
线性我们需要检查线性度,为此,我们计算相关系数。
相关系数但什么是线性呢?
让我们通过一个例子来理解这一点。
从上表中我们可以看到,经验每增加一年,工资就会增加 5,000 美元。
变化是恒定的,当我们绘制这些值时,我们得到一条直线。
这种类型的关系称为线性关系。
线性关系现在,在简单线性回归中,我们已经知道我们在数据上拟合一条回归线来预测未来值,并且只有当数据具有线性关系时这才有效。
因此,我们需要检查数据的线性度。
为此,我们来计算相关系数。
在此之前,我们首先使用散点图可视化数据,以了解两个变量之间的关系。
年经验 工资 强而线性 0.9782 正\[
\]\[
