详细内容或原文请订阅后点击阅览
回归系数的动态与静态解释
在横截面数据的简单(和多元)回归分析中,研究人员经常估计回归,例如“学习时间 (x) 的回归测试分数 (y)”,并获得 y = 常数 + 斜率系数 × x + 误差项形式的结果。当谈到这些解释中 x 的增加或减少时,我们必须记住 [...]
来源:Lars P Syll回归系数的动态与静态解释
在横截面数据的简单(和多重)回归分析中,研究人员经常估计回归,例如“学习时间 (x) 的回归测试分数 (y)”,并获得以下形式的结果
y = 常数 + 斜率系数 × x + 误差项。
当谈到这些解释中 x 的增加或减少时,我们必须记住我们正在处理横截面数据。在这种情况下,“增加”是指总体中的一个单位与同一总体中的另一个单位之间变量值的差异。严格来说,只有在处理时间序列回归时才适合对斜率系数进行动态解释。对于横截面数据,我们应该采用静态解释,并将斜率系数视为当自变量与另一个单位不同时我们可以预期因变量值发生的情况的信息。
虽然自变量的变化会导致因变量的变化这一说法很诱人,但我们应该抵制这种诱惑。平均而言,花大量时间学习作为日常生活一部分的学生比其他学习时间较少的学生获得更高的考试成绩。然而,进行的回归并没有分析个别学生在增加或减少学习时间时会发生什么。
为什么这很重要?最重要的是,对回归系数的错误解释可能会导致对数据中发生的情况产生完全误导性的因果观点。在横截面回归中,考试成绩和学习时间之间的正相关关系并不意味着单个学生应该期望仅仅通过增加学习时间来获得更高的考试成绩。
