详细内容或原文请订阅后点击阅览
“过度控制”(II)
在之前的博客文章中,您确实讨论了因果分析中的混淆和“过度控制”问题。所谓的 M 偏差问题很好地说明了控制额外变量的尝试有时会恶化而不是改善因果估计。我举一个经济学的例子来说明这个问题。估计因果关系 [...]
来源:Lars P Syll“过度控制”(II)
在之前的博客文章中,您确实讨论了因果分析中的混淆和“过度控制”问题。所谓的 M 偏差问题很好地说明了控制额外变量的尝试有时会恶化而不是改善因果估计。
我举一个经济学的例子来说明这个问题。
估计因果关系是经济学的核心挑战之一。在教科书中,我们经常被要求考虑需要确定获得大学学位是否会带来更高未来收入的情况。乍一看,任务似乎很简单:收集教育和收入数据并运行 OLS 回归,同时控制背景变量。然而,当数据结构包含某些隐藏关系时,这种看似简单的策略可能会产生误导性的结果。
要了解 M 偏差是如何产生的,请想象一下数据集中没有直接观察到两个重要影响的情况。首先是与生俱来的能力。能力较高的人更有可能完成大学学位,而且由于家庭对学校教育或社区选择的决定,他们也更有可能居住在大学附近的地区。第二个隐藏因素是家庭财富。来自富裕家庭的人往往在以后的生活中拥有更高的收入,富裕家庭也可能选择住在大学附近或大学附近的社区。
在这种情况下,能力和家庭财富都会影响第三个变量:与大学的距离。由于这个变量是由两个独立的因素引起的,因此因果研究人员将其称为“碰撞”。碰撞器是位于两条因果路径交叉点的变量。
