“过度控制”的危险

为了降低在处理观测数据时仅建立“虚假关系”的风险,统计学家和计量经济学家通常会添加控制变量。希望人们能够由此做出更可靠的因果推论。但是,正如凯恩斯在 20 世纪 30 年代批评回归分析的统计计量经济学应用时所表明的那样,[...]

来源:Lars P Syll

“过度控制”的危险

为了降低在处理观测数据时仅建立“虚假关系”的风险,统计学家和计量经济学家通常会添加控制变量。希望人们能够由此做出更可靠的因果推论。但是,正如凯恩斯在 20 世纪 30 年代批评回归分析的统计计量经济学应用时所表明的那样,如果你无法捕获所有潜在的混杂因素,该模型就有可能产生对感兴趣变量的估计,该估计甚至比没有任何控制变量的模型更糟糕。结论:在模型中简单地包含“控制变量”之前请三思!

当我提出这个论点时……一位或多位学者说,“但是我不应该在回归中控制一切我能控制的东西吗?如果不是,我的系数是否会因为排除变量而产生偏差?” …仅当您确定您的规范对于包含的所有变量都完全正确时,排除的变量参数才有效。但没有人能知道,只有少数几个解释变量……

一种更好的方法是将观察结果分成有意义的子集——内部兼容的统计机制……如果不能做到这一点,那么统计分析就无法完成。一名研究人员声称,除了大而混乱的回归是可能的,因为毕竟必须产生一些结果,就像陪审团说:“嗯,证据很弱,但必须有人被定罪。”

克里斯托弗·H·阿亨

厨房水槽计量经济学模型通常是研究人员试图控制混杂因素的结果。但他们通常没有意识到,混杂问题需要因果解决方案,而不是统计“控制”。控制一切会带来我们控制“碰撞”变量的风险,从而创建“后门路径”,这给我们带来了本来就不存在的混杂。

埃兹拉·克莱因