统计和因果关系

对于大多数人来说,统计推理显然是自相矛盾的。以著名的辛普森悖论为例。从理论角度来看,辛普森悖论重要地表明,因果关系永远不能简化为统计或概率问题,除非你奇迹般地能够保持影响结果概率的所有其他因素不变[...]

来源:Lars P Syll

统计和因果关系

在统计101中,每个学生都学会高喊“相关性不是因果性”。有充分的理由!公鸡的啼鸣与日出高度相关;但它并没有导致日出。

不幸的是,统计数据迷恋了这种常识性观察。它告诉我们相关性不是因果关系,但它没有告诉我们什么是因果关系。你在统计教科书的索引中搜索有关“原因”的条目是徒劳的。学生不得说 X 是 Y 的原因——只能说 X 和 Y 是“相关的”或“相关的”。

对于大多数人来说,统计推理显然是自相矛盾的。

以著名的辛普森悖论为例。

从理论角度来看,辛普森悖论重要地表明,因果关系永远不能简化为统计或概率问题,除非你能够奇迹般地保持影响研究结果概率的所有其他因素不变。

要理解因果关系,我们总是必须将其与特定的因果结构联系起来。统计相关性是远远不够的。没有结构,没有因果关系。

统计和计量经济学模式不应被视为除了可能遵循的线索之外的任何东西。在可观察数据的背后,有真实的结构和机制在运行,如果我们真的想理解、解释和(可能)预测现实世界中的事物,掌握这些东西比简单地关联和回归可观察变量更重要。

统计数据无法确定事实的真值。从来没有。永远不会。