混杂因素和因果关系的本质

关于混杂的本质及其在观察研究中的处理方式的争论是由与 Donald Rubin 和 Judea Pearl 相关的两个有影响力的方法论传统形成的。尽管这两个框架都旨在阐明如何从非实验数据中识别因果效应,但它们以不同的方式概念化混杂因素,并强调不同的分析策略。第三个 [...]

来源:Lars P Syll

混杂因素和因果关系的本质

关于混杂因素的性质及其在观察研究中的处理方法的争论是由与 Donald Rubin 和 Judea Pearl 相关的两个有影响力的方法论传统所影响的。尽管这两个框架都旨在阐明如何从非实验数据中识别因果效应,但它们以不同的方式概念化混杂因素并强调不同的分析策略。第三种观点,由桑德·格陵兰(Sander Greenland)最突出地阐述,选择性地利用了这两种方法,同时强调有关数据生成过程的实质性假设的核心作用以及正式统计调整的固有局限性(Greenland,Robins&Pearl 1999;Greenland,Pearl&Robins 1999)。

在潜在结果框架(通常称为“内曼-鲁宾因果模型”)中,因果效应被定义为替代治疗条件下潜在结果之间的对比(Rubin 1974;Rubin 2005;Imbens & Rubin 2015)。对于每个观察单元,存在与不同治疗状态相对应的多种潜在结果,但仅观察到其中一种结果。因此,因果推理的根本问题源于无法观察同一单位的事实和反事实结果。

这种以设计为导向的观点激发了一系列旨在近似随机实验条件的经验技术。倾向评分匹配、分层、逆概率加权和其他平衡程序等方法试图构建在观察到的特征方面具有可比性的治疗组和对照组(Rosenbaum & Rubin 1983)。重要的是,这些过程不需要明确说明协变量本身之间的因果关系;相反,目标是实现治疗和潜在结果之间的条件独立。

参考文献