详细内容或原文请订阅后点击阅览
从样本到总体的概括(专家)
在检查随机实验的结果时,令我反复印象深刻的是它们与理论模型的相似程度。两者都有一个根本的局限性:它们都是在人为条件下构建的,并且在内部有效性和外部有效性之间进行权衡。控制力和人为性越大,内部效度就越高——但 [...]
来源:Lars P Syll在检查随机实验的结果时,令我反复印象深刻的是它们与理论模型的相似程度。两者都有一个根本的局限性:它们都是在人为条件下构建的,并且在内部有效性和外部有效性之间进行权衡。控制力和人为性越大,内部效度就越高,但外部效度就越低。我们越“操纵”实验或模型来消除混杂因素,它们就越不能反映现实世界“目标系统”的复杂性。最终,中心问题涉及科学家如何在各种“法则机器”中采用不同的隔离策略来揭示因果关系。
我仍然对实验方法(随机或其他方式)的普遍性持怀疑态度,因为因果机制通常因情况而异。当同质性、稳定性或不变性不存在时,我们就无法向我们寻求理解的现实社会索取合理的“出口许可证”。
如果我们将实验视为渴望告诉我们有关现实世界系统的一些信息的模型或理论测试,那么外部有效性问题就变得至关重要。例如,假设我们研究待遇 B 如何影响中国工人 (A) 的工作绩效。我们如何推断其他人群,例如美国的工人?我们如何知道复制“成功”。我们如何知道这些复制的实验结果何时可以证明在原始群体样本中做出的推论是合理的?例如,如果 P(A|B) 是原始样本的条件密度函数,并且我们有兴趣对 E [P(A|B)] 进行外推预测,那么我们如何知道新样本的密度函数与原始样本的密度函数相同?除非我们能够提供令人信服的论据,否则基于 P(A|B) 的推论不一定能告诉我们有关目标系统 P'(A|B) 的任何信息。
B 一个 X Y