Loading...
机构名称:
¥ 2.0

想象一下,一位心怀不轨的经济学研究人员,他只对一项实验的统计显著性结果感兴趣。这位研究人员可以检查 100 个不同的变量,而事实是实验没有影响。按照构造,研究人员应该发现其中五个变量在实验组和对照组之间平均存在 5% 的统计显著差异——毕竟,5% 显著性的确切定义意味着,对于两组之间没有差异的零假设,错误拒绝率为 5%。这位心怀不轨的研究人员只对这项实验有影响感兴趣,因此选择只报告通过统计显著性阈值的五个变量的结果。如果研究人员对结果的某个特定迹象感兴趣——即显示该程序“有效”或“无效”——平均而言,这些结果中有一半会朝着研究人员想要的方向发展。因此,如果研究人员可以丢弃或不报告所有与他期望的结果不一致的变量,那么即使实验实际上没有效果,研究人员也几乎可以保证获得一些积极且具有统计意义的结果。这当然是众所周知的“数据挖掘”问题。如果研究人员可以选择要报告哪些结果,那么很容易看出结果是如何被操纵的。例如,Casey、Glennerster 和 Miguel (2012) 在现实世界的经济学背景下展示了具有相反议程的研究人员如何通过挑选具有统计意义的正或负结果,假设将两组相反但连贯的结果串联在一起。

预先分析计划的优点和缺点

预先分析计划的优点和缺点PDF文件第1页

预先分析计划的优点和缺点PDF文件第2页

预先分析计划的优点和缺点PDF文件第3页

预先分析计划的优点和缺点PDF文件第4页

预先分析计划的优点和缺点PDF文件第5页