社会影响的迭代 A/B 测试:严格、快速、定期(博客)

组织如何缩小衡量与实施之间的差距

来源:斯坦福社会创新评论(SSIR)

低收入和中等收入国家的许多非营利组织面临严重的不匹配:紧迫的社会问题需要快速迭代项目,但组织往往要等待数年才能获得外部评估结果。当他们确实进行严格的评估时,这些通常是一次性的研究,很少跟上不断变化的实施环境或为实时决策提供信息。

许多实施者都熟悉问题紧迫性和证据生成速度之间的紧张关系。在我们的组织“Youth Impact”在博茨瓦纳针对艾滋病毒和青少年怀孕预防计划进行了初步随机对照试验 (RCT) 后,我们面临着与政府扩大规模相关的新问题。随机对照试验表明,同伴教育者有效地改变了青少年的危险行为,而公立学校教师等其他信息传递者则没有,但政府合作伙伴需要有关成本效益、实施变化和项目调整的持续答案。评估周期之间的等待数年意味着错过了影响项目设计和随之而来的政府改革的窗口。

我们需要一种既能保持严格标准又能以实施速度运行的方法。科技行业提供了一个模型:仅微软每年就进行大约10万次A/B测试,以不断优化产品。一项著名的 Gmail 实验测试了不同的广告链接颜色,每年为 Google 带来 2 亿美元的收入,并表明经过严格测试的微小变化可以产生巨大的影响。

您喜欢这篇文章吗?订阅后,您可以阅读更多类似内容,以及 SSIR 的完整内容存档。

缩小证据生成与实施速度之间的差距

在 Youth Impact,我们已从 2014 年运行一项 RCT 发展到截至 2025 年累计运行 75 多项随机测试(RCT 和 A/B 测试),并且这个数字还在继续增长。我们已经确定了三个核心原则,使 A/B 测试非常适合实施需求,即我们所说的“三个 R”。