详细内容或原文请订阅后点击阅览
Gamma 障碍分布
哪个结果重要?这是一个常见的场景:进行了 A/B 测试,其中为活动选择了随机单位样本(例如客户),并为他们提供了处理 A。选择了另一个样本以接受处理 B。“A”可能是沟通或要约,“B”可能是没有沟通或没有 […]The post The Gamma Hurdle Distribution appeared first on Towards Data Science.
来源:走向数据科学哪个结果重要?
哪个结果重要?以下是一个常见场景:进行了 A/B 测试,为活动随机选择了一组单位(例如客户)样本,并为他们提供了处理 A。选择了另一个样本来接受处理 B。“A”可以是沟通或优惠,“B”可以是无沟通或无优惠。“A”可以是 10% 的折扣,“B”可以是 20% 的折扣。两个组,两种不同的处理,其中 A 和 B 是两种离散处理,但不失一般性,可以超过 2 种处理和连续处理。
因此,活动开始,结果可用。通过我们的后端系统,我们可以跟踪这些单位中的哪些采取了感兴趣的行动(例如进行了购买),哪些没有。此外,对于那些采取了行动的单位,我们会记录该行动的强度。一个常见的场景是,我们可以跟踪购买者的购买金额。这通常被称为平均订单金额或每位买家收入指标。或者有一百个不同的名称,但都意味着同一件事——对于那些购买的人来说,他们平均花了多少钱?
对于某些用例,营销人员对前一个指标感兴趣——购买率。例如,在我们的收购活动中,我们是否通过方案 A 或 B 吸引了更多(可能是首次)买家?有时,我们有兴趣提高每位买家的收入,因此我们强调后者。
但更多时候,我们感兴趣的是以具有成本效益的方式增加收入,我们真正关心的是整个活动产生的收入。方案 A 还是 B 带来了更多收入?我们并不总是有平衡的样本量(可能是由于成本或风险规避),因此我们将测量的收入除以每组中接受治疗的候选人数量(将这些计数称为 N_A 和 N_B)。我们想要比较两组之间的这个指标,因此标准对比很简单:
总体不确定?
不确定?示例数据集
示例数据集 治疗 已治疗Gamma Hurdle
问题