使用 Python 代码进行矩估计法

假设您在客户服务中心,并且想要知道每分钟呼叫次数的概率分布,或者换句话说,您想要回答这个问题:每分钟接到零个、一个、两个……等呼叫的概率是多少?您需要此分布才能 […] 使用 Python 代码进行矩估计法的帖子首先出现在 Towards Data Science 上。

来源:走向数据科学

假设您在客户服务中心,并且想要了解每分钟呼叫数量的概率分布,或者换句话说,您想要回答这个问题:每分钟接到零个、一个、两个……等呼叫的概率是多少?您需要此分布来预测接到不同呼叫数量的概率,并据此计划需要多少员工、是否需要扩展等。

为了让我们的决策“以数据为依据”,我们首先收集数据,然后尝试推断此分布,或者换句话说,我们希望从样本数据推广到看不见的数据,在统计术语中也称为总体。这就是统计推断的本质。​​

从收集的数据中,我们可以计算出每分钟呼叫每个值的相对频率。例如,如果收集到的随时间变化的数据如下所示:2、2、3、5、4、5、5、3、6、3、4、……等。此数据是通过计算每分钟接到的电话数量获得的。为了计算每个值的相对频率,您可以计算每个值的出现次数除以总出现次数。这样,​​您将得到下图中灰色曲线之类的数据,它相当于本例中数据的直方图。

作者生成的图像
作者生成的图像
作者生成的图像
作者生成的图像

在此特定示例中,假设平均值 λ = 5 的泊松分布已生成如下图蓝色曲线所示的数据。换句话说,我们在此假设我们知道 λ 的真实值,而这个值通常是未知的,需要根据数据进行估算。

作者生成的图像
作者生成的图像

在进一步探讨如何找到这个参数 λ 之前,让我们先展示一些用于生成上图的 Python 代码。

Python import as import