概率密度函数:已知的未知

在大多数统计问题中,从一开始就可以直接获得的最重要的事情是了解数据的概率分布函数(PDF)是什么。如果您完全知道这是可能的,但在实践中很少实现 - 您处于统计天堂:您可以使用最大似然方法进行参数估计,并且您可以对整个问题了解很多。阅读更多

来源:Science 2.0

在大多数统计问题中,从一开始就可以直接获得的最重要的事情是了解数据的概率分布函数(PDF)是什么。如果您完全知道这是可能的,但在实践中很少实现 - 您处于统计天堂:您可以使用最大似然方法进行参数估计,并且您可以对整个问题了解很多。

大多数情况下,您只有PDF的外观只有一个直觉:您知道它具有一些一般属性,例如渐近人和位置(您的数据样本可以轻松提供的平均值);在大多数情况下,您还可以估计其差异。但是您可能在某些细节上是错误的;而且它们可以非常善良,就好像您将PDF的属性误认为您的全部推断可能会偏见,甚至完全搞砸了。

但是

什么是pdf

到底?它是一个或多个随机变量x的函数f(x),您可以测量。 f(x)也可能取决于一些未知参数,在这种情况下,我们将其写为f(x; theta),其中theta被理解为可能改变函数形状的参数的向量。在许多统计问题(即参数估计问题)中,游戏的名称是从一堆数据,x值的样本中估算theta值,以{x}的形式估算。

为了成为概率密度函数,我们的f(x; theta)必须在可观察到的x的所有空间上具有不可或缺的组成部分,才能等于1.0:换句话说,它必须是归一化的,因为毕竟是概率的,并且Kolmogorov在1937年解释了,才能在1937年解释,才能使您需要超过1.0超过1.0的空间。

此外,PDF被理解为X的函数,其中theta值是固定的 - 但在大多数情况下,您不知道后者!如果您知道PDF并且知道参数,那么您就会知道所有内容:您可以计算观察到一些数据x的确切可能性。

功能形式 我们可以