狄利克雷过程、中餐馆过程和其他表示

本文是关于使用狄利克雷过程混合模型进行聚类的系列文章的第三部分。上一次我们根据狄利克雷分布定义了有限混合模型,并提出了如何使这个特定模型无限的问题。我们简要讨论了在 […]

来源:DatumBox - 机器学习、统计和软件开发博客

本文是使用狄利克雷过程混合模型进行聚类的系列文章的第三部分。上一次我们根据狄利克雷分布定义了有限混合模型,并提出了如何使这个特定模型无限的问题。我们简要讨论了当 k 个聚类数趋于无穷大时取模型极限的想法,但正如我们强调的那样,这种对象的存在并不简单(换句话说,我们如何真正“取模型的极限”?)。提醒一下,我们之所以要使 k 无限大,是因为这样我们将有一个非参数模型,它不需要我们预先定义数据中的聚类总数。

更新:Datumbox 机器学习框架现在是开源的,可以免费下载。查看包 com.datumbox.framework.machinelearning.clustering 以查看狄利克雷过程混合模型在 Java 中的实现。

更新:Datumbox 机器学习框架现已开源,可免费下载。查看包 com.datumbox.framework.machinelearning.clustering 以查看狄利克雷过程混合模型在 Java 中的实现。 下载

尽管我们的目标是构建一个能够对数据集执行聚类的模型,但在此之前我们必须讨论狄利克雷过程。我们将提供严格的数学定义和更直观的 DP 解释,并讨论构建该过程的方法。这些构造/表示可以看作是在“现实生活”中查找狄利克雷过程发生的一种方式。

1. 狄利克雷过程的定义

从中得出的是离散分布 概率测度 1 n

图 1:有限分区上的边缘服从狄利克雷分布。

0 0 直观的方式 1 n 0 0

图 2:狄利克雷过程的图形模型

DP 的图形模型 0 i

2. 后验狄利克雷过程

Ferguson 1 n

方程 1:后验狄利克雷过程

3. 狄利克雷过程表示

构造和表示 Ferguson Aldous 1 2