详细内容或原文请订阅后点击阅览
狄利克雷过程混合模型
这篇博文是关于使用狄利克雷过程混合模型进行聚类的系列文章的第四部分。在之前的文章中,我们讨论了有限狄利克雷混合模型,我们将其模型的极限用于无限 k 个聚类,这导致我们引入了狄利克雷过程。正如我们所见,我们的目标是 [...]
来源:DatumBox - 机器学习、统计和软件开发博客这篇博文是使用狄利克雷过程混合模型进行聚类系列的第四部分。在之前的文章中,我们讨论了有限狄利克雷混合模型,并对其模型的极限取为无限 k 个聚类,这引出了狄利克雷过程。如我们所见,我们的目标是构建一个混合模型,它不需要我们从一开始就指定 k 个聚类/组件的数量。在介绍了狄利克雷过程的不同表示之后,现在是时候实际使用 DP 来构建一个使我们能够执行聚类的无限混合模型了。本文的目标是定义狄利克雷过程混合模型,并讨论中餐馆过程和吉布斯抽样的使用。如果您还没有阅读过之前的文章,强烈建议您阅读,因为这个主题有点理论性,需要对模型的构建有很好的理解。
使用狄利克雷过程混合模型进行聚类 呈现狄利克雷过程的不同表示更新:Datumbox 机器学习框架现已开源并可免费下载。查看 com.datumbox.framework.machinelearning.clustering 包以查看狄利克雷过程混合模型在 Java 中的实现。
更新:Datumbox 机器学习框架现已开源并可免费下载。查看 com.datumbox.framework.machinelearning.clustering 包以查看狄利克雷过程混合模型在 Java 中的实现。 下载1. 狄利克雷过程混合模型的定义
使用狄利克雷过程使我们能够拥有具有无限组件的混合模型,可以将其视为将有限模型的极限 k 取为无穷大。假设我们有以下模型:
公式 1:狄利克雷过程混合模型
i i i图 1:狄利克雷过程混合模型的图形模型
0 信念强度 0 0 i i i i i i i i 0 以指数方式增加 k 个分量 i i i i i i i 方程 2:带有 CRP 的混合模型i
i i 0 i i j i j j