概率机器学习的最新进展已导致单纯形上的新分布家族。这种分布称为连续的分类,与Dirichlet具有相似之处,因为它定义了一个特别简单的封闭形式密度的指数族。然而,与Dirichlet(或任何基于对数的方法)不同,即使在零价值的组件存在下,连续的分类对数 - 样品函数也可以很好地定义,这使得此分布成为零元素组成数据的有效可能性模型,而无需归因于Zeros的插入。在此摘要中,我们回顾了我们的新颖分布的关键特性,并提出了一种应用,可以将其用于降低组成数据的尺寸。我们还突出了机器学习领域与组成数据分析之间的一些未置换的连接,我们的新颖分布密切相关。
主要关键词