详细内容或原文请订阅后点击阅览
通过潜在变量镜头进行主成分分析 (PCA)
概述 PPCA(经典 PCA 的扩展)及其通过 EM 算法应用于不完整数据照片由 Dhruv Weaver 在 Unsplash 上拍摄。随着 EM 算法的 E 和 M 步骤重复,该算法收敛到局部最大似然估计量。概率主成分分析 (PPCA) 是一种降维技术,利用潜在变量框架恢复数据中最大方差的方向。当噪声遵循各向同性高斯分布时,概率主成分将与经典主成分紧密相关,在缩放因子和正交旋转方面相同。因此,PPCA 可用于许多与经典 PCA 相同的应用,例如数据可视化和特征提取。PPCA 背后的潜在变量框架还提供了经典 PCA 所不具备的功能。例如,PPCA 可以轻松扩展以适应具有缺失值的数据,而经典 PCA 在不完整数据上是未定义的。PPCA 可以使用多种不同的方法来实现。 Tipping 和 Bishop 在他们 1999 年的原始文章中通过 EM 算法提供了 PPCA 的实现;但是,他们没有明确说明 PPCA 的 EM 算法如何扩展到不完整数据。Towards Data Science 上的前一篇文章讨论了 PPCA 的另一种方法,该方法使用变分推理代替 EM 算法来估算缺失值并得出概率
来源:走向数据科学作者删除了这篇 Medium 故事。