Loading...
机构名称:
¥ 4.0

线性高斯探索性工具(例如主成分分析 (PCA) 和因子分析 (FA))广泛用于探索性分析、预处理、数据可视化和相关任务。由于线性高斯假设具有限制性,因此对于非常高维的问题,它们已被稳健、稀疏扩展或更灵活的离散-连续潜在特征模型所取代。离散-连续潜在特征模型指定依赖于数据子集的特征词典,然后推断每个数据点共享这些特征的可能性。这通常是使用关于特征分配过程的“富者得富”假设来实现的,其中词典试图将特征频率与其解释的总方差部分结合起来。在这项工作中,我们提出了一种替代方法,可以更好地控制特征到数据点的分配。这种新方法基于双参数离散分布模型,该模型将特征稀疏性和词典大小分离,从而以简约的方式捕获常见和罕见特征。新框架用于推导一种新型自适应因子分析变体 (aFA) 以及自适应概率主成分分析 (aPPCA),能够在各种场景中灵活地发现结构和降低维度。我们推导出标准吉布斯采样以及有效的期望最大化推理近似,这些近似以更快的数量级收敛到合理的点估计解。所提出的 aPPCA 和 aFA 模型的实用性在特征学习、数据可视化和数据白化等标准任务上得到了证明。我们表明,aPPCA 和 aFA 可以为原始 MNIST 或 COLI-20 图像提取可解释的高级特征,或者在应用于自动编码器分析时

用于分段线性降维的自适应潜在特征共享

用于分段线性降维的自适应潜在特征共享PDF文件第1页

用于分段线性降维的自适应潜在特征共享PDF文件第2页

用于分段线性降维的自适应潜在特征共享PDF文件第3页

用于分段线性降维的自适应潜在特征共享PDF文件第4页

用于分段线性降维的自适应潜在特征共享PDF文件第5页

相关文件推荐