我们从数据矩阵中介绍了可靠的主成分分析,其中其列的条目已被排列损坏,称为未标记的主成分分析(UPCA)。使用代数几何形状,我们确定UPCA是一个良好的代数问题,因为我们证明,与给定数据一致的唯一最小级别的矩阵是地面矩阵的行 - 渗透矩阵的行为,它是作为多项程度系统的独特溶液的唯一方程式系统而产生的。此外,我们提出了适用于仅处理数据的一小部分的UPCA的有效的两阶段算法管道。I阶段I采用异常值PCA方法来估计地面真相柱空间。配备了柱空间,II阶段应用了最新的方法,用于恢复排列的数据。允许在UPCA中排列的丢失条目导致未标记的矩阵完成的问题,为此,我们得出了类似的avor的理论和算法。关于合成数据,面部图像,教育和医疗记录的实验揭示了我们的算法对数据私有化和记录链接等应用的潜力。关键字:健壮的主成分分析,矩阵完成,记录链接,数据重新标识,代数几何
主要关键词