描述观察到的数据与其估计的潜在变量之间的关联测试。JackStraw软件包提供了一种重采样策略和测试方案,以估计观察到的数据及其潜在变量之间关联的重要性。取决于数据类型和分析目的,潜在变量可以通过主体分析(PCA),因子分析(FA),K-均值聚类以及相关的无监督学习算法来估算。jackstraw方法学习了本循环分析中固有的过度拟合特征,在该特征中,观察到的数据用于估计潜在变量,并再次用于测试估计的潜在变量。当PCA估算潜在变量时,JackStraw可以通过低维主组件(PC)估计,可观察到的变量和潜在变量之间的统计测试对观察到的变量和潜在变量之间的关联。这一范围内导致识别与PC显着相关的变量。同样,诸如K-均值聚类,围绕MEDOIDS(PAM)和OTHERS的诸如K-均值聚类和others的无关聚类,在高维数据中找到相干组。通过测试数据和群集中心之间的关联,JackStraw估计了集群成员资格的统计意义。聚集成员身份,并应用于对Single细胞RNA-Seq(SCRNA-SEQ)中细胞身份的无监督评估。
主要关键词