脑成像研究越来越多地采用监督机器学习对单一受试者疾病进行分类。然而,这些算法的成功可能取决于人口多样性,包括人口统计学差异和其他可能超出主要科学兴趣的因素。在这里,我们利用倾向得分作为综合混杂指数来量化由于主要人口分层来源而导致的多样性。我们描述了人口异质性对两个独立临床队列的预测准确性和模式稳定性的影响:自闭症脑成像数据交换 (ABIDE,n=297) 和健康脑网络 (HBN,n=551)。在各种分析场景中,我们的结果揭示了交叉验证预测性能与多样性相互关联的程度。由于多样性而导致的提取脑模式的不稳定性优先位于默认模式网络中。我们的集体研究结果强调了现行的去混杂实践在减轻人口多样性的全部后果方面的局限性。
主要关键词