全脑关联研究 (BWAS) 将个体的表型特征差异与大脑结构和功能的测量结果关联起来,在过去 30 年中已成为连接心智和大脑的主要方法。单变量 BWAS 通常分别测试数万到数十万个大脑体素,而多变量 BWAS 则将跨大脑区域的信号整合到预测模型中。单变量 BWAS 存在许多问题,包括缺乏能力和可靠性,以及无法解释分布式神经回路中嵌入的模式级信息 1–4 。多变量预测模型解决了许多这些问题,并为提供基于大脑的行为和临床状态及特征测量提供了巨大希望 2,3 。在他们最近的论文 4 中,Marek 等人在三个大型神经影像数据集中评估了样本量对单变量和多变量 BWAS 的影响,并得出“BWAS 的可重复性需要数千个个体的样本”的总体结论。我们赞赏他们的全面分析,并且我们同意:(1) 进行单变量 BWAS 时需要大量样本,(2) 多变量 BWAS 会显示出更大的效应,因此更有说服力。Marek 等人 4 发现,多变量 BWAS 提供的样本内关联被夸大了,除非纳入数千名参与者,否则通常无法复制(即没有说服力)。这意味着发现样本的效应大小估计必然被夸大了。然而,我们区分了效应大小估计方法(样本内与交叉验证)和样本(发现与复制),并表明,通过适当的交叉验证,Marek 等人 4 在发现样本中报告的样本内膨胀可以完全消除。通过额外的分析,我们证明,在某些情况下,高质量数据集中的多变量 BWAS 效应可以用小得多的样本量复制。具体而言,将标准多元预测算法应用于人类连接组计划中的功能连接,在 6 种表型中的 5 种测试样本量为 75-500 的情况下产生了可复制的效果(图 1)。这些分析仅限于相对高质量数据集中选定的表型数量(使用单个扫描仪在年轻成年人群中测量),不应过度概括。然而,他们强调,样本量要求的关键决定因素是大脑-表型关系的真实效应大小,并且通过适当的内部验证,可以对中等规模的研究进行适当的效应大小估计和足够大的效应。Marek 等人 4 通过在“发现样本”中训练各种多元模型来评估多元 BWAS 中的样本内效应大小膨胀
图 1. 功效计算和重复率的实证分析。图 a 显示了统计功效与样本量和显著性阈值(1,000 次迭代)的关系。实线表示基于 ENIGMA 7 精神分裂症效应量(患者和对照组之间的皮质厚度组间差异)的功效计算;为了进行比较,虚线表示 Marek 等人报告的功效计算。3(源数据图 3 取自原始文章)。水平虚线对应于 80% 统计功效的领域标准。模拟表明,对于 P <10 -4 的 BWAS,550 个病例和 550 个对照的样本量达到 80% 的统计功效;对于 P <10 -3 的 BWAS,450 个样本达到 80% 的功效。图 b 显示了精神分裂症实证数据的重复率(橙色实线)与样本量的关系(在 114 个区域进行 BWAS,根据 P <0.05 Bonferroni 测试;1,000 次迭代;线周围的彩色区域表示迭代间平均值的上下一个标准差)。橙色虚线表示外推数据(参见补充方法)。实证分析表明,需要大约 400 名患者和 400 名对照的样本量才能检测到重复率为 80% 的效果。蓝色实线显示阿尔茨海默病实证数据的重复率(蓝色实线)。样本量是指每次分析中具有相等数量对照的病例数。
