基于大型队列的功能性 MRI 数据预测特征表型的努力因预测准确度低和/或效应量小而受到阻碍。尽管这些发现具有高度可复制性,但考虑到神经质和智力流体等表型特征的假定大脑基础,较小的效应量有些令人惊讶。我们旨在复制以前的工作,并另外测试多种数据操作,通过解决数据污染挑战来提高预测准确性。具体来说,我们添加了额外的 fMRI 特征,在多个测量中对目标表型取平均值以获得更准确的潜在特征估计,通过对多数分数进行欠采样来平衡目标表型的分布,并确定数据驱动的亚型以研究参与者间异质性的影响。我们的结果在更大的样本中复制了 Dadi 等人 (2021) 的先前结果。每次数据操作都会进一步导致预测准确性的小幅但一致的改进,当结合多种数据操作时,这些改进在很大程度上是累加的。与之前的研究相比,结合数据处理(即扩展的 fMRI 特征、平均目标表型、平衡目标表型分布)可使流体智力的预测准确度提高三倍。这些发现凸显了几种相对简单且低成本的数据处理的好处,这可能会对未来的工作产生积极影响。
主要关键词