了解过度参数化模型的成功似乎具有挑战性。部分,由于该过程的违反直觉。共同的智慧表明,在学习中,必须对问题的问题有一定的良好偏见,并且在学习时,我们需要将自己限制在不能过分贴上数据的模型类别中。这种直觉是通过经典学习模型(例如PAC LearningValiant [1984]以及回归Alon等人的理由证明的。[1997]。在这些古典模型中,甚至可以证明Vapnik和Chervonenkis [2015],Blumer等。[1989],学习需要比学习类别的能力更多的示例,并且避免插值对于概括是必要的。这些结果是在与分布无关的设置中获得的,其中人们假定数据上的最差分布。
经典学习理论中的一个重要研究方向是使用复杂性度量来表征函数类的表达能力。这种复杂性界限反过来又可用于限制学习所需的训练数据的大小。其中最突出的是 Vapnik 和 Chervonenkis (1971) 引入的 Vapnik-Chervonenkis (VC) 维度。其他众所周知的度量包括 Pollard (1984) 提出的伪维度、Alon 等人 (1997) 提出的脂肪粉碎维度、Rademacher 复杂性(参见 Bartlett 和 Mendelson 2002),以及更普遍的度量空间中的覆盖数字。表征对象表达能力的目标也以不同的形式出现在量子信息中。一个众所周知的例子是量子态断层扫描。Aaronson (2007) 将状态断层扫描的变体与经典学习任务相关联,其脂肪粉碎维度可以使用特定的函数类来限制
目前,自闭症谱系障碍的诊断主要依靠临床医生的症状和行为来判断。但这些方法要求医生具备很高的专业知识,且诊断结果容易受到医生的主观性影响。为了寻找更客观的生物标志物来识别自闭症谱系障碍,许多研究者致力于从遗传学、表观遗传学、身体代谢和神经影像学等角度寻找有效的生物标志物( Goldani et al., 2014 )。神经影像学被认为是一种很有前途的非侵入性技术,可以揭示人脑的潜在模式。利用结构磁共振成像(sMRI)、功能磁共振成像(fMRI)和正电子发射断层扫描(PET)等技术,可以将人脑建模为一个复杂的系统,各个区域执行不同的结构和功能。先前的神经影像学研究表明,在神经或精神疾病人群中,大脑的结构和功能连接都会发生交替( Mueller et al., 2013 )。在各类检查方法中,fMRI,尤其是记录血氧水平依赖性 (BOLD) 信号变化的静息状态 fMRI (rs- fMRI),已广泛用于研究阿尔茨海默病 (Qureshi et al., 2019b)、精神分裂症 (Yan et al., 2019) 和 ASD (Abraham et al., 2017) 等精神疾病。功能性磁共振成像数据以高维 (∼ 100 万) 的 4 维矩阵格式组织,包含空间和时间信息。这使得直接利用原始数据作为分类算法的输入成为一项艰巨的任务。为了解决数据的高维性,已经提出了许多降维技术 (Abdi and Williams, 2010; Suk et al., 2015; Soussia and Rekik, 2018)。一些人没有使用原始 fMRI 数据,而是提出了脑功能网络分析来描述感兴趣区域 (ROI) 之间的“关系”。基于脑血流会刷新脑各区域的神经活动这一事实,对功能连接 (FC) 进行建模有助于理解精神障碍的神经基础 (Lindquist, 2008)。最常用的 FC 模型是 Pearson 相关性,可以使用两个脑区之间的 BOLD 信号来计算。脑功能网络 (BFN) 是根据图谱预先定义的所有位置的 FC 强度构建的。BFN 构建方法明确将维数从 4 维降低为 1 维向量。许多机器学习 (ML) 方法已成功用于与 ASD 相关的改变的 BFN 的自动分类 (Uddin 等人,2013;Abraham 等人,2017)。一些方法采用稀疏方法,通过在损失函数中添加额外的稀疏正则化项(例如,Lasso(Tibshirani,1996)或Elastic Net(Zou and Hastie,2005))来实现隐式降维。然而,常用来描述 ROI 之间 FC 的相关性仅捕捉线性关系,不适合表征高阶或非线性特征(Shojaee et al., 2019)。此外,将数据折叠成特征向量(向量化)会丢弃脑区的空间信息(Kong et al., 2019)。此外,传统的分类算法,如支持向量机(SVM)(Cortes and Vapnik, 1995)、随机森林(Liaw and Wiener, 2002)和朴素贝叶斯(Rish, 2001)属于浅层分类