坚强地识别面孔的能力对于我们作为社会生物的成功至关重要。然而,我们仍然对允许某些人在面部识别方面表现出色的大脑机制知之甚少。这项研究建立在一个相当大的神经数据集的基础上,该数据集测量了具有非凡的面部识别能力的人的大脑活动(super-coppenters),以应对这一挑战。使用最先进的计算方法,我们从仅仅一秒钟的大脑活动中就显示出对单个个体中面部识别能力的强大预测,并揭示了支持个人识别能力中个体差异的特定大脑计算。这样做,我们提供了直接的经验证据,证明了人类大脑中语义计算与面部识别能力之间的关联,这是突出的面部识别模型的关键组成部分。
为什么有些人更好地识别面孔?发现支持面部识别能力的神经机制已被证明难以捉摸。为了应对这一挑战,我们使用了一种多模式数据驱动的方法,该方法结合了神经影像,计算建模和行为测试。我们记录了具有非凡的面部识别能力的个体的高密度脑电图脑活动 - 超级识别器 - 以及典型的识别剂,以应对各种视觉刺激。使用多元模式分析,我们从1 s的大脑活动中解码了面部识别能力,精度最高为80%。为了更好地理解该解码的机制,我们将参与者的大脑中的表示形式与人工神经网络模型的视觉和语义模型以及参与人类形状和含义相似性的判断的人进行了比较。与典型的识别者相比,我们发现超级识别器的早期大脑表示与视觉模型的中级表示以及形状相似性判断之间的相关性更强。此外,我们发现超级识别器的晚期大脑表示与人工语义模型的表示之间以及含义相似性判断之间的更强关联。总体而言,这些结果表明,大脑处理中的重要个体变化,包括神经计算扩展到纯粹的视觉过程,支持面部识别能力的差异。他们为语义计算与面部识别能力之间的关联提供了第一个经验证据。我们认为,这种多模式数据驱动的方法可能会在进一步揭示人脑中特质识别的复杂性方面发挥关键作用。
为什么有些人更擅长识别人脸?揭示支持人脸识别能力的神经机制一直难以捉摸。为了应对这一挑战,我们使用了一种多模态数据驱动的方法,结合了神经成像、计算建模和行为测试。我们记录了具有非凡人脸识别能力的个体(超级识别者)和典型识别者对各种视觉刺激的高密度脑电图活动。使用多元模式分析,我们从 1 秒的大脑活动中解码了人脸识别能力,准确率高达 80%。为了更好地理解这种解码的机制,我们将参与者大脑中的表征与视觉和语义的人工神经网络模型中的表征以及与人类对形状和含义相似性判断有关的表征进行了比较。与典型识别者相比,我们发现超级识别者的早期大脑表征与视觉模型以及形状相似性判断的中级表征之间存在更强的关联。此外,我们发现超级识别者的晚期大脑表征与人工语义模型表征以及意义相似性判断之间存在更强的关联。总体而言,这些结果表明,大脑处理过程中的重要个体差异(包括超越纯视觉过程的神经计算)支持了人脸识别能力的差异。它们为语义计算与人脸识别能力之间的关联提供了第一个经验证据。我们相信,这种多模态数据驱动的方法很可能在进一步揭示人类大脑中特殊人脸识别的复杂性方面发挥关键作用。
•用户可以自由分发用于标识此出版物的 URL。 •用户可以从伯明翰大学研究门户下载和/或打印一份出版物,用于私人学习或非商业研究。 •用户可以按照 1988 年《版权、设计和专利法》中“公平交易”的概念使用文档摘录(?) •用户不得进一步分发材料或将其用于商业收益目的。
我们发现国土安全部没有最新的战略计划来管理整个部门的生物识别能力。国土安全部发布了涵盖 2015-2025 年的生物识别战略框架,以解决生物识别能力差距并促进整个国土安全部的生物识别使用。尽管战略、政策和计划办公室 (PLCY) 现在打算这样做,但自 8 年前发布以来,该办公室一直没有更新这一战略框架。我们发现战略框架并未准确反映整个部门的生物识别现状,例如面部识别验证和身份识别的使用。此外,PLCY 尚未实施全部门政策来一致收集和使用生物识别信息。最后,国土安全部没有过渡计划来将美国海关和边境保护局的生物识别出入境系统与生物识别身份管理办公室的国土高级识别技术系统整合在一起进行生物识别匹配。PLCY 已采取措施确保国土安全部的生物识别能力需求与全部门的生物识别战略计划保持一致。然而,如果没有更新的战略计划和全部门一致收集和使用生物特征信息的政策,国土安全部可能无法确保已确定的计划生物特征能力需求与国土安全部的战略举措保持一致,并且可能错失加强生物特征实践和政策以支持其使命的机会。国土安全部的回应国土安全部同意所有四项建议。
目前最先进的物体识别算法——深度卷积神经网络 (DCNN),灵感来自哺乳动物视觉系统的架构,在许多任务上能够达到人类水平的表现。在对 DCNN 进行物体识别任务训练时,已证明 DCNN 能够开发出与哺乳动物视觉系统中观察到的隐藏表征相似的隐藏表征 (Razavi 和 Kriegeskorte,2014 年;Yamins 和 Dicarlo,2016 年;Gu 和 van Gerven,2015 年;Mcclure 和 Kriegeskorte,2016 年)。此外,在物体识别任务上训练的 DCNN 是目前我们拥有的哺乳动物视觉系统的最佳模型之一。这让我们假设,教导 DCNN 实现更像大脑的表征可以提高其性能。为了测试这一点,我们在一个复合任务上训练了 DCNN,其中网络被训练为:(a) 对物体图像进行分类;同时 (b) 具有与猴子视觉皮层神经记录中观察到的中间表征相似的中间表征。与纯粹为对象分类而训练的 DCNN 相比,在复合任务上训练的 DCNN 具有更好的对象识别性能,并且对标签损坏的鲁棒性更强。有趣的是,我们发现这个过程不需要神经数据,但具有与神经数据相同统计特性的随机数据也会提高性能。虽然我们在复合任务上训练时观察到的性能提升与“纯”对象识别任务相比并不大,但它们非常稳健。值得注意的是,我们在研究的所有网络变体中都观察到了这些性能提升,包括:较小(CORNet-Z)与较大(VGG-16)架构;优化器的变化(Adam 与梯度下降);激活函数的变化(ReLU 与 ELU);以及网络初始化的变化。我们的结果证明了一种训练对象识别网络的新方法的潜在效用,使用大脑(或至少是其激活模式的统计特性)作为训练 DCNN 的教师信号的策略。© 2020 Elsevier Ltd. 保留所有权利。
WTMD 的金属识别规范应要求 WTMD 对适当的物体发出警报,而不是对无害物体发出警报。一旦检测性能已针对特定安全标准进行了验证,就应通过在真实环境中测试 WTMD 来评估识别能力。根据正在评估的安全标准,可能需要适当的剥离程序。为了评估识别能力,应计算通过 WTMD 的人数的警报/总通过率。本次统计调查所需的人数应至少为一千人。
WTMD 的金属识别规范应要求 WTMD 对适当的物体发出警报,而不是对无害物体发出警报。一旦检测性能已针对特定安全标准得到验证,就应通过在真实环境中测试 WTMD 来评估识别能力。根据正在评估的安全标准,可能需要适当的剥离程序。为了评估识别能力,应计算通过 WTMD 的人数的警报/总通过率。本次统计调查所需的人数应至少为一千人。
字母的生成依赖于运动和视觉反馈之间的紧密结合——字母的每一个笔画在生成时都会被视觉体验到。字母生成的经验会增加视觉和运动大脑系统之间的功能连接(神经通讯的一种衡量标准),并提高识字前儿童的字母识别能力。我们假设,在生成过程中,书写形式的运动和视觉体验之间的偶然性会产生这两种效果。20 名识字成年人在一周内接受了四组新符号的训练。每个符号集都通过四种训练条件之一进行训练:用墨水绘画、不用墨水绘画、观察手写符号展开,就像被画出来一样,以及观察静态手写符号。在用墨水绘画的条件下,运动和视觉体验的偶然性发生了。通过控制视觉或运动体验,在其他三种条件下,运动和视觉体验都变得非偶然。在三个时间点的 fMRI 扫描中,参与者会看到经过训练的符号:一个是训练前,一个是训练后,一个是一周的无训练延迟后。每次训练后和第三次扫描后都会测试识别能力。我们发现,在产生过程中,视觉和运动体验之间的偶然性改变了视觉、运动和听觉神经群落之间的功能连接模式,导致训练后的识别能力优于训练前。在无训练延迟后,识别能力得到维持,但训练后立即观察到的功能连接恢复到训练前的基线。我们的结果表明,将感觉和运动系统结合在一起的行为会导致感知过程中神经通讯的暂时变化,而这种变化可能不会直接支持识别的变化。
成年后,人类从稀疏的视觉显示中迅速识别物体,并在其外观上遇到重大干扰。实现强大的识别能力所需的最小条件是什么?这些能力何时会发展?要回答这些问题,我们研究了儿童对象识别能力的上限。我们发现,在稀疏且干扰的观看条件下,以100 ms(前向和向后掩盖的速度)成功地识别了3岁的儿童。相比之下,具有生物学知情属性或为视觉识别进行优化的范围计算模型未达到儿童级表现。模型只有与儿童能够体验更多的对象示例相匹配的。这些发现在没有丰富经验的情况下突出了人类视觉系统的鲁棒性,并确定了建造生物学上合理的机器的重要发育限制。